
1) 【一句话结论】
高并发场景下系统稳定性需通过分层负载均衡(L4+L7结合,满足低延迟与业务路由需求)、多级容灾(主备+多活结合,保障数据一致性及服务可用性)、全链路监控(实时采集关键指标并告警)构建弹性架构,核心是“请求智能分流+服务冗余+实时感知”。
2) 【原理/概念讲解】
3) 【对比与适用场景】
| 方案 | 定义 | 特性 | 使用场景 | 注意点 |
|---|---|---|---|---|
| L4负载均衡(如硬件设备) | 基于IP+端口的四层负载均衡 | 速度快(无应用层处理),延迟低 | 对延迟敏感的实时请求(如直播流传输) | 无法识别应用层信息,无法智能路由 |
| L7负载均衡(如Nginx) | 基于HTTP/HTTPS的应用层负载均衡 | 识别应用层信息(URL、Cookie),支持智能路由(如会话保持、URL转发) | 需要业务逻辑分发的场景(如不同功能模块分离服务) | 处理开销比L4大,延迟略高 |
| 主备容灾(Active-Standby) | 主节点提供服务,备节点热备 | RTO低(故障切换快),RPO高(备节点数据滞后) | 数据一致性要求不高的业务(如非实时统计) | 需持续同步数据,成本较低 |
| 多活容灾(Active-Active) | 多节点同时服务 | RTO低(故障自动切换),RPO低(数据实时同步) | 数据一致性要求高的业务(如实时判题、直播课) | 需分布式事务或数据同步,成本较高 |
4) 【示例】
假设在线竞赛直播课系统架构:
upstream配置(加权轮询):
upstream live_service {
server 10.1.1.1:80 weight=1;
server 10.1.1.2:80 weight=1;
server 10.1.1.3:80 weight=1;
}
根据权重(1:1:1)分发请求。/live/stream转发到直播流服务,/contest/judge转发到判题服务)智能路由到后端服务实例。5) 【面试口播版答案】
“面试官您好,针对在线竞赛或直播课的高并发场景,保证系统稳定性的核心是构建‘分层负载均衡+多级容灾+全链路监控’的弹性架构。首先,负载均衡采用L4+L7分层方案:前端请求先通过L4硬件负载均衡器快速分发到多个Nginx节点,Nginx再根据URL路径智能路由到对应服务(如判题、直播流),避免单点过载。然后,容灾设计采用主备+多活结合:核心服务(如判题、直播流)用多活容灾,多节点同时处理请求,故障自动切换,保障RTO低;非核心服务(如用户登录)用主备容灾,主节点故障时快速切换,降低成本。最后,全链路监控用Prometheus+Grafana采集QPS、延迟、错误率等指标,设置告警阈值(如延迟>200ms),异常时自动告警,帮助快速响应。这样,高并发下系统能弹性扩容、故障快速恢复,保证稳定性。”
6) 【追问清单】
7) 【常见坑/雷区】