为了满足360服务SLA（如99.9%可用），请设计分布式存储系统的高可用架构，包括主备节点、负载均衡、故障切换机制等，并说明如何监控和预警系统状态。

360大数据开发工程师-分布式存储难度：中等

答案

1) 【一句话结论】为满足99.9%可用SLA，分布式存储系统需构建主备+多级备份（主备+冷备）的高可用架构，通过负载均衡分发请求，结合心跳检测实现故障切换，并利用监控工具实时预警，确保故障时服务快速恢复。

2) 【原理/概念讲解】主备节点：主节点处理写请求，备节点通过Raft/Paxos协议异步同步主节点数据，故障时备节点切换为主。多级备份：冷备节点定期从主备节点拉取快照+日志，存储在离线存储（如对象存储），恢复时先从快照恢复，再增量同步日志。负载均衡：如Nginx，写请求优先路由到主节点（主节点状态由健康检查维护），读请求可路由到主或备节点，提升读性能。故障切换：主节点向备节点发送心跳（如每秒一次），若超时则备节点检查数据同步状态（快照+日志是否同步完成），同步完成后切换为主，并更新负载均衡配置。监控预警：Prometheus采集节点状态、磁盘I/O延迟、网络延迟、数据同步进度等指标，Grafana可视化，当指标异常（如节点宕机、I/O延迟超阈值）时触发告警。
类比：主备节点像双引擎飞机，主引擎正常工作，备引擎同步状态，主引擎故障时备引擎立即启动；冷备像备用零件库，主备故障时从冷备恢复，保证系统持续可用。

3) 【对比与适用场景】

主备架构 vs 主从架构：

架构类型	定义	特性	使用场景	注意点
主备架构	主节点处理写，备节点同步数据，故障切换	写性能由主节点决定，读可分流	写操作少、读多（如日志存储）	备节点数据延迟，切换时读请求短暂中断
主从架构	主节点处理写，从节点同步后可读	读性能提升，写性能由主决定	写多、读多（如数据库）	从节点数据延迟，切换时读请求需路由到新主

网络分区下的故障检测机制：

机制	工作方式	优点	缺点
单路径心跳	主节点向备节点发送心跳	简单易实现	网络分区时心跳失效，导致误判
多路径交叉验证	主节点向多个备节点发送心跳，备节点间互相验证	避免网络分区导致的误判	增加检测复杂度

4) 【示例】伪代码展示故障切换及冷备恢复流程：

// 故障切换流程（主节点宕机）
主节点每秒发送心跳到备节点
备节点收到心跳后，更新时间戳

if (备节点未收到主节点心跳超过3秒) {
    // 检查数据同步状态
    if (同步完成) {
        // 切换为主节点
        备节点切换为主节点
        更新负载均衡器配置（写请求路由到新主）
        通知监控系统状态变更
    } else {
        备节点等待，继续同步
    }
}

// 冷备恢复流程（主备均故障）
冷备节点启动，从对象存储拉取快照和日志
恢复快照数据到本地
增量同步日志（从快照时间戳后开始）
验证数据一致性（如快照校验和）
切换为主节点，更新负载均衡配置

5) 【面试口播版答案】（约90秒）
“面试官您好，为了满足99.9%的SLA，分布式存储系统的高可用架构核心是采用主备+多级备份（主备+冷备）的方案。具体来说，主节点负责处理写请求，备节点通过Raft协议异步同步主节点数据，主节点定期向备节点发送心跳。当主节点因故障导致心跳超时，备节点会检查数据同步状态（快照+日志是否同步完成），同步完成后切换为主节点，并更新负载均衡器（如Nginx）的配置，将写请求路由到新主节点。同时，系统部署冷备节点，定期从主备节点拉取快照和日志存储在对象存储中，当主备均故障时，冷备节点从快照恢复数据，再增量同步日志，切换为主节点。通过Prometheus采集节点状态、磁盘I/O延迟、网络延迟等指标，Grafana可视化监控，当指标异常（如节点宕机、I/O延迟超过阈值）时触发告警，确保故障时能快速响应。这样，即使主节点或备节点故障，冷备也能保证数据恢复，满足高可用要求。”

6) 【追问清单】

问题1：数据一致性如何保证？
回答要点：通过Raft/Paxos等共识协议，确保主备数据最终一致，故障切换时同步已完成数据，避免数据丢失。
问题2：冷备恢复时间是多少？
回答要点：通常在分钟级（如5-10分钟），通过快照恢复（秒级）和增量日志同步（分钟级）实现，保证数据一致性。
问题3：如何处理网络分区导致的故障检测失效？
回答要点：采用多路径心跳（主节点向多个备节点发送心跳，备节点间互相验证），避免单路径心跳失效，确保故障检测准确。
问题4：监控哪些关键指标？
回答要点：节点状态（存活/宕机）、磁盘I/O延迟、网络延迟、数据同步进度、快照校验和等。
问题5：负载均衡的写请求如何处理？
回答要点：写请求优先路由到主节点（主节点状态由负载均衡器健康检查维护），读请求可路由到主或备节点，提升读性能。

7) 【常见坑/雷区】

坑1：忽略多级备份（主备+冷备），导致主备均故障时无法恢复。
雷区：面试官会问“主备都故障怎么办？”，若没提冷备，会被认为方案不完整。
坑2：网络分区下故障检测机制不当。
雷区：若只用单路径心跳，网络分区时心跳失效，导致备节点误判主节点正常，故障切换延迟或失败。
坑3：故障切换时间过长。
雷区：面试官会质疑“SLA要求99.9%，切换时间是否满足？”，若说切换时间长（如超过秒级），会被认为方案不可靠。
坑4：数据同步策略不当。
雷区：若只同步日志，数据延迟大；若同步快照+日志但没提增量同步，显得效率低，影响切换时间。
坑5：负载均衡策略错误。
雷区：若说读请求也只路由到主节点，导致读性能差，不符合高可用中读分流的需求，影响用户体验。