
1) 【一句话结论】
针对机场航班调度系统7×24不间断运行需求,采用异地多活热备份架构,通过实时数据同步与快速故障切换,实现RTO(恢复时间目标)≤5分钟、RPO(恢复点目标)≤1分钟,确保系统故障时业务无缝切换。
2) 【原理/概念讲解】
容灾备份的核心是“故障检测+快速切换+数据同步”,需明确两类关键架构:
3) 【对比与适用场景】
| 架构类型 | 定义 | 数据同步 | 故障切换时间 | RTO/RPO | 适用场景 |
|---|---|---|---|---|---|
| 热备份 | 双活数据中心,同时处理业务 | 实时同步(数据库GTID、消息队列同步) | <1分钟(切换+同步) | RTO≤5min,RPO≤1min | 高可用场景(如航空核心系统) |
| 冷备份 | 主备数据中心,主故障时备用启动 | 定时/异步同步(如数据库备份、文件同步) | 5-30分钟(启动+同步) | RTO≥30min,RPO≥分钟级 | 预算有限、非实时性要求高的场景 |
4) 【示例】
假设航班调度系统为微服务架构,主数据中心(DC1)与备用数据中心(DC2),数据库用MySQL(GTID实时同步),应用服务部署双活。
故障切换流程伪代码:
def check_health():
# 检测DC1心跳(如数据库连接、网络延迟)
if is_unhealthy():
trigger_switch()
def trigger_switch():
# 更新负载均衡器指向DC2
update_lb("DC2")
# 通知应用服务切换
notify_app("switch_to_DC2")
数据同步示例(MySQL GTID):
主DC1的写操作通过GTID同步到DC2,确保数据一致性。
5) 【面试口播版答案】
面试官您好,针对机场航班调度系统7×24不间断运行的需求,我设计的容灾方案核心是采用异地多活的热备份架构,通过实时数据同步和快速故障切换,确保RTO(恢复时间目标)低于5分钟,RPO(恢复点目标)低于1分钟。具体来说,方案分为三部分:
6) 【追问清单】
7) 【常见坑/雷区】