
1) 【一句话结论】采用“双活架构+多级备份+自动化恢复”的容灾方案,结合每日全量+每小时增量备份策略,确保RTO≤30分钟、RPO≤1小时,实现服务器故障时系统快速恢复服务。
2) 【原理/概念讲解】容灾的核心是“故障发生时业务不中断或快速恢复”,方案需覆盖“数据备份(防数据丢失)+系统恢复(快速恢复服务)+硬件冗余(防单点故障)”三部分。
3) 【对比与适用场景】
| 备份类型 | 定义 | 特性 | 使用场景 | 注意点 |
|---|---|---|---|---|
| 全量备份 | 每次备份整个数据集 | 体积大,恢复快 | 新系统上线、重要数据首次备份 | 占用存储空间大,备份时间长 |
| 增量备份 | 只备份自上次备份以来发生变化的数据 | 体积小,备份快 | 数据变化频繁的场景(如日志、交易系统) | 恢复时需结合全量+增量,流程稍复杂 |
| 差异备份 | 备份自上次全量备份以来的所有变化 | 体积介于全量与增量之间 | 数据变化量较大但非每日全量 | 恢复时需全量+差异,效率高于全量 |
4) 【示例】
假设校园信息化平台有用户数据库(UserDB)和课程数据库(CourseDB),备份策略采用“每日全量+每小时增量”:
def fullBackup():
# 关闭数据库事务日志(假设是SQL Server)
execute("ALTER DATABASE UserDB SET RECOVERY FULL")
# 备份数据库
execute("BACKUP DATABASE UserDB TO DISK = 'D:\\Backup\\UserDB_Full_20240501.bak'")
# 同理备份CourseDB
# 重置恢复模式
execute("ALTER DATABASE UserDB SET RECOVERY SIMPLE")
def incrementalBackup():
# 备份事务日志(增量备份)
execute("BACKUP LOG UserDB TO DISK = 'D:\\Backup\\UserDB_Inc_20240501_02_00.bak'")
# 同理CourseDB
5) 【面试口播版答案】
“面试官您好,针对深圳大学校园信息化平台的容灾方案,我的核心思路是构建‘双活+多级备份’的容灾体系,确保服务器故障时系统快速恢复。首先,备份策略上采用‘每日全量+每小时增量’模式:全量备份保障数据完整性,增量备份提升备份效率,结合后RPO可控制在1小时以内。恢复流程方面,设定RTO目标为30分钟,通过自动化脚本实现故障后30分钟内恢复服务。具体来说,当主服务器故障时,备用服务器会自动接管,先恢复全量备份,再应用增量备份,最后验证数据一致性,整个过程由自动化工具监控,确保高效恢复。这样既能保证数据安全,又能快速恢复服务,满足校园信息化平台的稳定性需求。”
6) 【追问清单】
7) 【常见坑/雷区】