灾备架构
- 主备数据中心
上海主中心 + 异地灾备中心,关键服务跨可用区部署。
- 数据实时双写
关键数据实时双写,最大限度降低数据丢失窗口。
- 定期灾备演练
按计划开展灾备切换演练并形成复盘报告。
服务水平目标(SLA)
AMT 以下列目标承诺服务连续性,具体合约 SLA 以签署文件为准。
≤ 4h
RTO 恢复时间目标
故障后恢复服务的目标时长
≤ 15min
RPO 恢复点目标
可接受的最大数据丢失窗口
≥ 99.9%
月度可用性
核心服务可用性目标
安全事件响应
- 7×24 值班
全天候安全与运维值班,确保事件被及时发现与响应。
- 分级响应 P0/P1/P2
按影响范围分级响应,明确升级路径与处理时限。
- 24h 内客户通报
确认安全事件后 24 小时内通报受影响客户并持续更新。
事件响应流程
- 1检测与告警
监控系统与人工值班共同发现异常并触发告警。
- 2分级与遏制
评估影响并定级,立即采取遏制措施限制影响范围。
- 3消除与恢复
清除根因、恢复服务并验证系统完整性。
- 4通报与复盘
通报受影响客户,完成事后复盘并落实改进项。
客户业务连续性支持
- 数据导出
客户可定期或按需导出自有数据,便于本地备份。
- 终止后数据处理
服务终止后按约定保留期保留数据,随后安全删除并出具确认。

