Files
ProjectAGiPrompt/37-灾备方案设计/1-灾备方案设计-prompt.md
2026-07-01 10:44:16 +08:00

4.2 KiB
Raw Permalink Blame History

你是一名精通现在k8s集群容灾备份方案的设计专家你需要面对XXX的容灾备份方案设计。

背景介绍

  1. XXX包括飞服平台、监管平台两大实际的运行平台
  2. 飞服平台和监管平台均采用k8s集群的部署方式两个平台运行环境独立
  3. 飞服平台使用如下的中间件
    1. EMQX 负责存储无人机、机库传输的数据,理论不需要容灾备份
    2. MySQL 负责存储平台所有的业务数据
    3. InfluxDB 负责存储平台的时序数据
    4. MINIO 负责无人机和机库产生的视频数据
  4. 监管平台使用如下的中间件
    1. EMQX 负责存储探测、反制设备、无人机、机库传输的数据,理论不需要容灾备份
    2. MySQL 负责存储平台所有的业务数据
    3. Doris 负责存储多源融合分析产生的时序数据,负责存储三位空间地图数据
    4. MINIO 负责保存视觉探测产生的视频和图片数据
  5. 飞服平台和监管平台采用不同的域名访问如飞服平台域名为A.com 监管平台域名为B.com

容灾备份要求

  1. 以飞服平台为例,飞服平台需要一模一样部署在电信机房,移动机房,通过域名访问飞服平台
  2. 某一机房发生故障后,其他机房应该在两小时内实现业务接管,恢复平台的正常运行
  3. 可以允许两小时的数据丢失
  4. 数据备份过程中,要保证数据不外泄

基础方案

  1. 飞服和监管平台采用相同的灾备方案
  2. 每个机房独立部署,不相互依赖
  3. 采用双中心+异地灾备的方案
  4. 数据备份采用定期备份+增量备份的方式,数据同步采用对称加密的方式传输,保证数据安全

灾备切换流程

  1. 电信机房出现故障,无法恢复,触发灾备切换流程
  2. 域名管理方 将A.com的解析IP指向移动机房的IP
  3. 用户通过A.com访问移动机房的飞服平台
  4. 平台故障恢复时间可以控制在10分钟内但是数据可能丢失2小时

日常数据容灾备份同步流程

  1. 飞服和监管平台需要备份的数据不同,当数据备份流程相同
  2. 增量备份
    1. 飞服平台需要备份的数据为
      1. MySQL --> MySQL 每2时备份一次每次备份2小时的数据通过对称加密传输
      2. MinIO --> MinIO 每2时备份一次每次备份2小时的数据通过对称加密传输
      3. InfluxDB --> InfluxDB 每2时备份一次每次备份2小时的数据通过对称加密传输
    2. 监管平台需要备份的数据为
      1. MySQL --> MySQL 每2时备份一次每次备份2小时的数据通过对称加密传输
      2. MinIO --> MinIO 每2时备份一次每次备份2小时的数据通过对称加密传输
      3. InfluxDB --> InfluxDB 每2时备份一次每次备份2小时的数据通过对称加密传输
      4. Doris --> Doris 每2时备份一次每次备份2小时的数据通过对称加密传输
    3. 增量备份数据保存3份副本
  3. 全量备份
    1. 每周日凌晨02:00对所有数据进行全量备份备份到独立的存储设备上
    2. 全量备份保存1份副本
  4. 备份及传输安全机制
    1. 增量备份应该保证业务平台的数据不丢失
    2. 备份流程应该是自动化运行的,遇到出错的情况,需要人工介入
    3. 备份数据采用对称加密的方式传输,保证核心数据不外泄
    4. 备份数据的传输需要经过一致性校验,保证数据的完整性
    5. 备份数据导入流程应该是自动化运行的,遇到出错的情况,需要人工介入

文档生成要求

  1. 需要图片的地方,请使用文字占位,使用文字详细描述图片的内容
  2. 文档应该专业,不应该口语化
  3. 文档内容应该完备,不要丢失原始设计中的内容
  4. 上述文档比较简洁,但是正式文档中应该将飞服平台和监管平台的有区别的内容分离完善
  5. 应该为后续的具体操作预留章节空白
  6. 灾备文档的一级标题、二级标题、三级标题清晰明了,有逻辑性

不要参考本机其他文件,可以联网搜索,请为我生成一份满足上述要求的灾备方案文档