yuan-er

导航

 

同城双中心高可用方案

可获得性

本特性自505.0.0版本开始引入。

特性简介

混合云场景支持同城跨AZ容灾。

客户价值

银行、贵金属等业务需要底层数据库提供跨AZ的容灾能力,来保证灾难情况下数据的安全和可用性。

特性描述

金融、银行业对数据的安全有着较高的要求,当主数据中心发生故障的情况下,需要保证数据的安全性、业务的连续性,因此需要采取同城跨AZ容灾的方案。主机房灾难的情况下,备机房的数据还具备能继续提供服务的能力。本特性的目的是提供一套支持跨AZ容灾的解决方案。

  • 灾备集群支持节点替换、节点修复。
  • 支持灾备集群failover。
  • 支持容灾主备集群计划内switchover。
  • 支持跨集群build(新增跨集群Ha端口)。

特性约束

  • 使用的Dorado存储需要支持远程复制LUN(有对应特性的License),并且和主机之间的连接使用IP网络或者NOF网络连接。
  • 本方案不能保证在所有场景下的RPO都等于0,保证RPO=0需要满足如下条件:
    • Dorado的共享xLog日志盘需要处于normal状态。
    • 主集群故障前,备集群recovery状态,主集群是archive状态。
  • 两个中心的集群之间不支持GUC参数的同步。
  • 备集群不支持全备和增备,不支持写。主集群支持全备和增备。如果主集群要做恢复,需要先解除容灾关系,在完成备份恢复后重新搭双集群。
  • 不支持缩容及升降副本;仅支持非容灾状态下,空集群的扩容操作。
  • 搭建Dorado双集群的两个集群需要使用相同的内核版本。
  • 升级场景:
    • 操作支持滚动升级,需要先升级主集群再升级备集群(升级待观察)。
    • 提交操作,在主备集群都升级成功的情况下才可以提交,并且需要先提交备集群,后提交主集群;若主备集群未完全升级成功时,不能提交。
    • 回滚操作,在主备集群未提交的情况下,先回滚备集群或者先回滚主集群都是可以的,没有先后顺序,但是若备集群已经提交,则主集群无法进行回滚操作。
    • 当主集群升级忽略故障CN所在节点时,灾备集群进行升级时需忽略对应CN所在的节点。
  • 集群状态对容灾操作的影响:
    • 在主集群和灾备集群处于normal状态且所有组件(CN、DN、ETCD、GTM、CM_Agent、CM_Server)状态正常时可进行容灾搭建;在主集群处于normal态所有组件状态正常,灾备集群已经升主且处于normal态所有组件状态正常的情况下,主备集群可执行容灾解除,其他集群状态不支持。
    • 在主集群和灾备集群都处于normal状态时(所有CN、DN、ETCD、GTM、CM_Agent、CM_Server都是正常运行状态),通过计划内switchover命令,主集群可切换为灾备集群,灾备集群可切换为主集群。
    • 灾备集群ETCD、DN、GTM多数派故障或者CMS、ETCD、CD、DN、GTM全故障,无法启动容灾,灾备集群无法升主,无法作为灾备集群。
    • 灾备集群处于非Normal且非Degraded状态时,无法升主,无法作为灾备集群继续提供容灾服务,需要修复或重建灾备集群。
    • 容灾搭建时,需要保证主备集群的部署形态一致。
  • 升级完成之后,主集群的primary节点可能会发生切换,可以手动将主切回指定节点。
  • 灾备集群节点替换和节点修复的约束,继承节点替换和修复的约束。
  • 不支持强切功能。
  • 主备集群不支持异构。
  • 不支持FC网络协议和NOF网络协议的集群混用。
  • 不支持双集群FC网络协议和NOF网络协议间互切。
  • 不支持不同GTM模式的集群搭建容灾,GTM_FREE不支持容灾搭建。
  • 灾备集群不支持强切。
  • 使用节点修复工具gs_replace修复灾备集群故障CN时,需要确保对应主集群的CN是正常的。如果主集群对应的CN也故障了,那么需要先修复主集群对应的CN,然后再修复灾备集群的CN。
  • 灾备集群支持读,特性约束同流式容灾读,请参考特性约束
 
posted on 2025-01-20 10:50  数据库笔记  阅读(9)  评论(0)    收藏  举报