vsan集群脑裂因为本地存储虚拟机导致提示无法消失

vSAN 集群脑裂后 HA 提示无法消除的处理方法

在 vSAN 集群发生脑裂(Split-Brain)后,会自动触发 vSphere HA。但如果存在使用本地存储的虚拟机,则这些虚拟机无法执行 HA 故障转移。在网络恢复正常后,vCenter 会持续显示如下提示:

vSphere HA 正在数据中心 数据中心名称 中的群集 集群名称 中进行故障切换操作,0 个虚拟机正在重新启动,1 个虚拟机正在等待重试,0 个虚拟机正在等待资源,0 个 VSAN 虚拟机不可访问。

即使你已经手动重启了使用本地存储的虚拟机,该提示依然不会自动消失,也无法手动清除

处理方法

以下为三种处理方式,推荐优先级依次为:方法三 > 方法一 > 方法二。


方法一:重启 vSphere HA(推荐用于临时处理)

  • 优点:可以直接清除提示。

  • 注意事项

    • 建议在业务负载最低时段或下班后进行操作;
    • 重启过程耗时较短,通常不到 10 秒。
  • 操作步骤

    1. 打开集群设置;
    2. 禁用 vSphere HA;
    3. 等待禁用完成后重新启用。

方法二:将虚拟机移出集群(不推荐)

  • 思路:如果这些虚拟机不需要 HA,可将它们迁移到不属于集群的主机上;
  • 缺点:不利于集群统一管理,可能带来后续管理复杂度;
  • 效果:vSphere HA 将不再对其评估状态,提示也会清除。

方法三:配置 VM Overrides 移除 HA 检查(推荐)

  • 优点:从根源上解决问题,避免虚假“问题”告警反复出现;

  • 注意事项:vSphere 6.7 环境中 没有该功能,如环境版本支持建议使用。

  • 操作步骤

    1. 进入:集群 > 配置 > vSphere 可用性(vSphere Availability) > 虚拟机覆盖(VM Overrides)

    2. 点击“添加”,选择需排除 HA 检查的虚拟机;

    3. 设置如下参数:

      • VM MonitoringDisabled
      • Isolation ResponseDisabled
    4. 点击“保存”。


如需长期避免此类提示,建议在部署阶段对使用本地存储的虚拟机进行归类处理,确保其不被纳入 HA 管理范畴。


posted @ 2025-05-14 15:39  MiyauchiRenge  阅读(73)  评论(0)    收藏  举报