“vSAN磁盘均衡”告警处理

Symptoms


免责声明:本文为 vSAN "Proactive rebalance" and "Automatic Rebalance"  的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。 


 

Purpose


本文旨在介绍 vSAN“主动重新平衡和自动重新平衡”的概念及其适用场合。

 

如果磁盘在运行状况检查中报告错误,指明集群处于不平衡状态,某些磁盘的空间使用量较高,而其他磁盘则很少,那么您可能需要运行主动/自动重新平衡,以便基于 vSAN 版本在磁盘间分配负载,合理使用空间。


主动重新平衡:这将通过 VC GUI 上的 vSAN 运行状况插件或通过 RVC 控制台手动启动 vSAN 集群中对象的重新平衡。仅 vSAN 6.7 U2 及更低版本支持此操作。

 自动重新平衡:vSAN 6.7 U3 及更高版本不需要手动触发主动重新平衡。您可以使用集群范围的配置和阈值设置自动执行所有重新平衡活动。

 

Resolution

主动重新平衡:如果 vSAN 群集处于不平衡状态,则可能需要运行手动再平衡。此操作会将组件从过度利用的磁盘移至未充分使用的磁盘。执行手动重新平衡时,此操作将运行 24 小时,然后停止。

 

注意:运行手动重新平衡会利用某些系统资源,此过程可能需要数小时才能完成,  具体取决于为减少集群中的磁盘使用量差异而需要重新平衡的对象数。

建议通过监控 vSAN 性能图表,在工作负载最小时运行主动重新平衡。


要在 vSphere 6.7 U2 及更低版本中运行主动重新平衡,请执行以下操作:

 

 

  1. 在 vSphere Web Client 中,导航到 vSAN 群集。
  2. 单击监控选项卡,然后单击 vSAN。
  3. 单击运行状况。
  4. 在 vSAN Health Service 表中,选择警告: Virtual SAN 磁盘平衡。您可以查看主机的磁盘平衡情况。
  5. 单击再平衡磁盘按钮对群集进行再平衡。
    注意:此任务可能需要很长时间。

 

 

要在使用 RVC 的版本中运行主动重新平衡,请执行以下操作(已弃用):

 

  1. 登录到 Ruby vSphere 控制台 (RVC)。
  2. 切换到计算机命名空间。
  3. 要查看需要再平衡的数据量,请对 vSAN 群集运行以下命令:
    vsan.proactive_rebalance_info <vSAN-cluster-number, or "." for current rvc path location>
命令输出将如下所示:

 

/localhost/Test-DC/computers/Test-CL> vsan.proactive_rebalance_info .
2019-08-16 19:31:08 +0000: Retrieving proactive rebalance information from host esxi-3.labs.org ...
2019-08-16 19:31:08 +0000: Retrieving proactive rebalance information from host esxi-1.labs.org ...
2019-08-16 19:31:08 +0000: Retrieving proactive rebalance information from host esxi-2.labs.org ...
2019-08-16 19:31:09 +0000: Fetching vSAN disk info from esxi-3.labs.org (may take a moment) ...
2019-08-16 19:31:09 +0000: Fetching vSAN disk info from esxi-2.labs.org (may take a moment) ...
2019-08-16 19:31:09 +0000: Fetching vSAN disk info from esxi-1.labs.org (may take a moment) ...
2019-08-16 19:31:10 +0000: Done fetching vSAN disk infos

Proactive rebalance start: 2019-08-16 19:30:47 UTC
Proactive rebalance stop: 2019-08-17 19:30:54 UTC
Max usage difference triggering rebalancing: 30.00%
Average disk usage: 56.00%
Maximum disk usage: 63.00% (17.00% above minimum disk usage)
Imbalance index: 10.00%
No disk detected to be rebalanced

 


您会注意到,此重新平衡启动和停止间的时间为 24 小时。

 

  • 要启动再平衡,请运行以下命令:
    vsan.proactive_rebalance -s <vSAN-cluster-number>
输出将如下所示:

 

/localhost/Test-DC/computers/Test-CL> vsan.proactive_rebalance . -s

 

2019-08-16 19:30:55 +0000: Processing vSAN proactive rebalance on host esxi-3.labs.org ...
2019-08-16 19:30:55 +0000: Processing vSAN proactive rebalance on host esxi-1.labs.org ...
2019-08-16 19:30:55 +0000: Processing vSAN proactive rebalance on host esxi-2.labs.org ...

Proactive rebalance has been started!

 

  • 使用以下命令监控再平衡的状态:
    vsan.proactive_rebalance_info <vSAN-cluster-number>

    注意:此任务可能需要很长时间。

     

 

要使重新平衡的运行时间超过默认的 24 小时,您需要更改重新平衡的运行时间(<值以秒为单位>)。

例如,将重新平衡设置为运行一周:

 

vsan.proactive_rebalance . -t 604800

 


在这种情况下,此操作将运行到完成或运行一周。如果重新平衡在满一周前完成,则该过程结束。

链接:
文档:https://docs.vmware.com/en/VMware-vSphere/6.5/com.vmware.vsphere.virtualsan.doc/GUID-968C05CA-FE2C-45F7-A011-51F5B53BCBF9.html

 

--------------------------------------------------------------------------------------------------------------------
自动重新平衡:
从 vSAN 6.7 U3 起,磁盘重新平衡不再手动执行,需要在 vSAN 集群设置中以服务的形式启用(如下所述)。如果未启用,vSAN 将仅在任何 vSAN 磁盘超过 80% 容量阈值时才会对 vSAN 磁盘启动重新平衡。

注意:磁盘重新平衡可能会影响 vSAN 集群的 I/O 性能。为避免带来此性能影响,可以在需要峰值性能时更改阈值或禁用自动重新平衡。

配置自动重新平衡的过程:
1. 导航到 vSAN 集群。
2. 单击配置选项卡。
3. 在 vSAN 下,选择服务。
4. 单击以编辑高级选项。
5. 单击以启用或禁用自动重新平衡。
6. 根据您的要求,将差异阈值设置为 20 到 75 之间的任意百分比。

默认情况下,将启动重新平衡的阈值设置为 30%,这意味着,如果任意两个磁盘具有此差异(一个比另一个的负载多 30%),将开始组件重新平衡。重新平衡将一直运行到差异达到所设阈值的一半,即默认的 15%(或一直运行到禁用自动重新平衡)。

还有一个 vSAN 磁盘平衡的运行状况检查,您可以在其中查看 vSAN 集群的磁盘使用情况详细信息。如果已启用自动重新平衡,vSAN 会自动尝试将此运行状况检查保持为绿色。如果已禁用该功能,则会触发此运行状况检查,并要求管理员手动触发重新平衡磁盘任务,或重新启用自动重新平衡。

链接:
文档:https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vsan-monitoring.doc/GUID-968C05CA-FE2C-45F7-A011-51F5B53BCBF9.html
发行说明:https://docs.vmware.com/en/VMware-vSphere/6.7/rn/vmware-vsan-67u3-release-notes.html
posted @ 2024-03-04 17:47  .dier  阅读(150)  评论(0编辑  收藏  举报