N监控和故障排除 群集重新平衡会在群集中平均分配资源,以保持一致的性能和可用性 以下操作可能会导致磁盘容量达到80%并启动群集重新平衡 群集上出现硬件故障。 使用撤出所有数据选项将vSAN主机置于维护模式 分配了PFTT=0的对象位于vSAN主机上时,使用确保数据可访问性将主机置于维护模式。 注要为维护和重新保护操作提供足够空间,并最大程度地减少 VSAN群集中的自动重新平衡事件,应当随 时留有30%的可用容量。 可以使用 Ruby vSphere控制台(RC)手动重新平衡vSAN群集。请参见手动重新平衡。 自动再平衡 默认情况下,当容量设备中存储的数据达到总容量的80%时,vSAN会自动重新平衡vSAN群集。将vSAN 主机置于维护模式时,也会进行重新平衡。 若要监控群集中的再平衡操作,请运行以下RVC命令: vsan. check_ Limits。验证群集中的磁盘空间使用情况是否平衡。 vsan. whatif host_ failures。分析每个主机的当前容量使用情况,解释单个主机故障是否可以强制 群集耗尽空间以重新保护,并分析主机故障可能对群集容量、缓存预留和群集组件产生什么影响。 作为命令输出显示的物理容量使用情况是vSAN群集中所有设备的平均使用情况。 vsan. resync_ dashboard。监控群集中的任何重新构建任务。 有关RVC命令选项的信息,请参见《RVC命令参考指南》。 手动重新平衡 可以通过群集运行状况检查或使用RVC命令进行手动重新平衡 如果vSAN磁盘平衡运行状况检查失败,则可以启用手动重新平衡。在“群集运行状况”下,访问vSAN磁 盘平衡运行状况检查,然后单击重新平衡磁盘按钮 使用以下RVC命令手动重新平衡群集 vsan. check limits。验证vSAN群集中是否存在任何容量设备接近80%的阈值限制。 VMware,lc保留所有权利
群集重新平衡会在群集中平均分配资源,以保持一致的性能和可用性。 以下操作可能会导致磁盘容量达到 80%并启动群集重新平衡: n 群集上出现硬件故障。 n 使用撤出所有数据选项将 vSAN 主机置于维护模式。 n 分配了 PFTT=0 的对象位于 vSAN 主机上时,使用确保数据可访问性将主机置于维护模式。 注 要为维护和重新保护操作提供足够空间,并最大程度地减少 vSAN 群集中的自动重新平衡事件,应当随 时留有 30% 的可用容量。 可以使用 Ruby vSphere 控制台 (RVC) 手动重新平衡 vSAN 群集。请参见手动重新平衡。 自动再平衡 默认情况下,当容量设备中存储的数据达到总容量的 80% 时,vSAN 会自动重新平衡 vSAN 群集。将 vSAN 主机置于维护模式时,也会进行重新平衡。 若要监控群集中的再平衡操作,请运行以下 RVC 命令: n vsan.check_limits。验证群集中的磁盘空间使用情况是否平衡。 n vsan.whatif_host_failures。分析每个主机的当前容量使用情况,解释单个主机故障是否可以强制 群集耗尽空间以重新保护,并分析主机故障可能对群集容量、缓存预留和群集组件产生什么影响。 作为命令输出显示的物理容量使用情况是 vSAN 群集中所有设备的平均使用情况。 n vsan.resync_dashboard。监控群集中的任何重新构建任务。 有关 RVC 命令选项的信息,请参见《RVC 命令参考指南》。 手动重新平衡 可以通过群集运行状况检查或使用 RVC 命令进行手动重新平衡。 如果 vSAN 磁盘平衡运行状况检查失败,则可以启用手动重新平衡。在“群集运行状况”下,访问 vSAN 磁 盘平衡运行状况检查,然后单击重新平衡磁盘按钮。 使用以下 RVC 命令手动重新平衡群集: n vsan.check_limits。验证 vSAN 群集中是否存在任何容量设备接近 80% 的阈值限制。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 11
vSAN监控和故障排除 vsan. health. cluster_ rebalance< cluster>。手动启动重新平衡操作。运行该命令时,vSAN扫描 该群集以查看当前组件分布,然后开始平衡该群集中的组件分布。使用命令选项指定在该群集中运行重 新平衡操作的时间长度,以及每小时为每个vSAN主机移动的数据量。有关在vSAN群集中管理重新平 衡操作的命令选项的详细信息,请参见《RvC命令参考指南》 由于群集重新平衡会生成大量WO操作,因此可能会耗时并且影响虚拟机的性能。 注手动重新平衡磁盘时,该操作会在选定的时间段内持续运行,直到没有数据需要移动。默认时间段为24 小时。如果没有在移动数据,vSAN将终止重新平衡任务。 您可以配置警报,它会在置备空间达到特定阈值时通知您。请参见为vSAN事件创建 vCenter server警报 平衡vSAN群集中的磁盘使用 如果vSAN群集变得不平衡,可以重新平衡磁盘使用。 如果从vSAN群集中移除容量设备,磁盘组可能会变得不平衡。如果将主机或容量设备添加到vSAN群集, 磁盘组可能会变得不平衡。 VSANHealth Service发出任何不平衡警告后,您可以重新平衡群集。 前提条件 在非生产时间内执行重新平衡操作,以避免对群集产生过大影响 步 1导航到vSAN群集 2单击监控选项卡。 描述 vSphere client a在“vSAN”下,选择运行状况 b展开“群集运行状况”类别,然后选择vSAN磁盘平衡。可以查看主机的磁盘 c在“wsAN磁盘平衡”页面中,单击磁盘平衡 vSphere Web Client a单击vSAN b在“vsAN"下,单击运行状况 c展开“群集运行状况”类别,然后选择vSAN磁盘平衡。可以查看主机的磁盘 3单击主动重新平衡磁盘按钮以重新平衡群集 该操作会将组件从使用过度的磁盘移到未充分利用的磁盘中 使用vSAN默认警报 您可以使用默认的vSAN警报监控群集、主机和现有SAN许可证。 VMware,lc保留所有权利
n vsan.health.cluster_rebalance <cluster>。手动启动重新平衡操作。运行该命令时,vSAN 扫描 该群集以查看当前组件分布,然后开始平衡该群集中的组件分布。使用命令选项指定在该群集中运行重 新平衡操作的时间长度,以及每小时为每个 vSAN 主机移动的数据量。有关在 vSAN 群集中管理重新平 衡操作的命令选项的详细信息,请参见《RVC 命令参考指南》。 由于群集重新平衡会生成大量 I/O 操作,因此可能会耗时并且影响虚拟机的性能。 注 手动重新平衡磁盘时,该操作会在选定的时间段内持续运行,直到没有数据需要移动。默认时间段为 24 小时。如果没有在移动数据,vSAN 将终止重新平衡任务。 您可以配置警报,它会在置备空间达到特定阈值时通知您。请参见为 vSAN 事件创建 vCenter Server 警报。 平衡 vSAN 群集中的磁盘使用 如果 vSAN 群集变得不平衡,可以重新平衡磁盘使用。 如果从 vSAN 群集中移除容量设备,磁盘组可能会变得不平衡。如果将主机或容量设备添加到 vSAN 群集, 磁盘组可能会变得不平衡。 vSANHealth Service 发出任何不平衡警告后,您可以重新平衡群集。 前提条件 在非生产时间内执行重新平衡操作,以避免对群集产生过大影响。 步骤 1 导航到 vSAN 群集。 2 单击监控选项卡。 选项 描述 vSphere Client a 在“vSAN”下,选择运行状况。 b 展开“群集运行状况”类别,然后选择 vSAN 磁盘平衡。可以查看主机的磁盘 平衡。 c 在“vSAN 磁盘平衡”页面中,单击磁盘平衡。 vSphere Web Client a 单击 vSAN。 b 在“vSAN”下,单击运行状况。 c 展开“群集运行状况”类别,然后选择 vSAN 磁盘平衡。可以查看主机的磁盘 平衡。 3 单击主动重新平衡磁盘按钮以重新平衡群集。 该操作会将组件从使用过度的磁盘移到未充分利用的磁盘中。 使用 vSAN 默认警报 您可以使用默认的 vSAN 警报监控群集、主机和现有 vSAN 许可证。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 12
N监控和故障排除 激活与警报对应的事件或满足警报中指定的一个或所有条件时,会自动触发默认警报。您不能编辑条件或删 除默认警报。要配置特定于要求的警报,请为ⅴSAN创建自定义警报。请参见为νSAN事件创建 vCenter Server警报。 下表列出了默认的vsAN警报。 表21.默认的vsAN警报 vSAN警报 vSAN限时许可证已过期 控vSAN试用许可证。 在vSAN主机上注册取消注册VASA供应商在出现故障的vSAN主机上注册取消注册ASA提供程序 提供程序失败 过期的vSAN许可证 i控已过期的vSAN许可证。 vSAN主机磁盘出错 监控vsAN设备上的错误。 用于“限制运行状况”组测试的 VSAN Health监控vsAN群集限 Service警报 用于“网络运行状况”组测试的 VSAN Health监控vsAN网络运行状况。 Service警报 用于“物理磁盘运行状况”组测试的vSAN监控群集中物理设备的运行状况。 Health Service警报 用于“ VSAN HCL运行状况”组测试的vsAN监控群集组件以确保它们使用受支持的硬件、软件和驱动程序。 用于“软件状态运行状况”组测试的vsAN监控群集中目前使用的软件的运行状况 Health Service警报 用于“意外的vSAN运行状况”组测试的监控所有意外群集运行状况问题 VSAN Health Service警报 用于“ VSAN CLOMD活跃度”组测试的 控在EsXi主机上运行并负责数据迁移和撤出的 CLOMD(群集级对象管理器后台 VSAN Health Service警报 驻留程序)是否处于活动状态。 用于“vSAN群集分区”组测试的vsAN 控vSAN群集分区 Health Service警报 有关监控警报、事件和编辑现有警报设置的信息,请参见《 vSphere监控和性能》文档 查看vsAN默认警报 可以使用默认的vsAN警报监控群集、主机,分析仼何新事件,以及评估群集的整体运行状况。 1导航到vSAN群集。 2单击配置,然后单击警报定义 3在搜索框中键入vSAN作为搜索项,以显示特定于vSAN的警报。 键入 VSAN Health Service警报,以搜索 VSAN Health Service警报。 此时将显示默认的vSAN警报 VMware,lc保留所有权利
激活与警报对应的事件或满足警报中指定的一个或所有条件时,会自动触发默认警报。您不能编辑条件或删 除默认警报。要配置特定于要求的警报,请为 vSAN 创建自定义警报。请参见为 vSAN 事件创建 vCenter Server 警报。 下表列出了默认的 vSAN 警报。 表 2‑1. 默认的 vSAN 警报 vSAN 警报 描述 vSAN 限时许可证已过期 监控 vSAN 试用许可证。 在 vSAN 主机上注册/取消注册 VASA 供应商 提供程序失败 在出现故障的 vSAN 主机上注册/取消注册 VASA 提供程序。 过期的 vSAN 许可证 监控已过期的 vSAN 许可证。 vSAN 主机磁盘出错 监控 vSAN 设备上的错误。 用于“限制运行状况”组测试的 vSAN Health Service 警报 监控 vSAN 群集限制。 用于“网络运行状况”组测试的 vSAN Health Service 警报 监控 vSAN 网络运行状况。 用于“物理磁盘运行状况”组测试的 vSAN Health Service 警报 监控群集中物理设备的运行状况。 用于“vSAN HCL 运行状况”组测试的 vSAN Health Service 警报 监控群集组件以确保它们使用受支持的硬件、软件和驱动程序。 用于“软件状态运行状况”组测试的 vSAN Health Service 警报 监控群集中目前使用的软件的运行状况。 用于“意外的 vSAN 运行状况”组测试的 vSAN Health Service 警报 监控所有意外群集运行状况问题。 用于“vSAN CLOMD 活跃度”组测试的 vSAN Health Service 警报 监控在 ESXi 主机上运行并负责数据迁移和撤出的 CLOMD(群集级对象管理器后台 驻留程序)是否处于活动状态。 用于“vSAN 群集分区”组测试的 vSAN Health Service 警报 监控 vSAN 群集分区。 有关监控警报、事件和编辑现有警报设置的信息,请参见《vSphere 监控和性能》文档。 查看 vSAN 默认警报 可以使用默认的 vSAN 警报监控群集、主机,分析任何新事件,以及评估群集的整体运行状况。 步骤 1 导航到 vSAN 群集。 2 单击配置,然后单击警报定义。 3 在搜索框中键入 vSAN 作为搜索项,以显示特定于 vSAN 的警报。 键入 vSAN Health Service 警报,以搜索 vSAN Health Service 警报。 此时将显示默认的 vSAN 警报。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 13
N监控和故障排除 在警报列表中,单击每个警报可以查看警报定义 使用Ⅴ Mkerne观察创建警报 Kernel观察OB)是可以用来设置vSAN警报的系统事件,这些事件可以监控wSAN群集中的性能和网 络连接问题并进行故障排除。在vSAN中,这些事件称为观察。 VSAN的 VMware EsXi观察|D 每个oB事件与一个标识符(D)关联。在 vCenter server中创建vsAN警报之前,必须确定要创建警示的 VSAN事件的相应 VOB ID。您可以在 VMware EsXi观察日志文件(vobd.Log)中创建警示。例如,使用以 下∨oBID为群集中的所有设备故障创建警示。 esx problem. vob. vsan. lsom. diskerror esx problem. vob. vsan. pdL. offline 要查看vSAN的VOBD列表,请打开位于ESXi主机上/var/log目录中的vobd.log文件。该日志文件 包含以下可用于创建vSAN警报的oBID 表22.VSAN的voB|D esx audit vsan.clustering enabled vSAN群集服务处于启用状态。 esx clear. vob. vsan pdl. online vSAN设备已联机 esxclear vsan. clustering enabled vSAN群集服务处于启用状态。 esx clear vsan vsan network available vSAN具有一个活动网络配置。 esxclear vsan. vsan. vmknic ready 之前报告的Wknc已经获得有效IP。 esx problem. vob. vsan. Isom. componentthreshold VSAN接近节点组件计数限制。 vSAN设备处于永久错误状态 esxproblem. vob. vsan. Isom. diskgrouplimit vSAN无法创建磁盘组 esxproblem.无法将设备添加到磁盘组。 esx problem. vob. vsan. Isom. diskunhealthy vSAN磁盘不正常 esx problem. vob. vsan.pdl. offline esxproblem. vsan. clustering. disabled N群集服务处于禁用状态。 esx problem. vsan. Isom. congestionthreshold vSAN设备内存或SSD拥堵已更新 esxproblem. vsan. net. not ready 将不含有效|P地址的 vinic添加到vsAN网络配置。vsAN网络尚未就绪时 会出现这种情况 esxproblem. vsan. net. redundancy. lost vSAN网络配置没有所需冗余 vSAN没有使用中的现有网络连接配置。 sx problem. vsan. vmknic not ready 将不含有效|P地址的wknc添加到vsAN网络配置 VMware,lc保留所有权利
4 在警报列表中,单击每个警报可以查看警报定义。 使用 VMkernel 观察创建警报 VMkernel 观察 (VOB) 是可以用来设置 vSAN 警报的系统事件,这些事件可以监控 vSAN 群集中的性能和网 络连接问题并进行故障排除。在 vSAN 中,这些事件称为观察。 vSAN 的 VMware ESXi 观察 ID 每个 VOB 事件与一个标识符 (ID) 关联。在 vCenter Server 中创建 vSAN 警报之前,必须确定要创建警示的 vSAN 事件的相应 VOB ID。您可以在 VMware ESXi 观察日志文件 (vobd.log) 中创建警示。例如,使用以 下 VOB ID 为群集中的所有设备故障创建警示。 n esx.problem.vob.vsan.lsom.diskerror n esx.problem.vob.vsan.pdl.offline 要查看 vSAN 的 VOB ID 列表,请打开位于 ESXi 主机上 /var/log 目录中的 vobd.log 文件。该日志文件 包含以下可用于创建 vSAN 警报的 VOB ID。 表 2‑2. vSAN 的 VOB ID VOB ID 描述 esx.audit.vsan.clustering.enabled vSAN 群集服务处于启用状态。 esx.clear.vob.vsan.pdl.online vSAN 设备已联机。 esx.clear.vsan.clustering.enabled vSAN 群集服务处于启用状态。 esx.clear.vsan.vsan.network.available vSAN 具有一个活动网络配置。 esx.clear.vsan.vsan.vmknic.ready 之前报告的 vmknic 已经获得有效 IP。 esx.problem.vob.vsan.lsom.componentthreshold vSAN 接近节点组件计数限制。 esx.problem.vob.vsan.lsom.diskerror vSAN 设备处于永久错误状态。 esx.problem.vob.vsan.lsom.diskgrouplimit vSAN 无法创建磁盘组。 esx.problem.vob.vsan.lsom.disklimit vSAN 无法将设备添加到磁盘组。 esx.problem.vob.vsan.lsom.diskunhealthy vSAN 磁盘不正常。 esx.problem.vob.vsan.pdl.offline vSAN 设备处于脱机状态。 esx.problem.vsan.clustering.disabled vSAN 群集服务处于禁用状态。 esx.problem.vsan.lsom.congestionthreshold vSAN 设备内存或 SSD 拥堵已更新。 esx.problem.vsan.net.not.ready 将不含有效 IP 地址的 vmknic 添加到 vSAN 网络配置。vSAN 网络尚未就绪时 会出现这种情况。 esx.problem.vsan.net.redundancy.lost vSAN 网络配置没有所需冗余。 esx.problem.vsan.no.network.connectivity vSAN 没有使用中的现有网络连接配置。 esx.problem.vsan.vmknic.not.ready 将不含有效 IP 地址的 vmknic 添加到 vSAN 网络配置。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 14
vSAN监控和故障排除 为ⅴSAN事件创建 V Center server警报 您可以创建警报以监控选定vSAN对象(包括群集、主机、数据存储、网络和虚拟机)上的事件。 前提条件 必须具有所需的 Alarms. Create alarm或 Alarm. Modify alarm特权级别 步骤 1在清单中选择需要监控的 vCenter Server对象。 2单击配置选项卡>警报定义,然后单击+图标。 3键入新警报的名称和描述。 4从监控下拉菜单中,选择要在其上配置警报的对象。 5单击此对象上发生的特定事件,例如打开虚拟机电源,然后单击下一步。 6单击触发器添加将触发警报的vsAN事件。“触发器”页面的选项因您计划监控的活动类型不同而异。 单击添加图标(+)。 8在事件列中单击,然后从下拉菜单中选择选项。 9在状态列中单击,然后从下拉菜单中选择选项 10(可选)配置触发警报要满足的其他条件。 a单击添加图标添加参数 b在参数列中单击,然后从下拉菜单中选择选项。 c在运算符列中单击,然后从下拉菜单中选择选项 d单击值列,然后在文本字段中输入值 您可添加多个参数 11单击下一步。 此时即已选择并配置警报触发器。 VMware,lc保留所有权利
为 vSAN 事件创建 vCenter Server 警报 您可以创建警报以监控选定 vSAN 对象(包括群集、主机、数据存储、网络和虚拟机)上的事件。 前提条件 必须具有所需的 Alarms.Create Alarm 或 Alarm.Modify Alarm 特权级别 步骤 1 在清单中选择需要监控的 vCenter Server 对象。 2 单击配置选项卡 > 警报定义,然后单击 图标。 3 键入新警报的名称和描述。 4 从监控下拉菜单中,选择要在其上配置警报的对象。 5 单击此对象上发生的特定事件,例如打开虚拟机电源,然后单击下一步。 6 单击触发器添加将触发警报的 vSAN 事件。“触发器”页面的选项因您计划监控的活动类型不同而异。 7 单击添加图标 ( )。 8 在事件列中单击,然后从下拉菜单中选择选项。 9 在状态列中单击,然后从下拉菜单中选择选项。 10 (可选) 配置触发警报要满足的其他条件。 a 单击添加图标添加参数。 b 在参数列中单击,然后从下拉菜单中选择选项。 c 在运算符列中单击,然后从下拉菜单中选择选项。 d 单击值列,然后在文本字段中输入值。 您可添加多个参数。 11 单击下一步。 此时即已选择并配置警报触发器。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 15