vRealize Operations Manager用户指南 后续步骤 施警示建议。请参见在数据存储上运行建议操作以解决警示。 在数据存储上运行建议操作以解决警示 作为网络操作工程师,您已调查有关数据存储磁盘空间的警示并确定所提供的建议能够解决问题。删除未使 用快照这一建议特别有用。可使用 vRealize Operations Manager删除快照。 如果您尚未启用 VCenter适配器中的操作,可以手动删除 vCenter Server实例上的快照。 前提条件 比较衡量指标图表,确定警示的可能根本原因。请参见将响应中在某段时间内的警示和事件与数据存储 警示相比较 步骤 1在菜单中,单击警示,然后选择数据网格中的警示名称。警示详细信息显示在右侧 2检查建议。 建议包括使用 Storage vMotion将一些虚拟机迁移到其他数据存储建议和删除未使用的虚拟机快照建 议。删除未使用的快照建议包含一个操作按钮 3单击删除未使用的数据存储快照。 4在时间早于文本框中,选择或输入一个天数,将检索并删除早于此天数的快照,然后单击确定 例如,输入30表示将在数据存储上检索所有早于30天或以上的快照 5在删除未使用的数据存储快照对话框中,查看“快照空间”、“快照创建时间”和“虚拟机名称”。确 定要删除的快照,并选中每个要删除快照的复选框 6单击确定 随即显示的对话框将提供指向近期任务的链接和指向该任务的链接。 7要验证任务运行是否成功,请单击近期任务。 随即显示“近期任务”页面。“删除未使用的快照”操作包含两个任务,一个是检索快照,一个是删除 快照。 8选择具有最近完成时间的“删除未使用的快照”任务 此任务将删除快照。状态为已完成 在此示例中,您在 vCenter Server中的数据存储上运行操作。其他建议也可能有效 后续步骤 验证建议是否已解决警示。运行操作后运行少量收集周期,并验证警示是否已取消。当生成警示的条件 不再为true时,表示警示已取消。 实施其他建议。此警示的其他建议要求使用其他应用程序。您无法从 vRealize Operations Manager实 施建议 VMware,lc保留所有权利
后续步骤 实施警示建议。请参见在数据存储上运行建议操作以解决警示。 在数据存储上运行建议操作以解决警示 作为网络操作工程师,您已调查有关数据存储磁盘空间的警示并确定所提供的建议能够解决问题。删除未使 用快照这一建议特别有用。可使用 vRealize Operations Manager 删除快照。 如果您尚未启用 vCenter 适配器中的操作,可以手动删除 vCenter Server 实例上的快照。 前提条件 n 比较衡量指标图表,确定警示的可能根本原因。请参见将响应中在某段时间内的警示和事件与数据存储 警示相比较。 步骤 1 在菜单中,单击警示,然后选择数据网格中的警示名称。警示详细信息显示在右侧。 2 检查建议。 建议包括使用 Storage vMotion 将一些虚拟机迁移到其他数据存储建议和删除未使用的虚拟机快照建 议。删除未使用的快照建议包含一个操作按钮。 3 单击删除未使用的数据存储快照。 4 在时间早于文本框中,选择或输入一个天数,将检索并删除早于此天数的快照,然后单击确定。 例如,输入 30 表示将在数据存储上检索所有早于 30 天或以上的快照。 5 在删除未使用的数据存储快照对话框中,查看“快照空间”、“快照创建时间”和“虚拟机名称”。确 定要删除的快照,并选中每个要删除快照的复选框。 6 单击确定。 随即显示的对话框将提供指向近期任务的链接和指向该任务的链接。 7 要验证任务运行是否成功,请单击近期任务。 随即显示“近期任务”页面。“删除未使用的快照”操作包含两个任务,一个是检索快照,一个是删除 快照。 8 选择具有最近完成时间的“删除未使用的快照”任务。 此任务将删除快照。状态为已完成。 在此示例中,您在 vCenter Server 中的数据存储上运行操作。其他建议也可能有效。 后续步骤 n 验证建议是否已解决警示。运行操作后运行少量收集周期,并验证警示是否已取消。当生成警示的条件 不再为 true 时,表示警示已取消。 n 实施其他建议。此警示的其他建议要求使用其他应用程序。您无法从 vRealize Operations Manager 实 施建议。 vRealize Operations Manager 用户指南 VMware, Inc. 保留所有权利。 16
vRealize Operations Manager用户指南 用户方案:监控对象状态时可以看到问题 在此方案的上下文中调查对象时, vRealize Operations Manager提供的详细信息可帮助您解决问题。可分 析环境的状态,检查当前问题,调查解决方案,并采取操作以解决问题。 作为虚拟基础架构管理员,请定期在各个级别浏览 vRealize Operations Manager,以便了解受管环境中的 对象的常规状态。虽然无人致电或发送电子邮件,也未出现任何新的警示,但很快会发现群集已开始容量不 此方案涉及与 Mware vSphere解决方案关联的对象,该解决方案将 vRealize Operations Manager连接到 一个或多个 vCenter Server实例。环境中的对象包括多个 vCenter Server实例、数据中心、群集(群集计 算资源)、主机系统、资源池和虚拟机 执行此方案中的步骤和完成故障排除的各个阶段时,您将了解如何使用 vRealize Operations Manager帮助 解决冋题。您将分析环境中对象的状态,检查当前问题,调查解决方案,并采取操作以解决冋题。 此方案将显示如何评估对象发生的问题,以及如何解决问题。 使用“事件”选项卡,可检查对象上触发的症状,确定触发这些症状的问题的出现时间,确定与这些问 题关联的事件,并检查涉及的衡量指标值。 在“详细信息”选项卡上,可以以图、列表或分布图的形式调查衡量指标活动,并查看热图以检查对象 的重要程度级别。 在“环境”选项卡上,可评估与整体对象层次结构相关的各对象的运行状况、风险和效率。可查看对象 关系以确定处于严重状态的对象可能对其他对象产生的影响 为将来的故障排除和正在进行的维护提供支持,可创建警示定义,并创建仪表板和一个或多个视图。要执 行用于监控对象的规则,可创建并自定义操作策略。 前提条件 请验证您正在监控一个或多个 v Center server实例。请参见《 vRealize Operations Manager配置指南》。 步骤 1对主机系统进行故障排除 使用“故障排除”选项卡可确定系统无法通过警示建议或简单分析解决的问题的根本原因。 2检查环境详细信息 在视图和热图中检查对象的状态,以便确定群集和对象上的资源岀现的趋势和峰值。要确定是否出现了 任何偏差,可显示某一对象的整体摘要,如群集磁盘空间使用情况细分的整体摘要。 3检查环境关系 使用“环境”选项卡可检查三个标志的状态,因为这些标志与环境层次结构中的对象有关。然后,可以 确定哪些对象的特定标志处于严重状态。要查看对象之间的关系以确定存在严重问题的先代对象是否可 能导致该对象的后代出现问题,请使用所有衡量指标>显示对象关系。 修复问题 使用 vRealize Operations Manager的故障排除功能可检查导致对象处于严重状态的冋题,并确定解决 方案。要解决资源和剩余时间问题,请使用“容量优化”功能。 VMware,lc保留所有权利
用户方案:监控对象状态时可以看到问题 在此方案的上下文中调查对象时,vRealize Operations Manager 提供的详细信息可帮助您解决问题。可分 析环境的状态,检查当前问题,调查解决方案,并采取操作以解决问题。 作为虚拟基础架构管理员,请定期在各个级别浏览 vRealize Operations Manager,以便了解受管环境中的 对象的常规状态。虽然无人致电或发送电子邮件,也未出现任何新的警示,但很快会发现群集已开始容量不 足。 此方案涉及与 VMware vSphere 解决方案关联的对象,该解决方案将 vRealize Operations Manager 连接到 一个或多个 vCenter Server 实例。环境中的对象包括多个 vCenter Server 实例、数据中心、群集(群集计 算资源)、主机系统、资源池和虚拟机。 执行此方案中的步骤和完成故障排除的各个阶段时,您将了解如何使用 vRealize Operations Manager 帮助 解决问题。您将分析环境中对象的状态,检查当前问题,调查解决方案,并采取操作以解决问题。 此方案将显示如何评估对象发生的问题,以及如何解决问题。 n 使用“事件”选项卡,可检查对象上触发的症状,确定触发这些症状的问题的出现时间,确定与这些问 题关联的事件,并检查涉及的衡量指标值。 n 在“详细信息”选项卡上,可以以图、列表或分布图的形式调查衡量指标活动,并查看热图以检查对象 的重要程度级别。 n 在“环境”选项卡上,可评估与整体对象层次结构相关的各对象的运行状况、风险和效率。可查看对象 关系以确定处于严重状态的对象可能对其他对象产生的影响。 要为将来的故障排除和正在进行的维护提供支持,可创建警示定义,并创建仪表板和一个或多个视图。要执 行用于监控对象的规则,可创建并自定义操作策略。 前提条件 请验证您正在监控一个或多个 vCenter Server 实例。请参见《vRealize Operations Manager 配置指南》。 步骤 1 对主机系统进行故障排除 使用“故障排除”选项卡可确定系统无法通过警示建议或简单分析解决的问题的根本原因。 2 检查环境详细信息 在视图和热图中检查对象的状态,以便确定群集和对象上的资源出现的趋势和峰值。要确定是否出现了 任何偏差,可显示某一对象的整体摘要,如群集磁盘空间使用情况细分的整体摘要。 3 检查环境关系 使用“环境”选项卡可检查三个标志的状态,因为这些标志与环境层次结构中的对象有关。然后,可以 确定哪些对象的特定标志处于严重状态。要查看对象之间的关系以确定存在严重问题的先代对象是否可 能导致该对象的后代出现问题,请使用所有衡量指标 > 显示对象关系。 4 修复问题 使用 vRealize Operations Manager 的故障排除功能可检查导致对象处于严重状态的问题,并确定解决 方案。要解决资源和剩余时间问题,请使用“容量优化”功能。 vRealize Operations Manager 用户指南 VMware, Inc. 保留所有权利。 17
vRealize Operations Manager用户指南 5创建仪表板和视图 为帮助您调査群集和主机系统可能在将来岀现的冋题并对其进行故障排除,您可以创建仪表板和视图。 这些工具将应用您硏究和解决主机系统问题所用的故障排除解决方案,并使这些故障排除工具和解决方 案可供将来使用。 对主机系统进行故障排除 使用“故障排除”选项卡可确定系统无法通过警示建议或简单分析解决的问题的根本原因。 要对群集和主机系统岀现的容量冋题的症状进行故障排除,并确定出现这些冋题的时间,可使用“故障排 除”选项卡调查内存问题。 1在菜单中,单击环境,然后在左侧窗格中单击 vSphere主机和群集并选择对象。例如, USA-Cluster 2单击警示选项卡,然后查看症状。 症状选项卡将显示所选群集上触发的症状。您会发现存在多种严重症状。 已提交项目的群集计算资源剩余时间非常少 群集计算资源剩余时间非常少 剩余容量非常少 3调查严重症状。 a指向每个严重症状以确定使用的衡量指标。 b要仅查看影响群集的症状,请在快速筛选器文本框中输入群集。 当您指向 Cluster Compute Resource Time Remaining is critically low时,衡量指标 Capacity ITime Remaining就会显示。您将发现其值小于或等于零,这会导致容量症状在USA C| uster上触发并生成警示。 4单击事件>时间轴选项卡可查看一段时间内在 USA-Cluster上触发的症状、警示和发生的事件,并确定 出现问题的时间。 a单击日历,然后选择过去7天作为范围 多个事件显示为红色 b指向各个事件可查看详细信息 c要显示群集的数据中心上发生的事件,请单击显示来源,然后选择数据中心 数据中心的警告事件将显示为黄色 d指向警告事件。 您将发现当晚晩些时候数据中心发生了硬阈值冲突。硬阈值冲突显示,“标志冮作负载”衡量指标 值低于可接受值,并触发该冲突 要查看受影响的子对象,请单击显示来源,然后选择主机系统。 VMware,lc保留所有权利
5 创建仪表板和视图 为帮助您调查群集和主机系统可能在将来出现的问题并对其进行故障排除,您可以创建仪表板和视图。 这些工具将应用您研究和解决主机系统问题所用的故障排除解决方案,并使这些故障排除工具和解决方 案可供将来使用。 对主机系统进行故障排除 使用“故障排除”选项卡可确定系统无法通过警示建议或简单分析解决的问题的根本原因。 要对群集和主机系统出现的容量问题的症状进行故障排除,并确定出现这些问题的时间,可使用“故障排 除”选项卡调查内存问题。 步骤 1 在菜单中,单击环境,然后在左侧窗格中单击 vSphere 主机和群集并选择对象。例如,USA-Cluster。 2 单击警示选项卡,然后查看症状。 症状选项卡将显示所选群集上触发的症状。您会发现存在多种严重症状。 n 已提交项目的群集计算资源剩余时间非常少 n 群集计算资源剩余时间非常少 n 剩余容量非常少 3 调查严重症状。 a 指向每个严重症状以确定使用的衡量指标。 b 要仅查看影响群集的症状,请在快速筛选器文本框中输入群集。 当您指向 Cluster Compute Resource Time Remaining is critically low 时,衡量指标 Capacity|Time Remaining 就会显示。您将发现其值小于或等于零,这会导致容量症状在 USACluster 上触发并生成警示。 4 单击事件 > 时间轴选项卡可查看一段时间内在 USA-Cluster 上触发的症状、警示和发生的事件,并确定 出现问题的时间。 a 单击日历,然后选择过去 7 天作为范围。 多个事件显示为红色。 b 指向各个事件可查看详细信息。 c 要显示群集的数据中心上发生的事件,请单击显示来源,然后选择数据中心。 数据中心的警告事件将显示为黄色。 d 指向警告事件。 您将发现当晚晚些时候数据中心发生了硬阈值冲突。硬阈值冲突显示,“标志|工作负载”衡量指标 值低于可接受值,并触发该冲突。 e 要查看受影响的子对象,请单击显示来源,然后选择主机系统。 vRealize Operations Manager 用户指南 VMware, Inc. 保留所有权利。 18
vRealize Operations Manager用户指南 5单击事件选项卡可检查UsA- Cluster上出现的变化,并确定出现的变化是否是群集出现警示或其他问题 的根本原因 查看图形 通过查看该图可确定某一重复发生的事件是否导致了错误。每一事件都表明客户机文件系统的磁盘 空间不足。受影响的对象将显示在图下方的窗格中。 b单击各个红色三角形可确定受影响的对象并在该窗格中使其突出显示。 6单击容量选项卡来评估容量和剩余时间的详细信息。 7单击所有衡量指标选项卡可根据对象在环境拓扑中所处位置进行评估,以确定问题的可能原因。 a在上视图中,选择 USA-Cluster。 b在衡量指标窗格中,展开所有衡量指标>生成的容量分析,然后双击剩余容量(%) 剩余容量(%)”计算将显示在右侧窗格中 c在衡量指标窗格中,展开所有衡量指标>标志,然后双击工作负载(%)。“工作负载(%)”计算将 显示在右侧窗格中。 d在工具栏中,单击日期控件,然后选择过去7天 衡量指标图表表明,群集的容量在上周保持稳定水平,但“标志工作负载(%)”计算显示工作负载 极端情况。 您已分析了与群集上的问题相关的症状、时间轴、事件和衡量指标。通过分析,您确定群集上的工作负载过 重导致群集开始出现容量不足。 后续步骤 检査“详细信息”视图和热图以解读属性、衡量指标和警示。此外,查找对象的资源所岀现的趋势和峰值 对象之间的资源分布以及数据图。您可以检查对象之间各种资源类型的使用情况。请参见检查环境详细信息 检查环境详细信息 在视图和热图中检査对象的状态,以便确定群集和对象上的资源岀现的趋势和峰值。要确定是否出现了任何 偏差,可显示某一对象的整体摘要,如群集磁盘空间使用情况细分的整体摘要。 要进一步检查UsA- Cluster的问题,请使用“详细信息”视图显示群集的衡量指标和收集的容量数据。每个 视图中都包含从对象收集的特定衡量指标。例如,趋势视图使用在一段时间内从对象收集的数据为内存 cPU、磁盘空间等资源生成趋势和预测。 使用热图检查群集、主机系统和虚拟机上的容量级别。块大小和颜色基于在热图配置中选择的衡量指标。 前提条件 可使用“故障排除”选项卡查找根本原因。请参见对主机系统进行故障排除。 1单击环境> vSphere主机和群集> USA-Cluster VMware,lc保留所有权利
5 单击事件选项卡可检查 USA-Cluster 上出现的变化,并确定出现的变化是否是群集出现警示或其他问题 的根本原因。 a 查看图形。 通过查看该图可确定某一重复发生的事件是否导致了错误。每一事件都表明客户机文件系统的磁盘 空间不足。受影响的对象将显示在图下方的窗格中。 b 单击各个红色三角形可确定受影响的对象并在该窗格中使其突出显示。 6 单击容量选项卡来评估容量和剩余时间的详细信息。 7 单击所有衡量指标选项卡可根据对象在环境拓扑中所处位置进行评估,以确定问题的可能原因。 a 在上视图中,选择 USA-Cluster。 b 在衡量指标窗格中,展开所有衡量指标 > 生成的容量分析,然后双击剩余容量 (%)。 “剩余容量 (%)”计算将显示在右侧窗格中。 c 在衡量指标窗格中,展开所有衡量指标 > 标志,然后双击工作负载 (%)。“工作负载 (%)”计算将 显示在右侧窗格中。 d 在工具栏中,单击日期控件,然后选择过去 7 天。 衡量指标图表表明,群集的容量在上周保持稳定水平,但“标志|工作负载 (%)”计算显示工作负载 极端情况。 您已分析了与群集上的问题相关的症状、时间轴、事件和衡量指标。通过分析,您确定群集上的工作负载过 重导致群集开始出现容量不足。 后续步骤 检查“详细信息”视图和热图以解读属性、衡量指标和警示。此外,查找对象的资源所出现的趋势和峰值、 对象之间的资源分布以及数据图。您可以检查对象之间各种资源类型的使用情况。请参见检查环境详细信息。 检查环境详细信息 在视图和热图中检查对象的状态,以便确定群集和对象上的资源出现的趋势和峰值。要确定是否出现了任何 偏差,可显示某一对象的整体摘要,如群集磁盘空间使用情况细分的整体摘要。 要进一步检查 USA-Cluster 的问题,请使用“详细信息”视图显示群集的衡量指标和收集的容量数据。每个 视图中都包含从对象收集的特定衡量指标。例如,趋势视图使用在一段时间内从对象收集的数据为内存、 CPU、磁盘空间等资源生成趋势和预测。 使用热图检查群集、主机系统和虚拟机上的容量级别。块大小和颜色基于在热图配置中选择的衡量指标。 前提条件 可使用“故障排除”选项卡查找根本原因。请参见 对主机系统进行故障排除。 步骤 1 单击环境 > vSphere 主机和群集 > USA-Cluster。 vRealize Operations Manager 用户指南 VMware, Inc. 保留所有权利。 19
vRealize Operations Manager用户指南 2在视图中检查有关USAC| uster的详细信息。 a单击详细信息选项卡,然后单击视图。 这些视图将提供使用趋势、列表、分布和摘要查看不同类型的收集数据的多种方法。 b在搜索文本框中,输入容量 列表将筛选并显示群集和其他对象的容量视图。 c单击名为群集容量概览的视图,然后在下窗格中检查为UsA- Cluster列出的虚拟机数量。 尽管 USA-Cluster有两个主机系统和30个虚拟机,但没有容量。 检查群集中的主机系统,然后从后代虚拟机回收容量。 a单击容量选项卡。 b在清单树中,展开 USA-Cluster,然后依次单击各主机系统。 c主机系统 W2-vcopsqe2-009处于严重状态,无剩余容量 d单击详细信息选项卡,单击视图,然后单击群集配置视图。 e要从多个虚拟机回收容量,请选择群集名称 f单击齿轮图标,然后选择设置虚拟机的cPU计数和内存。 g在出现的工作区中,单击当前cPU列标题,以便根据最大的CPU数量对列表排序。 根据所列虚拟机的实际使用情况,新CPU列将为各虚拟机推荐更少的CPU。 h单击建议更少的CPU计数的各虚拟机旁的复选框,然后单击开始操作。此时将显示一条确认消息表 明操作正在进行,并提供用于在“管理”下的“近期任务”部分跟踪操作的任务D。单击确定 通过减小各虚拟机的cPU数目,可释放主机系统上的容量,并提高USA- Cluster的容量和工作负载 4检查USAC| uster中用于主机系统和虚拟机对象的热图 a在清单树中,单击UsA- Cluster b单击详细信息,单击热图,然后单击热图视图的列表。 c单击哪些虚拟机目前的cPU需求量最高而且出现争用? 热图将显示代表 USA-Cluster中的对象的块。虚拟机的块显示为红色,表示该虚拟机存在严重问题。 d指向红色块并查看详细信息 将显示群集、主机系统和虚拟机的名称,以及有关该对象的更多信息的链接 单击显示迷你图可显示虚拟机上的活动趋势。 f单击各个详细信息链接可显示更多信息 要验证释放虚拟机上的内存是否提高了主机系统和群集的工作负载,可检查主机系统和群集的状态。 您使用了视图和热图评估对象的状态,确定趋势和峰值,并为主机系统和USA- Cluster释放容量。要进一步 缩小问题的范围,可检查其他视图和热图。也可以创建您自己的视图和热图 VMware,lc保留所有权利
2 在视图中检查有关 USA-Cluster 的详细信息。 a 单击详细信息选项卡,然后单击视图。 这些视图将提供使用趋势、列表、分布和摘要查看不同类型的收集数据的多种方法。 b 在搜索文本框中,输入容量。 列表将筛选并显示群集和其他对象的容量视图。 c 单击名为群集容量概览的视图,然后在下窗格中检查为 USA-Cluster 列出的虚拟机数量。 尽管 USA-Cluster 有两个主机系统和 30 个虚拟机,但没有容量。 3 检查群集中的主机系统,然后从后代虚拟机回收容量。 a 单击容量选项卡。 b 在清单树中,展开 USA-Cluster,然后依次单击各主机系统。 c 主机系统 w2-vcopsqe2-009 处于严重状态,无剩余容量。 d 单击详细信息选项卡,单击视图,然后单击群集配置视图。 e 要从多个虚拟机回收容量,请选择群集名称 f 单击齿轮图标,然后选择设置虚拟机的 CPU 计数和内存。 g 在出现的工作区中,单击当前 CPU 列标题,以便根据最大的 CPU 数量对列表排序。 根据所列虚拟机的实际使用情况,新 CPU 列将为各虚拟机推荐更少的 CPU。 h 单击建议更少的 CPU 计数的各虚拟机旁的复选框,然后单击开始操作。此时将显示一条确认消息表 明操作正在进行,并提供用于在“管理”下的“近期任务”部分跟踪操作的任务 ID。单击确定。 通过减小各虚拟机的 CPU 数目,可释放主机系统上的容量,并提高 USA-Cluster 的容量和工作负载。 4 检查 USA-Cluster 中用于主机系统和虚拟机对象的热图。 a 在清单树中,单击 USA-Cluster。 b 单击详细信息,单击热图,然后单击热图视图的列表。 c 单击哪些虚拟机目前的 CPU 需求量最高而且出现争用? 热图将显示代表 USA-Cluster 中的对象的块。虚拟机的块显示为红色,表示该虚拟机存在严重问题。 d 指向红色块并查看详细信息。 将显示群集、主机系统和虚拟机的名称,以及有关该对象的更多信息的链接。 e 单击显示迷你图可显示虚拟机上的活动趋势。 f 单击各个详细信息链接可显示更多信息。 要验证释放虚拟机上的内存是否提高了主机系统和群集的工作负载,可检查主机系统和群集的状态。 您使用了视图和热图评估对象的状态,确定趋势和峰值,并为主机系统和 USA-Cluster 释放容量。要进一步 缩小问题的范围,可检查其他视图和热图。也可以创建您自己的视图和热图。 vRealize Operations Manager 用户指南 VMware, Inc. 保留所有权利。 20