返回ITIL 4 Foundation中文翻译目录,点击
5.2.7 监控与事态管理
关键词:监控和事态管理实践的目的是系统地观察服务和服务组件,并记录和报告被识别为事态的所选状态的变更。 此实践识别基础架构,服务,业务流程和信息安全事态并确定其优先级,并针对这些事态建立适当的响应,包括响应可能导致潜在故障或事件的情况。
事态定义:对服务或其他配置项(CI)的管理具有重要意义的任何状态变更。 通常通过 IT服务,CI 或监视工具创建的通知来识别事态。
监控和事态管理实践管理整个生命周期中的事件,以防止,最小化或消除其对业务的负面影响。
该实践的监测部分侧重于对服务的系统观察以及支持服务以检测具有潜在重要性的条件的CI。监控应以高度自动化的方式进行,并且可以主动或被动地进行。事态管理部分侧重于记录和管理由组织定义为事态的状态监视状态变更,确定其重要性,以及识别和启动正确的控制操作以管理它们。通常,正确的控制措施是启动另一种做法,但有时除了继续监控情况之外,不采取任何行动。监控对于事态管理是必要的,但不是所有监控都会导致检测到事态 并非所有事态都具有相同的意义或需要相同的响应。事态通常分为信息,警告和例外。信息事态在识别时不需要采取行动,但是在以后分析从他们收集的数据可能会发现可能对服务有益的可取的主动步骤。警告事态允许在业务实际发生任何负面影响之前采取行动,而异常事态表明已确定违反已建立的规范(例如,达到服务级别协议)。即使可能尚未遇到业务影响,异常事态也需要采取措施。
监测和事态管理实践所需的过程和程序必须涉及这些关键活动以及更多:
●确定应监控哪些服务,系统,CI 或其他服务组件,以及建立监控策略
●实施和维护监控,利用基本的自身监控功能以及使用专用设计监控工具
●建立和维护阈值和其他标准,以确定哪些状态变化将被视为事态,并选择标准来定义每种类型的事态(信息,警告或异常)
●建立和维护应如何处理每种类型的检测事态的政策,以确保适当的管理
●实施操作定义的阈值,标准和策略所需的流程和自动化。
这种做法与参与服务价值链的其他实践高度互动。例如,某些事态将指示符合事件的当前问题。在这种情况下,正确的控制操作将是在事件管理实践中启动活动。显示超出所需水平的表现的重复事态可能是潜在问题的证据,这将引发问题管理实践中的活动。对于某些事态,正确的响应是启动变更,参与变更控制实践。
虽然这种做法的工作一旦实施,就是高度自动化的,但仍然需要人为干预,而且实际上是必不可少的。对于监控策略和特定阈值和评估标准的定义,它可以帮助引入广泛的视角,包括基础设施,应用程序,服务所有者,服务级别管理以及功效相关实践的表示。请记住,这种做法的起点可能很简单,为以后增加复杂性奠定了基础,因此管理参与者的期望非常重要。
组织和人员对于根据政策和组织优先事项对受监控的数据和事件提供适当的响应也至关重要。必须明确定义角色和职责,每个人或团体必须能够轻松,及时地访问履行其职责所需的信息。
自动化是成功监控和事态管理的关键。一些服务组件配备了内置的监视和报告功能,可以配置以满足实践的需要,但有时需要实现和配置专用的监视工具。监控本身可以是主动的也可以是被动的。在主动监控中,工具将轮询关键 CI,查看其状态以在识别出异常情况时生成警报。在被动监控中,CI 本身会生成操作警报。
自动化工具也应该用于事态的相关性。这些功能可以由监控工具或其他工具(如 ITSM 工作流程系统)提供。这种做法可能会产生大量数据,但如果没有关于如何限制,过滤和使用此数据的明确政策和策略,那么它将毫无价值。
如果第三方在整体服务架构中提供产品或服务,他们还应提供其产品的监控和报告功能方面的专业知识。在尝试实施监控和事件管理策略和工作流程时,利用这些专业知识可以节省时间。如果某些 IT 功能(例如基础架构管理)部分或全部外包给供应商,他们可能不愿意公开与其管理的元素相关的监控或事态数据。不要求不是真正需要的数据,但如果需要数据,请确保提供该数据明确是供应商服务合同的一部分。
图 5.22 显示了监控和事件管理对服务价值链的贡献,除了计划外,所有价值链活动都涉及到这种做法:
●改进:监测和事态管理实践对于密切观察环境以评估和积极改善其健康和稳定至关重要。
●驱动:监督和事态管理可能是内部参与行动的源泉。
●设计和过渡:监控数据可以为设计决策提供信息。监控是转型的重要组成部分:它提供有关所有环境中转换成功的信息。
●获取/构建:监控和事态管理支持开发环境,确保其透明性和可管理性。
●交付和支持:该实践指导组织如何管理已识别事态的内部支持,并酌情启动其他实践。
|