返回ITIL 4 Foundation中文翻译目录,点击
5.2.5 事件管理
关键词:事件管理实践的目的是通过尽快恢复正常的服务操作来最小化事件的负面影响。
事件定义:意外中断服务或降低服务质量。
事件管理可以对客户和用户满意度以及客户和用户如何看待服务提供商产生巨大影响。应记录和管理每个事件,以确保在满足客户和用户期望的时间内解决。目标解决时间得到商定,记录和沟通,以确保预期是切合实际的。根据商定的分类确定事件的优先级,以确保首先解决业务影响最大的事件。
组织应设计其事件管理实践,以便为不同类型的事件提供适当的管理和资源分配。必须有效管理影响较小的事件,以确保它们不会消耗太多资源。影响较大的事件可能需要更多资源和更复杂的管理。通常有单独的流程来管理重大事件和管理信息安全事件。
有关事件的信息应存储在合适工具中的事故记录中。理想情况下,此工具还应提供相关 CI,变更,问题,已知错误和其他知识的链接,以实现快速有效的诊断和恢复。现代 IT 服务管理工具可以提供事件与其他事件,问题或已知错误的自动匹配,甚至可以提供事件数据的智能分析,以生成有助于解决未来事件的建议。
重要的是,从事事故的人员应及时提供高质量的更新。这些更新应包括有关症状,业务影响,受影响的 CI,已完成的操作和计划的操作的信息。这些中的每一个都应该有一个时间戳和有关人员的信息,以便相关或感兴趣的人可以随时了解情况。可能还需要良好的协作工具,以便处理事件的人员可以有效地协作。
根据问题的复杂性或事件类型,可以由许多不同组中的人员诊断和解决事件。所有这些团队都需要了解事件管理流程,以及他们对此的贡献如何有助于管理所提供服务的价值,结果,成本和风险:
●某些事件将由用户自己使用自助解决。应捕获特定自助记录的使用,以用于测量和改进活动。
●服务台将解决一些事件。
●更复杂的事件通常会升级到支持团队进行解决。通常,路由事件类别,这有助于识别正确的团队。
●可以将事件升级到为其产品和服务提供支持的供应商或合作伙伴。
●最复杂的事件和所有重大事件通常需要临时团队共同确定解决方案。该团队可能包括许多利益相关方的代表,包括服务提供商,供应商,用户等。
●在某些极端情况下,可能会调用灾难恢复计划来解决事件。服务连续性管理实践中描述了灾难恢复(第 5.2.12 节 )。
有效的事件管理通常需要团队内部和团队之间的高度协作。 这些团队可能包括服务台,技术支持,应用程序支持和供应商。 协作可以促进信息共享和学习,并有助于更有效地解决事件。
Tips :一些组织使用称为群集的技术来帮助管理事件。 这涉及许多不同的技术团队最初一起工作,直到明确哪一个团队最适合继续接手,哪些可以继续其他任务。
用作服务组件的第三方产品和服务需要支持协议,以使供应商的义务与服务提供商对客户的承诺保持一致。 事故管理可能需要经常与这些供应商进行交互,供应商合同这方面的日常管理通常是事故管理实践的一部分。 供应商还可以充当服务台,记录和管理所有事件,并根据需要将其升级为专家或其他方。
应该有一个正式的记录和管理事件的过程。此过程通常不包括如何诊断,调查和解决事件的详细程序,但可以提供使调查和诊断更有效的技术。可能存在用于在初始接触期间从用户收集信息的脚本,这可能直接导致简单事件的诊断和解决。调查更复杂的事件往往需要知识和专业知识,而不是程序步骤。
在每个价值链活动中处理事件都是可能的,尽管最明显的(由于对用户的影响)是操作环境中的事件。
图 5.20 显示了事件管理对服务价值链的贡献,实践主要应用于参与,交付和支持价值链活动。除计划外,其他活动可能会使用有关事件的信息来帮助确定优先级:
●改进:事件记录是改进活动的关键输入,并且在事件频率和严重性方面都优先考虑。
●驱动:用户可以看到事件,客户也可以看到重大事件。良好的事件管理需要定期沟通,以了解问题,设定期望,提供状态更新,并同意问题已得到解决,以便可以关闭事件。
●设计和转换:事件可能发生在测试环境中,也可能发生在服务发布和部署期间。这种做法可确保以及时和受控的方式解决这些事件。
●获取/构建:在开发环境中可能发生事件。事故管理实践确保以及时和受控的方式解决这些事件。
●交付和支持:事件管理为支持做出了重大贡献。此价值链活动包括解决事件和问题。
ITIL 的故事:Axle 的事件管理
Radhika:Axle 面临许多潜在的 IT 和非 IT 事件。汽车可能会发生故障,可能会发生交通事故,或者我们的客户可能会遇到不熟悉的道路规则的挑战。
Marco:汽车预订可能会受到我们应用中的错误或用户因我们的软件导航错误而迷路的影响。当事件发生时,我们必须准备好尽快恢复正常服务。我们还必须确保我们的团队知道如何以及何时从预定义的恢复程序切换到集体分析。
Radhika:我们还确保在此类案件之后进行调查和改进。
Henri:Axle 针对所有类型的事故制定了明确的流程,并为频繁发生的情况提供变通方法,例如轮胎爆胎或互联网连接丢失。
Radhika:我们的团队与供应商和合作伙伴共同努力,确保快速有效的事件响应。我们与参与我们遇到的任何事件的合作伙伴一起开发和测试恢复程序。
|