服务连续性管理：ITIL4服务管理实践之五

admin

返回ITIL 4 Foundation中文翻译目录，点击

5.2.12 服务连续性管理

服务连续性管理实践的目的是确保在发生灾难时将服务的可用性和性能维持在足够的水平。该实践为构建组织弹性提供了一个框架，能够产生有效的响应，保护关键利益相关者的利益以及组织的声誉，品牌和价值创造活动。

服务连续性管理通过确保在灾难或危机之后的所需和商定的业务时间范围内恢复 IT 和服务，支持整体业务连续性管理（BCM）和规划功能。当服务中断或组织风险发生的规模大于组织使用正常响应和恢复实践（如事件和重大事件管理）处理它的能力时，就会触发它。这种规模的组织事件通常被称为灾难。

每个组织都需要了解在自己的背景下构成灾难的内容。必须在组织和每个服务级别的触发事件之前使用业务影响分析来考虑和定义灾难的含义。业务连续性研究所将灾难定义为：

......一次突然的计划外事件，对组织造成巨大损害或严重损失这导致组织在某个预定的最短时间内未能提供关键业务功能。

触发灾害响应和恢复的来源是多种多样和复杂的，利益相关者的数量和潜在组织影响的不同方面也是如此。与表 5.3 中的示例相关的复杂风险管理条件使得必须彻底考虑服务连续性管理实践，设计灵活性并定期测试，以确保以业务生存所需的速度恢复服务。

定义：

●恢复时间目标（RTO）在缺少业务功能之前可能经过的服务中断后的最长可接受时间段会严重影响组织。这表示必须恢复产品或活动的最长约定时间，或者必须恢复资源。

●恢复点目标（RPO）必须恢复活动使用的信息的点，以使活动能够在恢复时运行。

●灾难恢复计划考虑到服务管理的四个方面，一组明确定义的计划，涉及组织如何从灾难中恢复以及恢复到灾前状态。

●业务影响分析（BIA）服务连续性管理实践中的一项关键活动，用于标识重要业务功能（VBF）及其依赖关系。这些依赖关系可能包括供应商，人员，其他业务流程和 IT 服务。 BIA 定义了 IT 服务的恢复要求。这些要求包括 RTO，RPO 和每个 IT 服务的最低目标服务级别。

Tips：服务连续性管理与事件管理

服务连续性管理侧重于业务认为足以被视为灾难的那些事件。事件管理或重大事件管理将处理不太重要的事件。灾难，重大事件和事故之间的区别需要预先定义，同意和记录，并具有明确的阈值和触发因素，在没有不必要的延迟和风险的情况下调用下一级响应和恢复行动。

随着组织越来越依赖于技术支持的服务，对高可用性解决方案的需求已成为组织弹性和竞争力的关键。组织通过业务规划，技术架构弹性，可用性规划，主动风险和信息安全管理以及事件管理和问题管理相结合来实现高可用性。

图 5.31 显示了服务连续性管理对服务价值链的贡献，实践涉及所有价值链活动：

●计划：组织的领导和管理机构为组织建立初始风险偏好，并确定范围，政策，供应商策略和恢复选项投资。服务连续性管理通过关于组织当前连续性状态的相关信息以及用于规划和预测的工具和方法来支持此功能。

●改进：服务连续性管理确保持续监控和改进连续性计划，措施和机制，以适应不断变化的内部和外部环境。

●驱动：这种做法支持与各利益相关方合作，为组织的灾难准备提供保证。

●设计和过渡：服务连续性管理确保根据组织的连续性要求设计和测试产品和服务

●获取/构建：服务连续性管理确保组织的服务和组件具有连续性，并且采购的组件和服务满足组织的连续性要求。

●交付和支持：持续交付，运营和支持是根据连续性要求和政策执行的。

评论