本帖最后由 monicazhang 于 2015-11-12 16:52 编辑
20151112 淡然 续上
4.8 可用性管理 4.8.1 设计目标 通过分析监管指引要求,并对同业实施的经验教训进行深入总结。某公司在流程建设方面通过结合ITIL理念,以ISO20000国际标准作为主要参考,启动可用性管理的关键能力建设,为有效消除系统可用性缺陷打好基础,同时指导某公司可用性管理水平的稳步提高: 建立实用的容量管理流程,明确定义可用性管理、分析和改进活动; 明确的定义可用性信息的收集、记录、分析和跟踪职责,比如由可用性分析员负责; 实现可用性数据的汇总分析,并为服务级别的落实,提供数据基础,基于可用性数据充分支持; ITSS考试 启动可用性缺陷分析机制(SPOF,CRAMM等),引导系统加固措施落实; 实现可用性相关缺陷和问题处理和流转机制,比如可用性经理开启事件或者问题; 正式任命的可用性流程经理,比如专职的“可用性管理经理”、兼职的“可用性分析员”;
4.8.2 可用性管理描述 通过建立各个层面的监控系统,运维团队逐步强化系统可用性的监控能力,确保以经济高效的方式,使所有交付的服务的可用性级别符合或超过当前和未来约定的业务需求。 4.8.3 管理目的 确保服务和资源的可用性相关问题有一个集中的管理方式,并且信息技术的服务是可测量的和完整的; 生成和维护最新的可用性计划,以便反映出当前和为未来的业务需要; 向所有其他的业务和信息技术领域提出与可用性有关问题的建议和指导意见; 通过管理服务和资源有关的可用性性能,确保所实现的服务可用性均达到或超过所有约定目标; 帮助诊断和解决与可用性有关的故障和问题; 评估所有变更对可用性计划以及所有服务和资源的性能和容量的影响。
4.8.4 管理范围
某公司用于所有服务级别协议中包含的那些服务和技术。以及认为对业务非常关键的那些信息技术服务(不管是否存在正式的服务级别协议)。 某公司用于新的确立了服务级别协议的信息技术服务和技术。 某公司用于所有支持服务和信息技术服务支持组织,组织包括内部的信息技术职能单位,也包括外部的服务供应商。 全面考虑可能影响广州地铁维护可用性的信息技术服务、组件和支持机构,包括培训、技能、效率和工具。 4.8.5 执行的效果 可用性直接影响客户满意度和企业信誉,通过可用性管理,可用性管理确保某公司按照业务需求交付适当级别的服务可用,确保某公司维护的服务的可用性符合不断变化的既定业务需求,以满足整体业务目标符合总公司的要求。
4.8.6 与其他管理模块的关系 本部分介绍某公司可用性管理流程与某公司服务管理其他流程之间的关系和流程接口。整体的关系如下所示: • 配置管理 配置管理:提供相关的配置模型,用于相关的可用性配置记录。 • 服务级别管理 服务级别管理:服务级别协议提供可用性目标,可用性管理为服务级别管理的绩效提供相关指标,用于调查和解决服务及组件出现的问题。 • 连续性管理 连续性管理:可用性管理提供评估业务影响和风险测量,支撑连续性管理。连续性管理为可用性管理提供恢复能力、故障切换以及恢复的机制。 • 容量管理 容量管理:容量管理为可用性管理提供恢复能力和备用容量。 • 事件管理 事件管理将中断类事件信息输出给可用性管理,可用性管理将计划内停机时间窗口输出给事件管理。 ITSS认证 • 问题管理 问题管理:帮助提供解决方案以及后继的判断,纠正与可用性管理有关的事件和问题。
4.8.7 未来本流程重点改进点: 编号
| | | | | | | | 为了提高业务系统可用性的要求,需要对可用性管理进行规划。 | 服务连续性和可用性管理
ISO20000 6.3
确保向顾客承诺的协商一致的服务连续性和可用性在任何情况下都能得到满足 | 可用性管理流程规划(指标定义、管理流程定义、故障分析、绩效指标和报表)。 | |
4.9 连续性管理4.9.1 设计目标 通过分析监管指引要求,并对同业实施的经验教训进行深入总结。某公司在流程建设方面通过结合ITIL理念,以ISO20000国际标准作为主要参考,启动连续性管理的关键能力建设,为支撑CC业务连续性管理的打好基础,同时指导广州地铁内部连续性管理水平的稳步提高: 通过灾备项目的实施,配合建立业务连续性管理的技术框架,比如同城、异地灾备系统、“业务影响分析”、“灾难恢复预案”等; 在某公司层面,通过原有的运维制度和维护管理流程的延伸和覆盖,将同城灾备系统纳入规范化的运维管理,比如“系统巡检”、“批处理”、“系统监控”等; 在某公司层面,将原有的应急预案和应急演练延伸到与CC业务连续性管理范畴内的连续性预案和连续性演练,并定期测试和检查,确认其有效性。 正式任命的连续性流程经理,比如专职的“连续性管理经理”、兼职的“应急预案管理员”;
4.9.2 连续性管理描述 通过建立连续性管理流程,确保某公司承担服务连续性在任何风险发生的情况下都能得到满足。制定服务持续性计划并定期评审。 4.9.3 管理目的 配合灾备项目的实施,建立某公司连续性管理制度; 在某公司层面,通过原有的运维制度和维护管理流程的延伸和覆盖,将灾备系统纳入规范化的运维管理; 进行定期的风险分析和管理活动,与可用性管理结合; 在某公司层面,将原有的应急预案和应急演练延伸到与CC业务连续性管理范畴内的连续性预案和连续性演练,并定期测试和检查,确认其有效性。
4.9.4 管理范围
某公司灾备系统运营管理; 某公司灾难恢复计划维护更新; 某公司关键业务的应急方案和步骤维护; 某公司连续性及灾难恢复培训; 某公司连续性及灾难恢复演练; 某公司连续性及灾难恢复计划维护;
4.9.5 执行的效果 通过识别某公司潜在的灾难威胁及其可能的发生几率而设计的详细灾难恢复计划可以降低突发灾难对于业务的影响。 定期对于灾难恢复计划的回顾与维护以及与业务部门及时的交互将帮助业务部门更好的理解和支持某公司运维所提供的服务。 拥有灾难恢复计划的某公司将大幅提高服务的保障以及业务部门对信管部门的信心,有效的灾难恢复计划将帮助实现服务级别协议的目标。 4.9.6 与其他管理模块的关系 本部分介绍某公司连续性管理流程与某公司服务管理其他流程之间的关系和流程接口。整体的关系如下所示: • 服务级别管理 服务级别管理:连续性管理的重点在于当灾难事件发生时IT服务的快速恢复,以及相应的流程步骤和评估指标的监控,与此相关的协议、衡量标准以及成本都应该在服务级别管理流程中予以体现。 • 配置管理 配置管理:配置管理为连续性计划提供配置项信息用以进行服务弱点分析,同时也为在灾难发生情况下为恢复工作的实施提供支持。 • 可用性管理 可用性管理:连续性管理为可用性管理提供业务影响分析(BIA, Business Impact Analysis),反过来可用性管理提供了降低风险的措施以维护日常水平的运行(business as usual)。 • 变更管理 变更管理:变更管理应评估基础架构和业务方面变更对于连续性计划的影响,并且对于连续性计划的变更也应该严格遵守变更管理流程。 • 容量管理 容量管理:性能与容量管理应该为连续性计划准备和维护在容灾切换过程中需要的系统性能和处理能力。 ITSS培训
4.9.7 未来本流程重点改进点: 编号
| | | | | | | | 本期项目进行了容灾咨询,未来需要进一步完善IT连续性管理流程并落地。 | 服务连续性和可用性管理
ISO20000 6.3
确保向顾客承诺的协商一致的服务连续性和可用性在任何情况下都能得到满足 | 连续性管理流程规划(管理范围、BIA、BCP、组织与实施计划、DRP、培训/演练规范、绩效指标和报表)。 | |
本帖关键字:ITSS
|