本帖最后由 monicazhang 于 2015-8-27 13:49 编辑
20150827 淡然 续上
1 介绍1.1 基本概念运维管理流程为IT服务的实施提供稳定、安全的基础。运维管理流程对监测与控制提供相应的技术支持。运维管理主要是对IT服务进行监测、服务和运行,确保IT基础架构的稳定,运维管理流程帮助其他流程实现其各自的目标,有效的IT运维管理流程是IT组织成功实施IT服务的关键成功因素。 ITSS考试 运维管理的一个主要任务就是事件处理,许多IT组织将运维看作价值附加值低的后台部门,运维的活动和角色没有得到应由的重视。但是,有效的运维人员、流程和产品支持是提供高质量IT服务的关键,没有好的运维流程是不可能提供灵活的、高可用的IT服务。 运维为IT部门提供7X24的服务监控与报告,为其他流程提供及时的信息支持和告警信息,使得问题能够及早发现和改正,直至防止同样的服务事件再次发生。自动化工具使流程高效,运维流程可以大大减少由于IT服务事件引起的业务中断。
1.2 用途和目标运维管理流程的用途是用于管理和执行交付IT服务所必需的日常操作,例如系统和数据备份、系统与网络监控、应用系统监控、运行管理等内容。备份与恢复是运维管理流程的重要工作。在本项目中,考虑到备份与恢复的重要性,专门将备份与恢复管理流程独立出来,形成《某公司备份与恢复管理流程指南》,本文档的备份与恢复部分主要是研究适用于集中备份与恢复的流程框架。 运维管理流程的目标是运行和维护IT基础设施,以确保IT服务达到预定的服务级别。 如上图所示:运维管理流程的输入包括OLA(操作水平协议)、UC(外部合同)以及现有操作步骤。 运维管理流程的输出包括警告信息、变更请求、资源利用率数据、服务衡量指标和稳定安全的IT架构。 运维管理流程的触发条件是来自上线流程的版本通知以及来源于IT基础架构的事件和资源状况。当新的或升级的应用系统经上线流程部署完毕后,上线流程将向运维管理流程发出版本通知,此时运维流程将制定相应的运维计划,应用系统进入运维阶段。此外,IT基础架构的事件和资源利用状况出现异常,运维流程将按照预定的流程做出响应,输出包括告警、变更请求等信息。
1.3 范围运维管理流程的范围包括管理和控制IT基础架构中所有的可操作组件,其中包括对每个单一组件的控制,以及所有这些组件之间的交互关系,和这些组件在提供高质量的IT服务中所起的作用。 适用范围
| 包括
| 不包括
| 事件监控
| 事件的解决、分析根本原因
| 安全监控
| 安全设计和安全流程的开发
| 存储管理
|
| 备份/恢复管理
|
| 作业管理
|
| 错误管理
| 错误的解决 ITSS认证
|
1.4 对组织的效益运维管理流程可以为CPIC的业务部门和IT部门带来效益,具体表现在以下四个方面: · 降低风险 一旦发生服务中断,维护流程执行预先建立的相应的任务使服务能够得到尽快恢复,在新的服务推广前,严格的测试同样也可以大大降低服务中断的风险。由于运维管理的集中,保证了运维的有效性,降低了业务风险。此外,通过运维安全操作,保障了系统的安全性,从而提高了业务运作的安全性,同样大大降低了风险。
· 降低成本 通过使用标准化的操作流程和工具,可以减少运维支持所需的资源,达到降低成本的目的。科学的运维管理可以减少人员工作量,从而从总体上减少运维人员,减少成本支出。 · 改善IT服务的敏捷性 标准化的运维活动帮助形成稳定的IT基础架构,稳定的基础架构是提高和增强IT服务的基础。 · 改善IT服务的质量 通过对IT组件主动式的维护和及时快速的恢复形成服务质量的全面改善。通过建立运维知识库,缩短了解决问题的时间,改善了IT服务的水平和质量,增加了客户满意度。 下面的这些风险因素将会影响运维管理流程为某公司带来的效益: [td]风险
| 原因
| 流程效果
| 预防措施
| 后续活动
| 较低的服务满足度
| 没有专注于服务和业务,对服务实施过程中涉及的组件缺乏经验和支持
| 尽管每个组件均达到了预期的目标,但总体服务满足度仍不高
| 定义完善的OLA,并有效执行
| 升级上报
| 收集事件数据花费大量的精力
| 缺乏对需求的认识,以及对运维工具重要性的认识
| 流程效率低下
| 采用合适的运维管理工具
| 增加运维人员
| 重新设计维护与恢复流程
| 流程没有形成正确的文档
| 人员被浪费,服务中断的可能性增加
| 对达成一致的流程形成正式文档
|
|
1.5 流程运行的前提和时机运维管理流程在某公司推广和实施前,应首先检查以下前提是否满足: · 已经建立适用于集中的数据中心 · 已经建立适用于集中运维的组织架构 · 有相应的人员和技能实施运维管理流程 · 现有的运维管理工具可以满足集中运维的要求 · 热线支持和突发事件管理流程,以及问题管理流程应早于运维管理流程的实施;
1.6 流程的远景下图为运维管理流程的现状和目标发展示意图,从图中我们可以看到目前的运维管理流程的成熟度为已定义级3级,未来的3年时间里争取达到已管理级4级。具体体现如下: 全公司已经建立统一的运维管理规范和流程; ·已建立了一套基本的运维管理评价指标体系,绩效测量已在运维组织内采用; · 采用关键绩效指标评价流程的绩效和相关人员的绩效; · 所有的运维管理活动均被记录、跟踪; ITSS培训 · 全公司采用统一的运维工具和方法; · IT运维对业务部门的支持被运维部门人员广泛认可
本帖关键字:ITSS |