Solo 发表于 2012-4-6 09:42:09

事件管理流程最佳实践探讨

学习资料: ITIL培训基地专家讲堂直播 300期视频回放




事件管理流程最佳实践探讨

1、引言
  大多数用户一直持续不断的在信息化建设方面投入大量的人力和物力,也取得了一定的成效,提高了业务人员的工作效率、业务流程电子化。但是,这仅仅解决了信息系统从无到有的基础设施和系统的构建,越来越多的用户开始重视系统建设完成之后的维护。
  用户逐步意识到了高效的运行维护能保证IT系统的高效运维从而更好的为业务提供服务,获取更高的回报。对运行维护不够重视的用户,业务系统中断不能做到提前预警、管控IT系统不能智能化、信息中心运维人员处于时忙时闲的状态,在极大的程度上影响了业务系统的运行效率。
  对于大部分信息化建设已经到达一定高度的用户而言,IT系统的复杂性促使他们步入IT服务管理时代。严格按照IT服务管理领域的标准ITIL来建立的IT运维管理平台,通过对IT服务进行良好的管理来达到IT与业务的真正融合。一个好的IT运维管理平台通过各流程环节的工单形成IT服务的闭环管理,将人员、流程和技术有机地结合起来,将管理、监控和考核有机地结合起来,提升用户整体的运维管理水平。
  为此,中国石油在加油站管理系统的建设规划中,建立高效、规范的IT运维管理体系,从而实现以业务为核心的IT运维管理平台,提高信息部门的IT运维管理水平,改善企业IT系统的运行质量,为企业打造核心竞争力提供助力。以期实现如下运维目标。
  较高的系统运行可控性;优质的系统运行维护服务;全面、及时的技术支持服务;有效的系统运行风险控制;提高运维质量及效率、降低运维成本。
  2、运维需求
  需求是运维体系及运维流程设计的基础,根据中国石油加油站管理系统的特点,结合中国石油加油站管理业务及IT管理现状,有效支持加油站业务的开展;确保系统稳定高效运行;保障服务质量,是中国石油加油站管理系统建立运维平台的核心需求。
  2.1业务支持
  业务工作支持指对销售公司、省公司、地市公司及加油站用户提供业务操作指导、角色及权限管理、业务改进需求整理和系统运营状态监控等。这部分工作主要由业务部门负责。
  2.2系统运维
  系统运维包括对数据中心服务器、存储及网络设备的维护、加油站硬件及网络设备的维护以及对应用系统的维护。硬件、网络设备维护工作主要包括设备配置、故障处理和性能维护等;应用系统的维护包括系统技术支持、系统配置、缺陷修复、功能提升和性能维护等。
  2.3基础运维
  基础运维是保障运维服务可用性的各种基础服务,包括7×24小时帮助服务台、保障运维工作有序有效进行的事件管理、问题管理、变更管理、发布管理和配置管理流程,以及对供应商管理和知识库的管理等。
  3、运维管理体系
  3.1 IT成熟度分析
  进行IT成熟度分析,对中国石油IT服务管理的现状进行评估,可以了解与ITIL最佳实践的比较,当前的执行情况如何,然后确立期望达到怎样的IT服务管理水平,正确意识到提升流程有效性所要面临的问题等。如图1所示是Gartner IT成熟度模型。

点击图片查看大图
articles/articleimage/20123/129775605912187500_new.jpg点击图片查看大图
图1 IT管理过程成熟度模型
                                                                                                   表1 IT成熟度阶段划分
articles/articleimage/20123/129775608100000000_new.jpg  中国石油的信息技术应用,经过近几年的快速发展,已经进入第四阶段,并逐步向第五阶段迈进。
  3.2 运维对象分析
  从中国石油加油站管理系统整体架构可以看出,运维体系需要管理的对象可以分为四层,自下而上分别为:

点击图片查看大图
articles/articleimage/20123/129775609305937500_new.jpg图2 加油站管理系统总体架构  3.2.1机房环境及链路
  加油站管理系统的机房环境及链路的运维主要包括中心机房环境、中国石油主干网络链路及加油站的外网链路。
  3.2.2硬件、存储及网路系统
  加油站管理系统的硬件、存储及网路系统的运维主要包括小型机、PC服务器、存储设备、网络设备、加油站设备等。
  3.2.3中间件、数据库及集成平台
  加油站管理系统的中间件、数据库及集成平台的运维主要包括应用服务器中间件、数据库管理系统、硬件及网络监控系统、集成平台等。
  3.2.4应用系统
  应用系统包括总部HOS系统、站级系统、卡系统,涉及的省市公司32个、遍布全国的加油站17000余座,IT应用成熟度存在一定差异。
  3.3运维体系设计
  通过对中国石油IT成熟度的分析,结合加油站管理系统的应用特点,加油站管理系统运维体系分为三级,省级运维中心提供的一级维护、总部运维中心提供的二级维护、第三方厂商提供的三级维护。
  一级运维由省级运维中心负责,人员由各省公司及相关方技术人员组成,主要面向加油站、地市及省公司用户。总部运维中心按实际运维工作需要派出人员现场支持。
  二级运维由总部运维中心负责,主要面向销售公司用户,并对一级运维提供技术支持。
  三级运维由软硬件供应商、专家中心和加油站前庭设备供应商组成,为二级运维提供技术支持。运维体系架构如图3所示。

点击图片查看大图
                              articles/articleimage/20123/129775609537187500_new.jpg图3 三级运维体系架构  4、运维管理流程
  4.1 ITIL运维管理流程
  ITIL(Information Technology Infrastructure Library 信息技术基础设施库)是IT服务管理的国际标准库,已被业界广泛接受和应用。它提供了IT管理的知识框架体系,主要用于IT服务运营阶段(及运行维护阶段)。ITIL是以流程为导向,以客户满意和服务品质为核心的IT服务管理最佳实践。
  ITIL的服务管理分为两大部分:
  (1)IT服务支持管理(IT Service Support),是基础性的管理流程,可以看作是ITIL日常操作(运营)层面的部署,涵盖了功能和操作过程,目的是让使用者可以顺利得到相关的IT服务。IT服务支持管理流程的实践,是解决目前我们集中化IT运维模式面临的问题中最需要关心的问题。
  IT服务支持管理,分为服务台、事件管理、问题管理、配置管理、变更/发布管理、具体流程如图4所示。
点击图片查看大图
articles/articleimage/20123/129775609714687500_new.jpg图4 IT服务支持管理流程  (2)IT服务提供管理(IT Service Delivery),属于提高性的管理流程,围绕着IT策略过程,更多是体现于ITIL在企业运营战术方面的IT部署。
  IT服务提供管理,分为服务级别管理、IT服务财务管理、IT服务连续性管理、能力管理和可用性管理。

  4.2基于ITIL运维管理流程设计
  ITIL管理理论,可以帮助我们建立有效、整合的IT运维管理流程和体系,为 IT服务管理建立运营框架。根据ITIL理论,IT服务的提供是技术设施、流程和人员等诸多参与因素共同作用的结果。但是如何结合企业的实际,整合这些因素,解决IT集中化运维模式面临的各种问题,进而改进IT服务的输出质量和流程绩效,最终实现IT卓越运营,这就是ITIL如何落地的问题。
  4.2.1 ITIL运维管理流程的建立
  (1)建立适合ITIL管理框架的一、二、三级运维体系。
  一级运维主要负责帮助台和事件的管理,由于IT运维模式的高度集中,与各省市公司的本地支持需求响应之间的矛盾将不可避免地存在。因此,一级支持设置在省市公司运维中心,主要面向地区及加油站用户,提供现场支持服务,并为二级支持提供基础性保障。
  二级运维接受一级运维支持提出的技术支持申请,负责对一级运维的集中管理,主要负责问题管理、变更管理、配置管理、知识库管理、日常管理等。
  三级运维面向二级运维解决业务应用、软件系统等问题,面向一级运维解决加油站硬件设备故障等问题,同时,硬件供应商负责硬件的日常维护,相关软件升级,零部件更换,维修并提供技术服务,软件提供商负责软件的缺陷修复、功能完善并提供技术服务。
  (2)面向服务对象,梳理各类IT支持服务需求,建立闭环管理的IT服务管理流程,IT服务管理理念的核心是将传统的IT系统维护支持作为一种IT服务的提供,对内,进行流程化管理,将各种支持活动流程化,有利于提高效率,计量绩效;对外,将各种维护支持活动打包成服务,有助于计量和提升IT服务的价值。
  (3)整合ITIL运维管理需求,完善运维电子化支持体系,要实现ITIL服务管理所有流程的电子化管理十分困难,ITIL运维电子化体系的实施,同时也意味着IT服务管理流程的固化和实施保障,因此优先选出可能见效最快的几个流程进行电子化支撑,取得效果后再逐步完善和支撑其它的管理流程。
  4.2.2建立ITIL运维管理流程的质量保证体系
  ITIL管理理论解决的是“做什么”的问题,解决不了怎么做的问题,质量保证体系要达到如下目标:
  (1)识别核心流程,优先实施有助于解决IT部门主要问题的流程;
  (2)帮助对绩效过程进行量化,从而作为绩效考核的依据;
  (3)持续改进的管理思想,有助于不断提高IT服务管理水平;
  (4)提供体系化的分析问题、解决问题的方法和相应的统计分析工具。
  4.3运维管理流程实践
  中国石油加油站管理系统运维平台的建设,通过SM7(Service Manager 7.11)的实施,实现功能如图5所示。

点击图片查看大图
articles/articleimage/20123/129775610033437500_new.jpg图5 运维流程管理平台总体架构图  在运维流程管理平台中,包含了事件管理、问题管理、配置管理、变更管理、知识库管理的实现。涵盖了IT服务支持的全过程,各模块相对独立,完成各自相关功能需求,又互相关联,共同完成加油站的运维服务管理。未来所有的运维实践都可以作为知识固化到平台中,为运维人员解决实际问题提供了大量的参考。
  4.3.1事件管理流程设计
  事件管理的应用结合了中国石油用户的特点,事件管理流程在标准流程的基础上进行了拓展,在一级运维和二级运维之间形成了事件受理到事件结束的闭环流程,轻松解决了总部和省市公司二级运维之间的矛盾。

点击图片查看大图
articles/articleimage/20123/129775610313593750_new.jpg图6 加油站管理系统事件管理流程  通过对事件管理流程的细化,将事件的管理在总部和省市公司两级运维中心完美结合,在集中和分散之间找到了切合点,对加油站管理系统的业务支持、系统运维和基础运维提供高效、便捷的技术服务,结合问题管理、变更管理、配置管理、知识库管理、日常管理、报表及其它管理等功能,以及系统集成的实施,为中国石油加油站管理系统提供运维技术支持服务,并为持续改进管理,不断提高IT服务管理水平奠定了基础。
  4.3.2系统集成应用
  通过与相关系统的集成,报表系统的应用以及第三方厂商工单反馈接口的开发,进一步完善了运维电子化支持体系。
  4.3.2.1与美信监控系统的集成
  运维流程管理平台提供专门的Connect-it实现和美信监控管理平台紧密集成,不仅可以接受监控管理平台发送过来的事件、自动进入流程处理,而且当问题解决后运维流程管理平台还可以向监控管理平台进行事件的更新、状态同步等操作。形成处理的闭环操作。
  当监控平台发现异常和告警时,故障事件传给运维流程管理平台,形成票单。监控管理平台还可以接受SM7输出的事件,在监控管理平台主控台执行脚本和命令行等。
  4.3.2.2与AD(Microsoft Active Directory)的集成
  在运维流程管理平台和AD域之间,通过集成定制,运维流程管理平台需要对人员身份认证时,将人员信息传递给认证代理,通过认证代理自动在两个AD中搜寻人员身份信息,达到认证的目的。
  4.3.2.3与短信平台的接口
  运维流程管理平台与短信平台接口集成,可以实现双向的手机交互。IT运维流程管理平台中分配工作任务、事件升级时,可以向相关人员发送短信。便于运维人员能够随时了解分配给自己的任务和事件的动态。运维人员收到手机短信,可以根据业务要求决定拒绝还是同意,按照预先确定的格式返回信息,SM7识别信息后更新工单的状态。
  4.3.2.4与邮件系统的接口
  运维流程管理平台通过Connect-IT for Microsoft Exchange与Microsoft Exchange集成,可以实现邮件的交互。提供多种途径把关键信息及时通知给相关人员。可实现分派通知、延期通知、预警通知等。
  4.3.2.5与Call Center的语音设备集成
  CTI设备都提供与第三方设备的标准Web Service接口,运维流程管理平台可以采用标准的Web Service调用与CTI的应用软件集成。当PBX传递客户呼入的电话号码后,坐席员摘机,即可通过集成接口,可以将电话号码传递给运维流程管理平台,到运维流程管理平台中搜索电话号码,完成一次呼入的动作。
  4.3.2.6集成报表系统
  运维流程管理里平台提供一个独立的多维分析报表系统-iMIPS。
  iMIPS报表系统预置了IT服务管理的常用报表的演示报表,提供了涵盖IT服务管理多个流程的分析报表(帮助台/事件管理流程/问题管理流程/配置管理流程等)。这些演示报表即可以作为需求分析阶段进行沟通交流的有力辅助,也可以根据用户的需求进行简单定制为所需的报表。
  4.3.2.7第三方厂商工单接口
  为了解决到第三方厂商工单处理效率,减轻服务台工作量,在流程管理平台实现第三方厂商工单反馈功能,要求第三方厂商在提供保修、支持等服务后能通过一种安全的方式更新相关的事件工单。运维流程管理平台SM7系统与用户采用邮件来进行交互,交互信息的安全由中石油的邮件服务器系统来保证。
  4.3.3应用价值
  实现运维数据的集中管理,使分布在各地的运维人员形成一个虚拟的团队,了解运维事件的历史处理情况,便于对系统故障进行判断和分析;利于运维知识的分享,提高运维团队的整体技术水平。规范了运维管理流程,加油站管理系统的运维工作量大,规范的运维流程可保障运维工作有序有效进行,加快运维需求的响应速度。满足三级运维体系工作需要,充分考虑分级运维机制,能够根据运维人员的所属地域分配相应的工作和权限。加油站、省、地市公司用户可通过自助网页进行信息交互,查看操作问题等知识。同时平台充分考虑了系统的可扩展性,可扩展支持多业务系统,比如油库、一配、二配等系统的销售业务运维管理。
  5、结论
  (1)运维体系及运维流程的设计必须是以客户的需求为导向的,客户的需求又是以IT成熟度和运维对象为基础的,ITIL只是通行的国际标准,完全照搬ITIL的体系和流程设计未必就是适合自身企业的最佳实践。
  (2)中国石油加油站管理系统运维体系及运维管理流程的设计借鉴了国内外最佳实践,结合自身特点,三级的运维体系设计;有选择的运维流程应用;事件管理流程的两级完美整合;与各种外部系统的集成应用;集成报表系统及第三方工单反馈接口的开发,相信将成为国内领先的最佳实践。



发表时间:2012-3-31 张曦 程建坡 夏群玉 来源:万方数据



xuwei_itil 发表于 2012-4-6 13:02:00

hping 发表于 2012-4-9 21:33:21

HP还和美信有合作?怎么不用自己的openview呢

用心承诺 发表于 2014-3-31 23:24:49

佩服佩服!

凌冷妖 发表于 2014-4-1 01:31:11

秀起来~
页: [1]
查看完整版本: 事件管理流程最佳实践探讨