学习资料: ITIL培训基地专家讲堂直播 300期视频回放
ITIL V3和六西格玛之间的关系,简单的关键点,ITIL V3我们说是五个管理领域,对于六西格玛出去的话,两大术语,解决质量问题不是把所有问题都解决,要找到关键质量要素,解决这个路径是什么?哪个是核心点?
下面我会和大家探讨这些话题,第一是ITIL服务进行时,ITIL在国内已经有几年历史了,今年我们的水平是怎样的,我分享一下自己的体验和心得。第二谈一下面对今天的挑战和机遇,如何用六西格玛这种传统的进行质量管理的体系进行优化。最后分享一下服务管理的间断实践。
首先看进行时,我的体验是自动化已经进入普及阶段,我所接触的客户,中大规模的客户已经采用了各种各样的自动化管理工具进行系统监控和维护,服务概念已经深入人心,很多机构或多或少采取流程化的概念进行日常运维管理,在有些机构里已经有专门服务部门,IT服务经理负责对IT服务和业务部门的沟通,所以自动化和服务理念已经深入人心。但还是面临这样的问题,这两点是我在和客户聊天的时候告诉我的,一方面服务水平,很多单位有了服务水平,但是问题是说业务部门会有疑问,你说你达标了,我的系统下一个订单还是慢,你定的是什么服务水平?再一种问题是说我们有了ITIL,甚至有些单位采用自动化的服务台工具来辅助自己ITIL的流程,当建立这个流程之后,在IT部门、业务部门建立了共同沟通的一点,但还会有问题,这是一位CIO告诉我的,这是他们业务领导对他们的评价,首先你们的报告显示出你们缩短了故障相应时间,KPI减少了,但我的问题是你们故障解决了没有?你们ITIL实施一年多之后态度好了不少,但如果问题解决不了,业务部门的意见还是很大。我不知道在座各位,无论是ITIL的实践者、提供服务的人还是您是最终用,大家有没有遇到类似的疑问?
下面这组数据是Compuware在中国市场做的服务等级的调查,前面是我自己和客户交付的体会,通过这组数据是不是有一些结论出来。第一点,81%的机构采用了正式的服务等级协议,概念深入人心,但是有26%的时间里无法满足这个协议。原文写的是74%的情况下大家都满足协议,但我们要找到问题,26%的时间里是不对的。68%的中国受访者表示,通过联机仪表提供实时的服务水平信息。我们在自动化水平上是世界领先的。第三行,有64%的受访者,没有定期向管理层提供服务水平报告,大家可以看到,比任何区域都要高,很有趣,我们买了最多的工具,但是我们产生了这么多报表不给管理层看,IT服务管理最基本的就是IT、业务部门之间进行沟通及这是最基本的原则,但问题在哪?从这个调查我们得到一个结论,现在我们的IT服务管理里的现状是说,我们已经积累了大量数据,采用大量技术手段,但定义KPI的时候,是以业务脱节的KPI,所以谈到服务管理,最核心的就是让客户满意,我们的现状仍然不容乐观。这是我提出的一个问题。在这里我们停一下,大家记住这个问题,我的结论是说,我们的大量技术手段没有和业务关联,所以客户不满意。
今天我的主题是运用六西格玛在IT服务管理之中,我们谈一下六西格玛,六西格玛是什么?我相信在座各位对六西格玛在国内的开展时间院院长于质量控制、长于ITIL本身,在座有不少是六西格玛的专家,我从IT角度简单讲一下。六西格玛又叫系统差,是质量评估体系,最通俗的理解可以说是百万件产品中有多少次品,以前我接受培训之前,一直觉得是IT成熟度一样,看了之后才知道不是。第二它提供的是稳定的业务产出和流程统计分析工具,根据客户和市场需求来评估产出。我们看两个关注点,六西格玛研究的不仅仅是平均,而且是波动,举个例子,KPI大家可能会经常关注一点叫故障响应时间,选最长还是最短?我们通常选平均,载质量管理体系中,六西格玛认为平均数不反映质量值,举个例子,如果你的平均响应时间,有人很快,举个例子,是10分钟,有人一分钟响应,有人半小时响应,很可能半小时响应的是六成,平均值是达标的,但是客户可能是不满意的,因为他赶上态度好、能力强的人才会响应快,大部分对他的服务是不好的。六西格玛追求的是第三张,就是所有人集中在一点,系统波动是最少的,所以六西格玛关注的是质量的持续提高,并且是质量误差是最精确的。
谈到质量控制,不要误解为度量体系,也是持续改进的方法论,其中包括定义、测量、分析、改善、管理,英文DMAIC,我在国内六西格玛的从业者包括老师,大部分是制造业出身的,有一套国内的建成叫做定测试改控。第一要精确,第二是持续改进的方法论。ITIL V3与六西格玛,ITIL V3提到了和其他的管理控制框架的兼容,尤其是指其中在持续服务改进方面,他们的关系是ITIL建立了一致性的流程,六西格玛通过消除缺陷来提高服务质量。
通过这样的表格希望给大家更清晰的概念,ITIL V3和六西格玛之间的关系,简单的关键点,ITIL V3我们说是五个管理领域,对于六西格玛出去的话,两大术语,解决质量问题不是把所有问题都解决,要找到关键质量要素,解决这个路径是什么?哪个是核心点?这是强调的第一概念,CTQ,第二是DMC。他们俩的功能对于使用者来讲,ITIL定义的是指导方针,做什么,在六西格玛提供了一系列工具告诉你怎么做。比如VOC,谈到服务质量改进的时候,改进哪各环节,改进哪些流程,哪些KPI是对客户影响最大的,所以VOC是第一重要的。第二怎么找到CTQ,通过帕拉多图,帕拉多是意大利经济学家,意思是影响质量80%的是那20%的构建。
我总结两点,一个是VOC,对于六西格玛在ITIL中的实施要强调重视的是VOC。再一点,持续改进服务DMAIC。今天定义的服务水平之所以失败,是因为定义的服务水平都是资源类的,是流量、网络响应时间甚至是进程可用性时间,我们没有按照业务和业务逻辑定义服务水平,这就是答案。我们忽略了VOC,我们忽略了客户的体验,比如说您的单位建立了ITIL流程,什么时候动用技术支持的小组人去上?自动化工具的告警,大部分都是集中在资源层面,有了这些告警之后我们投入人力解决问题,但是不是真的影响客户感受的?最影响满意的?不一定,这就是我提出的调查结果,我们觉得问题所在,就是没有建立和我们的用户来建立沟通的度量体系,来提高服务等级。
下面举个例子,这是在国内实施的真实案例,谈ITIL实施和IT服务实施的时候,更多关注流程的质量控制改造,大家可能觉得您的单位已经实施了ITIL,其中涉及流程、人员已经太多头疼的事情了,我们听说做六西格玛也是这套,会不会更头疼,给我ITIL之后又给了我六西格玛,实施起来会不会很虚。在这个客户系六西格玛实施、持续改进包括两方面,一个是流程持续改进,据个运维层的例子,让大家看到六西格玛在IT服务中的应用并非不可触及。我这里看D、M、A三个部分,第一要解决的问题,定义应用的性能提高,这句话不是定义,这句话无法执行,所以细化,第一要定义CTQ,关键交易是什么,哪个交易对你的整个应用里访问量最大,对客户影响最多。他们告诉我们是登录流程。
然后第二定义问题是怎么衡量这个登录流程,用户体验,我们不靠流量、交易量、点击率。当有一个人点登录的键的时候,到看到界面是多长时间,他们定义5秒钟。第三定义应用流程,就是登录过程中会有哪些相关交易、执行哪些具体的框架、哪些GSP会调用,十分具体。这是定义。测量两个角度,一个是测量用户体验,采用了相应技术手段,帮助他感知用户体验。最直接的方法是问卷调查,问卷调查是成本比较高的方式,这里我们用了一个工具的方法。
第二是测量支持这个交易的相关资源的服务。第三步是分析结果,第一你要知道故障根源,然后提供一系列解决方案,要选择其中一个最佳解决方案。提高的过程,在测的阶段我们找到了根源了,然后采取最佳解决方案解决了。当有缺陷重复出现的时候,就要考虑如何改进,我们提的建议是除了改进服务流程、支撑系统之外,我们建议在建立负载测试,这不是我们国内通常说的压力测试,模拟交易量、虚拟用户,不是这样的。
当你把压力加上去,看到后面所有的网络的变化、应用服务器的变化、数据库的变化,每各里面如何运行的,采用相应检测手段,国内已经有丰富的检测手段,部署在上面进行持续改进,最后是控制,体现在三个方面,一个是主动监控,第二是有关服务水平和用户管理的告警管理方式,今天如果客户体验不好才是真正的告警,才让您的小组真正投入运行。而且正因为知道了用户体验的感觉不一样,才会知道什么事情对业务影响最大,投入最大的应急度。最后一点控制是把交易监控和分析纳入变更控制,当系统有变更的时候要考虑影响。
我讲了运维层面的例子,在六西格玛的应用。下面看几张图,这个客户是金融类的客户,这是真实的交易,控制过程中发现有两个告警,是基于客户响应时间的,他们定义5秒,时间低了,一个是6.98,一个是6.56,影响用户是71个,是71K用户,这是查询。另外一个交易4007.08,这是更关键的交易,我为什么提这点,大家学过ITIL,是不是记得在事件管理里,平时怎么定,都是预定好的,什么事件影响力大的。只有有了真实用户感知工具之后,这才是基于用户体验的。
在这里实现了定义,下一步定位问题,我们部署的工具会有故障域,最多的是数据中心。确定根本原因的时候,点开交易,里面每一个UIL和时间段内的交易,我们得出结论,大部分都在页面加载时间,是服务器处理问题。进一步通过相应的工具分析服务器信息,现在大家看到这个界面是把每个外部应用交易显示出来,可以深入挖掘。会告诉你是什么应用,每个JAVA的方法占用资源是多少,定位到占资源的方法,深入挖掘到数据库语句,这就是实例的几个相关的截图。我为什么讲这个例子,六西格玛在这里主要的不同,不仅仅关注运维,关注问题解决。
总结,DMACI在ITSM的要点,以客为尊,第二是80/20原则,第三是确定关系,大家看下面这张图,这是业务影响分析和服务建模的过程,要把交易和支撑它的子交易以及硬件网络做一个影射,这是我们说的业务服务管理内容,这是流程图。最后是持续改进,对IT人员是天天都见的。最后做一个总结,传统的IT服务管理里,从底层监控开始,先部署一些监控工具,然后做ITIL、Service,然后做BIZ,服务影响、服务等级管理。但基于这样的概念,很容易得出一个结论,所有问题都是资源问题,一年统计下来,应用相应时间慢,什么原因?CPU利用率过高,扩CPU吧、升级机器吧。
Compuware基于六西格玛也建议大家从业务角度出发,看运维、每一个故障、服务流程改进,最后才是体系架构,因为通常上,统计表明,大部分影响您的性能和可用性问题都在应用上,其次在流程上,客户抱怨很多都是升级资源,时常不解决问题。以业务为核心也是Compuware的定位,我们认为从业务出发,有用户体验管理工具还有业务影响分析的工具以及最佳实践和方法论。同时六西格玛也是内制在Compuware里的一种技术,包括客户需求分析,帕拉多图、控制图和服务建模,在我们这里都是内制的功能,可以让大家简便的实施。我在接受六西格玛的培训的时候,制造业的
人在获取这些数据的时候,都是调研,找工人、质量控制小组、车间主任、销售这些人坐在一起头脑风暴。最后看一张图,这是Compuware真实的数据在六西格玛的应用,第一我们定义有什么关键应用,如何定义质量状况、影响多少用户、这些用户体验差了多少。这是帕拉多图,资源角度看可以、部门角度看可以,可以从地理位置看,这样知道哪的问题最突出,解决哪的问题。这是六西格玛实际应用历史机的案例,这是封装好的软件产品,加上相应的实施方法论,可以短期内实施效益最大化。
最后总结一下Compuware关于六西格玛在IT服务例的最佳实践,第一是以客为尊,第二根源分析,我们实施的ITIL都做了事件管理,六西格玛要解决问题,这样是最省成本、最有效的方式。第三持续改进,Compuware作为IT服务管理的市场后来者,也希望把我们的全球以及在国内取得的成功经验带给与会诸位,谢谢大家的时间,谢谢。(编辑:坚定)
|