问题控制和错误控制的ITSS不同点
本帖最后由 monicazhang 于 2015-10-28 11:50 编辑20151028淡然续上
2. 问题管理流程概述
2.1. 基本概念2.1.1. 什么是问题管理流程
问题管理流程的根本目的是消除或减少事件的发生,此流程分析发生在生产环境的事件,确定最常发生或具有最大影响的事件,找出根本原因,然后生成变更请求(RFC)、变通方法或建议的预防性措施来防止事件的再次发生。所以问题管理流程可能需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题。问题的来源:q已发生的一个或多个有共同征兆的事件 ITSS考试q系统运行期间发生的重要突发事件q系统的运行趋势分析中发现的问题问题管理的输入有:q从事件管理中得到的故障详细信息· 故障现象· 故障的处理方法和解决方案· 故障发生的频率和影响程度及紧急程度q从配置管理数据库中得到的配置详细信息· 相关的配置信息· 配置项之间的关联关系q从故障管理中得到的替代方法
问题管理流程的输出有:q解决方案q变通方法q变更请求q预防性措施问题管理的输出可以被当作知识内容用于支持前端的事件管理过程,使事件管理操作者能够通过查询历史问题的解决方案,快速的完成事件的处理,同时,问题管理应还配合事件管理,集中优势资源为没有变通方法的疑难突发事件处理提供解决支持。
2.2. 流程目的 问题管理流程的根本目的是消除或减少生产环境中事件发生的数量和严重程度,提高IT服务的可用性。此流程对发生在生产环境中的问题进行管理,找出产生这些问题的根本原因,然后根据需要通过变更请求(RFC)、变通方法或建议的预防性措施来防止事件的再次发生。问题管理流程常常需要和变更管理流程一起来实施找出的解决方案,以便从根本上解决问题。其目的包括:q分析并确定事件的根本原因,找到最终解决方案,以防止此类事件再次发生q确保问题分派了正确支持人员,提高解决率q根据问题优先级合理分派IT资源q对事件记录做趋势性分析,主动提供预防性措施q提高服务的可靠性q降低支持成本
2.3. 管理范围 问题管理主要针对华星光电IT信息中心服务运营过程中遇到的所有问题的记录、跟踪、评估、处理、回顾,以及知识共享。其范围与事件管理中事件管理范围一致。问题管理负责处理的范围包括:q来自于事件管理的重要突发事件,未能解决且无变通方法q来自于事件管理的重要突发事件,有变通方法q来自于阶段性事件总结,多个呈现相同症状的突发事件提取出的问题q来自于定期的系统分析报告的问题
2.4. 主要内容 问题管理流程主要涉及问题控制、错误控制和主动问题管理三种活动。其流程内容如下: ITSS认证
问题控制:q发现和记录问题问题控制的第一步是要发现和记录问题。所有导致突发事件产生的未知原因都可以称为问题,但我们通常只将那些重复发生的或非常严重的突发事件归类为问题。问题记录与突发事件记录类似但并不完全相同。突发事件记录强调是受影响的用户数量、影响度等信息,而问题记录则更侧重于突发事件症状、与突发事件相关的基础架构的运行情况等信息。问题记录应与相关事件关联q问题归类在查明和记录问题后,为了评估问题可能对服务级别产生的影响,应首先对问题进行归类。问题归类应当根据问题涉及的领域、影响度和紧迫性等因素进行确定,与事件管理不同,问题归类不是静态的,它在问题生命周期内可能发生调整,如,应急措施可以降低问题的紧迫性,而新出现的突发事件却可能会提高问题的影响度。q调查和分析问题问题调查是要找出问题存在的根源,因此问题调查比突发事件调查要更加全面深入,对导致突发事件的未知原因展开调查后,需要对这些原因进行分析和测试,以确定其是否是问题产生的最主要和最根本的原因。问题分析可通过多种分析方法进行,如:鱼骨图法、头脑风暴法等。
错误控制q发现和记录错误在问题控制流程查明了问题产生的根本原因,问题就转化为错误,如果同时针对这些错误提出了相关的应急措施,错误就进一步升级为已知错误,问题管理人员需要将问题标记为已知错误存放在问题管理数据库中,以便与事件管理人员共享处理信息和继续问题处理q评价错误在发现和记录错误后,问题管理人员应与其他支持人员一起对解决错误的可能方法进行初步评估,并根据对错误评价的结果制定相应的解决方案q记录错误解决过程在问题管理人员提出解决错误的方案后,错误控制流程应详细记录每个已知错误的解决过程,特别是与已知错误有关的配置项、症状和解决方案,记录的信息可保存于已知错误数据库中备查q提出变更请求发现的已知错误消除时需要改变IT基础架构时,应向变更管理流程提出变更请求,由变更管理处理变更过程q问题解决评估在实施错误解决方案或变更后,问题管理人员需要继续跟踪和监督错误解决过程,必要时应进行实施后评审来确认问题的解决效果q问题终止在确认问题和已知错误得到较好的解决后,问题管理可以终止错误控制流程。同时需要将有关问题的更新信息存入问题数据库中
主动问题管理q趋势分析趋势分析的目的是为了能够主动采取措施提高服务质量,它可以从以下几个方面进行:− 找出基础架构中不稳定的组件− 跟踪分析已发生的突发事件和问题,研究趋势− 通过其它方式和途径分析,如:系统管理工具、用户反馈、座谈会和用户调查
q制定预防措施在确定服务支持人员应重点关注的问题之后,问题管理人员就应当采取适当的行动以预防其发生。这些行动包括:− 提交变更请求(RFC)− 对服务支持人员、客户教育和培训 ITSS培训− 改进相关的流程或程序
待续http://ITIL-foundation.cn/thread-52919-1-1.html本帖关键字:ITSS
页:
[1]