monicazhang 发表于 2015-7-20 14:25:29

问题管理的基本范围和ITSS概念

20150720    淡然


1       问题管理

1.1    问题管理的目标
问题管理的目标是最小化事故的不利影响以及由于IT基础设施中的错误造成的业务上的问题,阻止与这些错误相关的事故的重复发生。为了达到这个目标,问题管理寻求找到事故的根本原因,采取行动改善或纠正这种状况。                   ITSS培训问题管理流程具有主动和被动两个方面。被动的问题管理关注于解决问题以响应一个或多个事故。主动问题管理关注于在事故首次出现前就能识别和解决问题以及知名错误。
1.2    问题管理的范围
问题控制、错误控制以及主动问题管理都属于问题管理流程的范围。较为正式的定义是,问题是一个或多个事故未知的底层原因,知名错误是已经成功诊断出来的问题,并且为之定义了临时措施。图1    问题管理的范围
问题管理流程的输入是:v       来自事故管理的事故详细信息v       来自配置管理数据库的详细配置信息v       任何定义的临时措施(来自事故管理)
问题管理的主要活动包括:
v       问题控制v       错误控制v       问题的主动预防v       识别问题趋势v       从问题管理数据中获得管理信息v       完成主要问题的评估
问题管理流程的输出:
v       知名错误v       变更请求(RFC)v       更新后的问题记录(包括解决方案和/或任何可用的临时措施)v       关闭问题记录(对于解决的问题)v       与问题和知名错误匹配的事故的响应v       管理信息

1.3    基本概念

在事故的早期阶段,能够得到相应的而且容易应用的建议,对于组织有效地解决事故的能力来说,这是最重要的。服务台接收到的事故,对于支持员工很少是初见的或是神秘的。相似地,处于二线或三线的支持员工中的专家也已经解决了许多困难和原始事故和问题。花费在这些解决方案上的资源的最好使用方式就是将它制作成文档,这样一线的员工就可以应用它们了。问题管理流程试图降低影响业务的事故和问题的数量及危害,因此,问题管理的部分职责是确保以前的信息被记录在档,这样对一线及其它二线支持员工就已经是准备好可用的了。它不是简单地记录文档的问题,它要求:v       信息应该建立索引,以便根据来自新事故的简单的线索就能容易地查找;v       进行例行检查,以确保持续的文档记录与变更相一致:u      技术u      可用的外部解决方案u      业务实践和需求u      内部技巧u      重复事故的频度和影响u      阐明内部最佳实践v       进行详细评估的流程;                                                                        ITSS认证v       训练员工使用信息,理解可用信息的深度和作用,以及怎样访问和理解信息,在提供反馈方面,信息的相关性和易于使用;v       存贮信息的知识库-典型地基于集成的服务管理工具,使得在登录后或者在事故处理流程的初始分析阶段就能使用知识。一般地使用“专家系统”软件来发挥问题管理流程的作用。然而,重要的是包括专家知识,让使用系统的员工根据反馈来更新:v       被识别的问题和知名错误;v       分析他们遇到的事故(被动问题管理);v       按时间段分析事故(主动问题管理);v       分析IT基础架构;v       提供知识库;v       引进新产品时的开发人员和提供商。
一般情况下,问题是多个展现出共同特征的事故的结果。有时问题也可以根据单个明显的事故来识别,由单个错误引起,虽然原因未知,但影响明显。
知名错误是对问题的根本原因成功诊断后识别的,后续将开发一个临时措施。
IT基础架构的结构化分析、来自支持软件的报告以及用户组会议有助于问题和知名错误的识别。这就是主动问题管理。问题控制重点在于将问题转化为知名错误,错误控制重点在于通过变更管理流程结构化地解决知名错误。
1.3.1    事故管理和问题管理的不同
问题管理不同于事故管理,它的主要目标是事故底层原因的检测,提供后续的解决方案,阻止事故的发生。在许多情况下,这个目标可能与事故管理的目标有直接的冲突,因为事故管理的目标是尽可能快的为客户恢复服务,经常通过临时措施,而不是通过彻底地解决。因此在这个方面,找到解决方案的速度是次要的。底层问题的调查需要花费时间,这样会推迟服务的恢复,但阻止了事故的重复发生。
1.3.2    问题控制

问题控制流程关注于以有效地方式处理问题。问题控制的目标是识别根本原因,诸如存在错误的配置项,向服务台提供可用的关于临时措施的信息和建议。 问题控制流程很相似于,且高度依赖于事故控制流程的质量。事故控制重点在于解决事故,提供临时措施,对特定的事故临时修复。如果对于一个或一组事故,识别出了问题,可用的临时措施和临时修复应该由问题控制流程记录在问题记录中。问题控制流程也对问题建议最佳的可用临时措施。因为问题控制关注于阻止事故的重复发生,因此流程的方法应该被仔细地管理和规划。管理和规划的程度要高于事故控制,因为它的目标只是尽快地恢复正常的服务。优先权应该分配组那些可能引起严重业务中断的问题的解决。在事故控制中的活动包括:v       问题识别和记录;v       问题分类;v       问题调查和诊断;
1.3.3    错误控制

错误控制包括的流程是,在变更管理流程的控制下,能过成功地实施变更,使知名错误得以消除。错误控制的目标是发现错误、监控错误、在成本合理且可行的时候排除错误。 错误控制是开发(包括应用开发、功能扩展和维护)和生产环境的桥梁。在开发阶段产生的软件错误会影响生产运营,在开发和维护环境识别的知名错误会被移交到生产环境。错误控制中的活动包括:v       错误鉴定和记录;v       错误评估;v       记录错误的解决(方案调查、提出变更请求);v       关闭错误;v       监控问题和错误的解决进展。在实践中,问题管理的每个流程要求仔细的管理和控制,不同的操作对象应用在不同的流程中。

1.3.4    主动问题管理
主动问题管理中各项活动的目的是,在事故发生前识别和解决问题。这些活动有:趋势分析;定位支持行动;向组织提供信息;通过将IT部门的作用从被动地解决大量事故,重定位到阻止事故,它将向客户提供更好的服务,使得IT支持部门的资源得到更有效地利用。
1.3.5    主要问题评价
通过对主要问题进行事后的评价,有助于服务的提升。                  ITSS考试


待续:http://ITIL-foundation.cn/thread-51763-1-1.html
本帖关键字:ITSS
页: [1]
查看完整版本: 问题管理的基本范围和ITSS概念