20150722 淡然 续上
7. 问题管理流程简介
7.1 流程基本概念
问题管理流程是调查和分析IT基础架构的薄弱环节、查明事件产生的潜在原因并制定解决事件的方案和防止事件再次发生的措施,将由于问题和事件对业务产生的负面影响减小到最低的管理流程。 问题管理与事件管理的区别体现在以下几个方面: ITSS考试 q 问题管理的主要目标是要查明事件发生的潜在原因并找到解决此事件的方法或防止其再次发生的措施;而事件管理的主要目标是在事件发生后尽可能快地恢复客户服务,即使采取的是一些应急措施而不是永久性的解决方案; q 事件管理强调速度;而问题管理强调质量,把速度放在第二位; 问题管理流程相关的几个关键词汇解释如下: “问题”:一个问题描述了一种非预料的情况,它表示引起一个或多个现存或潜在事件的深层根源。 “复发问题”:如果新报告的问题与某个已经关闭的问题相同,该问题被认为是“复发”的问题。 “问题控制”:是一个有关怎样有效处理问题的过程,其目的是发现事件产生的根本原因并给服务台提供有关应急措施的意见和建议。 “已知错误”(Known Error)是指问题经过诊断分析后找到其产生的根本原因时所处的状态。 “主动问题管理”(Proactive problem management):是指在事件发生之前发现和解决的有关问题和已知错误,从而使事件对服务的负面影响及相关成本控制到最低的一种管理活动。通过化被动为主动,IT支持组织提供了更好的服务并提高了自身的资源使用效率。
7.2 流程目的
问题管理流程致力于“治本”,需要找到问题背后的根本原因,进而找到解决方案。具体来说,问题管理所要达到的目的包括:
q 找出问题的根本原因 q 发现、记录和跟踪在服务运营中长期存在的错误; q 记录错误症状和制定解决错误的临时性或永久性的方案; q 提出有关变更请求以要求修改相应的基础架构; q 防止出现新的事件; q 报告IT基础架构和流程的质量。
7.3 流程范围
信息与知识管理部问题流程管理范围包括所有立白集团用户IT生产环境中与信息与知识管理部IT服务相关的各种问题,以及信息与知识管理部自身IT环境中存在的各种问题。 不包括: q 信息与知识管理部内处于项目建设阶段的设备或应用系统问题;
7.4 流程主要内容
问题管理流程起始于问题识别、记录和归类,可在事件管理结束后启动(被动模式)或对事件记录的趋势分析、主动巡检发现来启动(主动模式)。该流程结束于问题记录的关闭,包括以下子流程:
q 问题识别和记录: 对于反复出现的事件或需要追查根本原因的时间等需要进行针对性研究或解决的情况,问题提出人提出问题需求并创建问题单。由问题经理对问题进行审核,判断是否真正构成问题,若不构成问题,则将此问题单关闭。
q 问题分析、分派: 若问题审核通过,问题经理对问题进行初步分析,判别可能原因,调整问题级别和分类,并分配给有能力将其解决的问题分析员,如需要多个问题分析员或组来调查问题根本原因,则建立协查任务单。问题分析员可根据实际情况,决定是否接受问题单或协查任务单,若不接受,则由问题经理重新分配问题单或协查任务单,并调整问题分析员。
q 问题调查与诊断: 问题分析员对分派的问题进行诊断分析,寻找问题根源;
q 问题协查:协助对分派的问题进行诊断分析,寻找问题根源; 对需要协查的问题,由问题分析员应组织协调其他协查任务单的问题分析员,一起对问题进行分析,调查问题的根本原因。
q 问题解决: 问题根本原因找到后,由问题分析员着手寻找问题解决方案,解决方案确定后,问题经理应评审该解决方案并根据解决方案判断是否需要建立处理任务单以用来解决问题。
q 问题关闭:
问题解决后,由问题经理(或授权问题分析员)对问题解决结果进行验证,若解决结果可接受,则关闭此问题单,并视情况提交知识库。如解决结果不能接受,则重新分配问题单。
q 问题监督:
问题经理对该问题的执行情况进行监督,对于不遵守流程的问题进行管理和协商,定期生成问题管理报表,公布问题尤其是关键问题的处理情况,督促问题完成。。
7.5 流程业务价值
信息与知识管理部问题管理流程通过预防和主动问题管理,将在多个方面对立白集团运维业务产生积极作用,具体表现在:
q 通过对问题的主动分析和管理,预防事件发生,减少IT环境的潜在风险和隐患; q 通过对问题深入有效的诊断和调查,防止相关事件的再次发生,降低事件数量; 通过问题管理流程的积累来扩充和丰富知识库内容,以支持事件管理流程缩短处理周期,提高解决率。
ITSS认证
8. 问题管理流程设计
8.1 角色和职责
8.1.1 角色说明
1) 问题分析员: 1) 接受来自问题经理分派的问题单和协查任务单; 2) 在规定的时间内调查问题根本原因,编写问题解决方案; 3) 组织和协调其他协查任务单的问题分析员进行问题分析; 4) 对于不能解决的问题提交问题经理请求第三方协助; 5) 配合其他问题分析员开展问题分析工作; 6) 提供问题的当前状态、进展和历史信息; 7) 视情况提交知识库。
2) 问题提出人: 1) 提出问题需求,并创建问题单; 2) 验证问题解决情况,并视情况提交知识库。
3) 问题经理: 1) 对问题需求进行评估审核,确认是否构成问题; 2) 根据问题具体情况,指定具体的问题分析员开展问题分析工作; 3) 跟踪问题的解决过程,必要时进行协调工作; 4) 协助问题分析员,确保所有相关人员都足够程度参与到问题管理的活动中。 5) 将关键问题的解决状态及时地通报给相应的人员和管理层; 6) 对问题解决方案进行评审; 7) 定期提供问题管理报表,督促问题的解决; 8) 确保流程标准和步骤得到遵循,对于不遵守流程的情况进行管理; 9) 鉴别流程执行过程中的例外和异常情况, 10) 鉴别流程改进点并向流程负责人提出改进建议;
4) 问题管理流程负责人: 1) 组织流程定义工作:定义包括流程目标、角色职责、环节、政策和规则等 2) 对已定义的流程进行维护、解释、宣传并协调、推动执行 3) 流程的使用者提供适当的培训; 4) 对流程的有效性和效率建立考核目标并监控; ITSS培训
8.1.2 角色映射表 角色名称
| 对应岗位人员
| 问题分析员
| 信息部门运维、开发工程师
| 问题提出人
| 信息部人员均可作为问题提出人,接受来自客户的问题需求或直接提出问题
| 问题经理
| 信息部问题管理人员
| 问题管理流程负责人
| 信息部流程分析师
|
本帖关键字:ITSS |