20150730 淡然 续上
3 内容 3.1 流程介绍 事件管理流程在信息部设立的主要功能是尽快解决生产/运行环境中出现的事件,保持IT环境的稳定性。通过对事件进行登记、分类、分级、状态跟踪、关闭确认等手段建立一个事件管理流程的闭环,从而对事件的处理过程进行监控和优化,在成本允许的范围内尽快恢复服务,提高客户满意度。 ITSS考试 事件管理流程还提供一个日常接口,提供关于服务状态的信息更新,定期对事件信息进行统计和分析,了解事件的分布和发展趋势,努力降低事件响应时间和解决时间,提供优质无间断的IT服务。
3.2 角色和职责 在深圳供电局的事件管理流程中,主要的角色有四个:服务台、一线工程师、二线工程师、事件经理。 [td] 编号
| 角色
| 职责描述
| 交付物
| 1
| 事件经理
| l 确保有效协调资源,通过一、二线工程师快速恢复正常服务状态 l 出现紧急、重大事件时,负责协调外部资源尽快解决事件 l 确保事件管理支持人员的适当技能水平和绩效表现 l 确保和问题管理、外部供应商等部门的有效合作 l 确保事件的快速解决 (从客户的角度看,提高了可用性) l 确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题 l 确保有关IT服务和客户支持的管理信息的可获得性 l 改进和提高事件管理流程的有效性和效率 l 提供相关的事件统计报表和趋势分析
| l 事件管理流程 l 事件统计分析报表 l 重大事件判断标准 l 事件分类规则 事件优先级
| 2
| 服务台
| l 接受用户的事件申告,对事件进行确认 l 接受巡检上报的故障事件,进行登记 l 确保所有相关事件信息都被正确登记 l 对登记的事件进行分级和分类 l 直接为用户提供相应的解决方案 l 将事件分派给适当的一、二线支持工程师 l 与服务请求的提交者或其他相关用户进行直接的沟通,通报问题的处理情况 l 跟踪事件的处理过程以确保在规定的时间内解决问题 l 事件解决后,在系统内关闭该事件之前进行确认事件已解决 l 结束事件,更新信息 l 作为事件的所有者, 监控,跟踪所有的事件, 并作为和客户沟通的唯一联系点 l 必要时进行事件升级
| l 用户申告记录 l 巡检上报 l 班前班后会
| 3
| 一线工程师
| l 接受服务台转交的事件,对事件进行处理 l 确定和协调必要的动作来处理相关事件,进行技术支持,比如为用户提供现场支持等 l 把事件的影响降到最小,并确保快速恢复到正常服务水平 l 收集有关事件解决方案的历史数据 l 事件的调查和诊断 l 根据解决方案进行IT服务恢复 l 将事件的解决步骤文档化,并录入知识库系统 l 如事件无法解决, 将事件转发二线工程师支持 l 如事件无法解决, 将事件转发给原厂商/开发者支持 l 如事件无法解决, 将事件升级,寻求事件经理支持
| l 服务台 l 事件管理流程
| 4
| 二线工程师
| l 接受服务台转交的事件,对事件进行处理 l 确认事件的分类、分级和关联配置项 l 确定和协调必要的动作来处理相关事件,进行系统恢复,比如为用户提供现场支持等 l 把事件的影响降到最小,并确保快速恢复到正常服务水平 l 收集有关事件解决方案的历史数据 l 事件的调查和诊断。 l 根据解决方案进行IT服务恢复。 l 将事件的解决步骤文档化,并录入知识库系统。 l 如事件无法解决, 将事件升级,寻求事件经理支持。 l 确定和协调必要的动作来处理相关事件,组织相关资源恢复服务
| l 服务台 l 一线工程师 l 事件管理流程
| 5
| 事件专家组
| l 接受和处理所有紧急、重大事件 l 把事件的影响降到最小,并确保快速恢复到正常服务水平 l 制定有效的解决方案和规章制度,尽可能降低紧急和重大事件的发生概率
| l 服务台 l 一线工程师 l 事件经理 l 事件管理流程
|
3.3 流程触发条件及输入输出 3.3.1 流程触发条件
[td] 编号
| 触发条件
| 来源
| 1
| l 用户通过热线电话提交事件申告 l 用户通过邮件提交事件申告 l 用户通过ITSM系统提交事件申告 l 巡检发现的相关故障
| ITSM流程、电话等系统
| 2
| l 班前班后会总结
| 线下
|
3.3.2 输入 ITSS认证 [td] 编号
| 输入项
| 1
| l 深圳供电局IT服务现状
| 2
| l 当前业务运维需求
|
3.3.3 输出 [td] 编号
| 输出项
| 1
| l 重大事件判断标准
| 2
| l 事件分类规则
| 3
| l 事件优先级定义规则
| 4
| l 事件统计报表(周报、月报、季报、年报)
| 5
| l 知识库
| 6
| l 周期性流程改进建议
|
3.4 流程描述 3.4.1 流程综述 事件管理流程在执行过程中需要遵循以下要求: l 服务请求应接收、记录、优先级划分和分类 l 应有一线解决方案和事件转交说明 l 应对安全问题进行考虑 l 事件须进行追踪和生命周期管理 l 事件需验证和关闭 l 要有事件升级的机制 l 可以通过电话、语音邮件、直接访问、和电子邮件的形式来报告安全事故,也可由用户直接访问事件记录系统直接提交申告,或由监控系统自动上报告警事件 l 所有的事件均应可以追溯和分析相关信息 l 应同事件影响对象及时沟通事件解决的过程,要在事件记录中记录所采取的全部措施 l 应为处理人员提供更新的知识库 l 可能的情况下,为用户提供保持业务连续的方法,即使提供降级的服务,降低对客户的影响。如果原因未诊断清楚就已经建立新的现场,那么就应该记录详细的细节,供后续的诊断和类似事件发生时使用 l 只有当申报用户正式确认事件已经解决并且服务得到恢复的情况下,才能认为事件已关闭 l 对于重大事故,应清晰规定什么情况下构成重大事故,以及谁被授权对正常的事件进行处理或变更 l 任何情况下,均要明确指定一名管理者对重大事故负责 ITSS培训 l 重大事故的管理者应被授予独特的权利等级,确保可以充分协调资源实施解决方案 l 重大事故必须包括评审,评审的结果可以作为服务改进的输入
本帖关键字:ITSS |