IT运维管理是确保企业IT系统稳定运行的关键,而事件管理流程则是IT运维管理的重要组成部分。本文将基于华为公司IT服务事件管理流程,详细介绍事件管理流程的概念、华为公司事件管理流程的具体内容,以及相关规范和注意事项。
事件管理流程概念介绍
事件管理流程是指识别、分析和解决IT服务中断或性能下降的过程。其核心目标是尽快恢复服务,减少对业务的影响。事件管理流程包括以下几个关键活动:
事件检测与记录: 通过监控系统、用户报告等方式发现并记录事件。
事件分类与初步支持: 对事件进行分类,并根据分类提供初步支持。
事件调查与诊断: 分析事件原因,确定解决方案。
事件解决与恢复: 实施解决方案,恢复服务。
事件关闭: 确认问题已解决,关闭事件。
事件跟踪、监控和沟通: 跟踪事件处理进度,与用户沟通事件状态。
华为公司事件管理流程
华为公司事件管理流程遵循ITIL最佳实践,并结合公司实际情况进行调整。其流程主要包括以下几个环节:
用户提出请求: 用户通过IT热线或监控系统提出服务请求。
IT热线人员处理: IT热线人员接收用户请求,并进行初步判断和分类。
技术支持人员处理: 技术支持人员根据事件级别和类别,进行进一步分析、定位和解决。
三级支持/供应商协助: 对于复杂事件,技术支持人员可以请求三级支持或供应商协助。
事件关闭: 事件解决后,技术支持人员关闭事件,并更新TSD系统。
故障报告: 对于重大事件,技术支持人员需要提交故障报告。
故障公告: 对于影响用户的事件,需要发布故障公告。
TSD规范
TSD是华为公司IT服务管理平台,用于记录和管理事件。在TSD中登记事件时,需要填写以下信息:
用户信息: 包括用户姓名、部门、联系方式等。
问题状态: 包括新问题、已分配、正在处理、已解决、已关闭等。
紧急程度: 包括紧急程度1-4。
问题描述: 详细描述事件现象和影响。
解决方案: 记录解决方案和实施过程。
SCIM: 包括问题类别、问题原因等。
TSD规范注意事项:
机房监控、二/三级技术支持直接接到用户问题或主动发现系统问题时,都应在TSD中登记问题。
及时和详细填写Work History,记录在TSD以外对问题的判断和解决过程。
问题传递给后一级技术支持后,后一级技术支持要及时接管问题。
解决完问题后,需要及时关闭问题,并使用FIXED状态。
问题被关闭后,不能轻易重新打开,除非的确是问题没有解决。
一级支持在TSD中记录问题时,记录信息要准确并尽可能详细。
二级支持接到热线问题后,要尽快响应、及时处理。
二级支持可以直接接到的用户问题和主动发现的系统问题,都应在TSD中进行登记。
解决方案填写的要求:注意需提供问题的解决方案(方法),不能简单地填写“已处理”、“已OK”。
事件的跟踪、升级
对于复杂事件,需要及时跟踪和升级,以确保事件得到有效解决。华为公司制定了《IT问题升级及管理制度》,规定了事件升级的条件、流程和责任人。技术支持人员需要及时知会热线故障进展情况,并按照规定进行事件升级。
故障报告管理制度及注意事项
对于重大事件,技术支持人员需要提交故障报告。故障报告需要按照规范格式填写,并在故障发生后3个工作日内提交审核。故障报告管理制度规定了故障报告的提交范围、审核流程和处罚措施。
故障公告管理规定
对于影响用户的事件,需要发布故障公告。故障公告需要按照规范格式填写,并选择合适的发布方式。故障公告管理规定规定了故障公告的定义、相关责任人、发布方式、发布流程和发布原则。
案例库建设
案例库是技术支持向用户提供有效IT支持、帮助用户提高自助式服务能力的知识库。技术支持人员需要及时总结、维护中英文案例,并按照规范格式进行编写。
IT运维管理是企业稳定运行的重要保障,而事件管理流程则是IT运维管理的核心环节。华为公司的事件管理流程遵循ITIL最佳实践,并结合公司实际情况进行调整,确保了IT服务的稳定性和可靠性。通过TSD系统、故障报告、故障公告和案例库等工具,华为公司实现了对IT事件的全面管理和跟踪,有效提高了IT服务的响应速度和解决效率。
IT运维管理是一个持续改进的过程,华为公司需要不断优化事件管理流程,提升IT服务质量和用户满意度。未来,华为公司将继续探索新的IT运维管理工具和技术,以应对日益复杂的IT环境,为企业提供更加优质和高效的IT服务。
IT运维管理:ITIL先锋论坛—Huawei公司IT服务事件管理流程.pptx
(1.62 MB, 下载次数: 1)
|