学习资料: ITIL培训基地专家讲堂直播 300期视频回放
CIO如何规范IT系统运维管理 提高IT管理水平
作为CIO,这两年对陈贤来说是充满挑战的两年,也是最忙碌的两年。从IT系统实施到系统上线,经历了漫长辛苦的过程。好不容易实施结束,以为可以休息一段时间了,谁知日常运维工作却越来越多,让他疲于奔命。
一直以来,公司把IT专项资金投入在着重解决从无到有的基础设施和系统的构建,然而却忽视了系统建设完成以后的运行维护。随之而来的是,信息化的运维压力和挑战逐渐凸现出来,已经成为影响信息系统应用效果的主要瓶颈。当系统进入运维期后,IT部门就像救火队一样,不知道什么时候、什么地方会出现“火”情。虽然作为CIO,一些具体的事情不需要陈贤本人去做,比如系统参数的调整,订单的排程等,但是IT 管理、系统运行维护、项目管理等工作他还是要一一过问。
作为CIO,如何在有限的投入下尽快建立高效、规范的运维体系,提高IT管理水平,改善系统的运维质量,已经成为当前CIO面临的重要问题。
IT运维被动救火,技术人员饱受抱怨
传统被动的、孤立的、分散的“救火队”式IT运维管理模式,让IT部门疲惫不堪。而且,随着公司业务模式的复杂化和多样化,更带来IT运营环境的复杂性和不确定性。在IT运维系统时,IT部门普遍面临多种问题。主要有以下几个方面:
(1)运维人员被动救火,工作效率低下
在IT运维过程中, IT员工工作太被动,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”不但使IT服务人员终日忙碌,也使IT服务本身质量很难提高,导致IT和业务部门的满意度都不高等。
其中比较典型的例如IT部门响应服务需求时没有相应的时间记录工具,或者因为各种原因导致工作人员不愿使用工具记录工作情况,这样不仅不利于知识的积累和知识库的完善,更不利于处理过程的跟踪。
(2)流程规范不足,没有形成闭环跟踪
在运维流程方面,IT部门一直处于原始的状态。例如在事件处理流程上,存在以下几种典型的问题:①没有明确的事件升级标准,例如满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到三线研发工程师处理。②没有事件的有限级定义标准,没有建立优先级和解决时限的关联关系,从而不能保证事件解决的实效性和 IT 资源的有效利用。③事件产生后没有明确而唯一的责任人,从而缺乏有效对事件监控和跟踪机制。④没有统一的 IT 服务管理对事件受理的界面,没有事件完整记录、没有及时反馈。
这些都使事件/服务请求处理过程中没有形成严格的闭环管理;没有建立明确的重大或紧急事件处理流程,从而不能保证在相应事件发生后有效及时地处理。对事件处理过程的记录比较分散,随意性很大,没有控制。更没有严格规范的流程政策和控制手段,使之存在太多的漏洞。整体运行维护情况无法一目了然,不能够清楚地知道各位员工的工作情况和工作状态,从而缺少对流程有效的监控和跟踪。
(3)缺乏运维技术工具
企业缺乏诸如事件监控和诊断工具等技术工具,事件不能在技术工具的支持下得到主动、快速处理。事件和工作任务在分派过程中没有相应的技术工具记录所有历史信息,不便于跟踪和分析;配置管理信息没有相关工具支持,以便为配置元素建立复杂的关系、状态等属性和提供相应查询功能。
总的来说,目前诸多企业在IT系统运维方面并没有高度重视,前期规划仅为解决短期IT建设问题。但随着企业规模的不断扩大,IT系统涉及的设备种类越来越多,对全系统的运营和维护管理提出了近乎苛刻的要求,而相对的则是IT运维的原始和落后的手段。
建立运维制度,关键在于规范
我们可以看出,在企业信息化发展到一定阶段,建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术的保障以外,制度保障越显得重要。
作为CIO,应首先是一位管理专家,其次才是技术专家。由此,建立完善的IT运维制度是最主要的工作内容,是企业信息化有效执行和监督的立足点。IT部门本身管理不好,就不可能为业务部门提供满意的IT服务,业务部门对IT部门的满意度就会低,满意度低又会影响IT投资及新项目的开展,使IT部门陷入困境。所以建立高效规范的IT运维机制,是CIO走向战略管理的第一步。对于IT部门来说,可从以下几个方面来进行IT运维制度化。
|