本帖最后由 monicazhang 于 2015-11-6 11:25 编辑
20151106 淡然 续上
3.2 运维组织3.2.1 现状描述 目前,某公司运营中心按照业务系统类型划分运维小组,包括:集中交易、投资交易、管理系统、网络管理、灾备运维、公共平台、数据机房和服务台等。每个业务系统又根据管理职能设置了AB角色作为备份。各个业务系统之间通过IT服务管理流程实现串联,形成纵横的交叉管理结构。 其中,总控中心的质量经理负责中心IT服务管理流程的规划、实施、回顾和改进工作,流程经理基本为代职,主要负责流程的审批、关单等环节的操作,其具体架构示意如下: ITSS考试
图 3.3 某公司运营中心组织架构 在实际运维过程中,各业务系统管理员对于B角的定义和要求差距较大,以“集中交易系统”为例,统计AB角职责及对应熟练程度现状: 表 3‑1 集中交易系统A/B角职责及对应熟练程度现状 [td] 职责
| 熟练程度(现状)
| 熟练
| 一般
| 技术
| 每日开闭市操作
| A/B
|
| 系统日常运维工作(如例行重启、巡检)
| A
|
| 已知故障处理(例如应急切换)
| A
|
| 未知故障排查及处理
| A
| B联系A或者开发人员处理
| 测试支持
| A
|
| 变更、升级
| A
|
| 业务
| 常见业务操作咨询及处理(如如何调整参数)
| A
|
| 特殊业务操作咨询及处理
| A
| B联系A或者开发人员处理
| 系统日常业务处理(例如清算、权限管理)
| A
|
|
同时,在访谈业务系统A角时,也对对应的B角提出期望:
表 3‑2集中交易系统A/B角职责及对应熟练程度期望 [td] 职责
| 熟练程度(期望)
| 熟练
| 一般
| 技术
| 每日开闭市操作
| A/B
|
| 系统日常运维工作(如例行重启、巡检)
| A/B
|
| 已知故障处理(例如应急切换)
| A/B
|
| 未知故障排查及处理
| A
| B联系A或者开发人员处理
| 测试支持
| A/B
|
| 变更、升级
| A/B
|
| 业务
| 常见业务操作咨询及处理(如如何调整参数)
| A/B ITSS认证
|
| 特殊业务操作咨询及处理
| A
| B联系A或者开发人员处理
| 系统日常业务处理(例如清算、权限管理)
| A/B
|
|
对比现状与期望,我们可以看出从业务系统A角的角度,希望B角成为自身不在时的全备份,只有不常出现的“未知故障排查及处理”和“特殊业务操作咨询及处理”,可以允许B角联系A或开发人员处理,这对B角平时对业务系统的了解提出了较高的要求。
3.2.2 关键发现 通过对某公司运维组织的了解与访谈,可以看出非常重视人在IT服务管理中的作用,作为流程的执行者,技术的使用者,人成为提供IT服务质量的关键。同时,运营中心的人员组织还需要进一步的完善,明确角色与分工,建立有效的沟通机制。 关键发现1:业务系统管理员B角定义与职责不清。作为业务系统管理员A角的备份,缺乏明确的定义,规范其职责范围、工作场景、业务技能以及绩效考核。使无论A角,亦或B角都对该角色的具体要求产生疑惑。A角认为“B角人员对系统的掌握远弱于A角。(杨利强)”而B角则对分配的任务范围感到力有不逮。这种差异的产生,恰恰是B角角色没有明确定义所导致。 关键发现2:对于运维工作量没有较好的统计方式。事件、变更等作为每天工作量的一部分,在ITSM系统中能得到部分体现,其他工作如:日常例行巡检、系统优化、协助开发、学习会议等则无法有效统计,无论业务服务目录,或是技术服务目录均无法反映业务系统管理员的运维工作全貌。针对“集中交易系统”我们做了抽查,工作内容与时间分布如下: 表 3‑3 IT运维工作内容及占比 [td] 编号
| 工作内容
| 占比
| 1
| · 故障类处理
| 15%
| 2
| · 服务请求类处理
| 20%
| 3
| · 非升级类变更处理
| 10%
| 4
| · 升级类变更处理
| 10%
| 5
| · 例行工作(巡检、开闭市)
| 20%
| 6
| · 项目相关
| 5%
| 7
| · 系统优化
| 10%
| 8
| · 其他(研究、会议、报告)
| 10%
| ITSS培训
其中,55%的工作位故障、服务请求和变更的处理,可以通过ITSM系统及时录入工单予以记录,但余下45%的工作却无法较好量化。这使我们在分析“系统数量、复杂度、业务发展与现有人力资源不匹配,造成运维能力下降。无法提供有效的数据支撑
|