该白皮书主要聚焦于XX统一运维服务中的运维组织与流程管理规范,旨在保障客户信息系统稳定运行,提升IT效能,以契合业务需求,适用于XX行业运维服务销售及交付相关人员。
1. 运维组织管理
- 组织架构:建立集中统一运维组织,接受客户信息科技部门领导,其架构涵盖运行维护组、技术管理组、应用系统管理组、安全质量管理组等职能小组,可依客户信息系统规模与业务需求合理安排人员,小规模客户可适当合并小组以优化资源利用。
- 岗位职责 - 运维经理:负责与客户沟通、管理运维组织、落实流程制度、处置应急事件及重大问题,并进行绩效考核。 - 运行维护组 - 服务台:作为客户联系点,记录用户诉求,提供一线支持,升级问题,监督流程,收集反馈,制定工作标准与报告。 - 监控组:依据平台监视系统,发现异常启动处理,提供诊断,升级问题,制定工作标准与报告。 - 设施管理组:管理数据中心基础设施硬件设备,负责日常维护、备件管理、配置管理等工作。 - 技术管理组 - 基础设施管理:负责网络、服务器、存储等硬件设备的运维工作,包括监控、维护、技术支持等。 - 系统软件管理:管理操作系统、中间库、数据库等系统软件,涵盖监控、维护、技术支持等操作。 - 平台管理:负责虚拟化、云、大数据等平台的运维,包括监控、维护、资源管理等。 - 应用系统管理组:管理应用系统,负责监控、日常维护、配置管理等工作。 - 安全质量管理组 - 安全管理组:管理安全软硬件系统,负责信息安全相关工作,包括监控、维护、应急演练等。 - 质量管理组:建立质量管理体系,监督运维操作,确保流程规范实施,提出改进建议。 - 项目管理组:建立项目管理体系,配合客户项目实施。
- 绩效考核 - 概述:依据管理目标评价个人或群体工作,目标为保障系统稳定、达成运维目标并优化成本。 - 原则:考核指标应具体、可量化、可实现、相关且有时限。 - 指标:包括行为服务意识、运维操作管理、运维目标管理、信息安全管理、特定事件等方面。 - 评分办法:确定考核指标及分值,明确评分方法,设立加分项、减分项及一票否决情况。 - 频率:日常考核至少每季度一次,年度考核在合同年度结束后进行。 - 流程:客户制定体系,运维经理负责培训、收集数据、启动考核并沟通结果,被考核对象应积极参与并反馈意见。 - 结果利用:日常考核结果用于指导、表扬、批评和调整,年度考核结果作为合同费用支付、合同续签、参与新项目等的依据。
2. 运维流程制度规范
- 管理制度体系 - 总体指导方针:最高层级文件,规定运维总体目标、原则、架构、职责分工、沟通机制等,由客户信息科技部门领导审批。 - 流程制度规范:二级文件,涵盖绩效考核、信息安全、IT服务管理流程及专项技术领域管理要求,由相关领域领导审批,包括考核管理规定、信息安全管理规定、流程管理制度、专项管理制度等内容。 - 操作指导手册:三级文件,详细描述运维操作流程、步骤、注意事项等,减轻运维交接负担,中小型组织由运维经理审批,中大型组织由管理组负责人审批。 - 操作表单:四级文件,用于记录运维操作与运行情况,包括申请表、记录表、报告等,其模板在流程制度规范或操作指导手册中提供,审批跟随相应制度文件。
- 运维流程规范 - 事件管理:处理故障,目标是快速恢复服务,降低影响。流程包括事件生成、记录、定级、分类、处理与关闭。与问题管理、配置管理、变更管理相关,角色有事件经理、一线支持、二线支持、客户信息科技部门负责人,关键绩效指标涉及事件数量、响应与恢复时间、恢复及时率等。 - 问题管理:防止问题与事件发生,避免重复。流程涵盖问题检测、记录、分类、处理与关闭,与事件管理、变更管理、配置管理相关,角色包括问题经理、问题解决小组、客户信息科技部门负责人,关键绩效指标包含问题数量、未解决问题比例、解决时间、引发事件数量、处理成本等。 - 配置管理:维护配置项及关系信息,确保系统平稳运行,为决策提供支持。流程包括规划、标识、控制、审核与报告,与变更管理、事件管理、问题管理、容量管理相关,角色有配置经理、配置管理数据库管理员、配置项管理员,关键绩效指标涉及不准确配置项导致事件数量、配置项错误数量、准确率等。 - 变更管理:管理IT服务变更,减少故障与返工风险。流程包含变更类型定义、发起、记录、授权、实施与关闭,与事件管理、配置管理相关,角色有变更经理、变更发起人、变更发起人所在部门/公司负责人、信息系统对应客户业务部门、客户信息科技部门,关键绩效指标包括已批准变更数量、实施成功率、未授权变更数量、每百个变更请求导致故障数量等。 - 服务请求履行:管理用户服务请求,提供服务渠道,跟踪进度并反馈。流程有请求记录、审批、履行与关闭,与配置管理、事件管理相关,角色包括服务台、服务请求履行部门、客户信息科技部门,关键绩效指标涉及请求数量、平均解决时间、平均财务成本(部分请求)等。 - 访问管理:授予用户权限,防止非授权访问,可通过服务请求启动,由技术或应用管理团队执行。流程包括请求权限、验证、提供权限、监视身份状态、记录跟踪访问、删除或限制权限,与变更管理、服务请求相关,关键绩效指标有访问请求数量、不正确访问权限导致事件数量等。 - 容量管理:确保IT服务与基础架构容量满足业务需求,平衡成本与资源。流程涵盖容量与性能监视、故障处理、趋势分析、规划与需求管理、工作负载管理,与事件管理、问题管理、配置管理、变更管理相关,关键绩效指标包括容量不足引发事件数量、趋势预测准确率、计划外容量调整数量等。 - 可用性管理:确保IT服务可用性符合协议约定,定期开展活动检验有效性。流程包括监视分析可用性、维护工作审查、主要问题审查、专项工作,与其他流程相关,关键绩效指标有IT服务可用性、平均故障间隔时间、平均服务恢复时间、违反服务级别协议比例等。
|