20150803 淡然 续上
5.2 IT运维管理组 IT运维管理室是IT服务管理的主要调度管理部门,其主要功能是及时响应用户的IT服务请求,实时主动发现问题和故障,并根据问题分类以及各自的解决流程调度IT服务管理部门下属的硬件维护人员和软件维护人员负责问题和故障的解决流程执行,同时IT运维人员还要负责监控服务的完成情况,并时刻准备将未按时解决的问题和故障升级,以便调度企业外部资源参与问题和故障的解决。
5.2.1 服务台管理 ITSS考试 服务台管理来源于ITSM体系中的Service Desk,在有些体系描述中也称为Help Desk,其主要功能如下: 系统监控 l 系统监控的主要对象是企业的所有计算机主机(包括小型机和服务器)、网络设备(路由器设备)、企业下属各个职能部门的计算机系统和相关设备。监控内容主要如下: n 计算机主机和服务器以及网络设备(拥有CPU和内存)的CPU占用率和内存使用率; n 计算机主机和服务器中外部存储器的占用率以及存储状况,包括存储碎片率和磁盘空间剩余等信息; n 计算机主机和服务器中所有通信端口的活动进程数和信息队列长度信息,检查计算机主机和服务器的通信端口畅通情况; n 网络IP资源的分配情况; n 网络总体带宽资源分配情况。 l 计算机主机和服务器上运行的数据库管理系统之运行状况,包括数据库内最大数据表的长度(记录数)、索引性能以及并发冲突处理情况等等。 通常以上这些监控对象是系统出现问题和故障前会发生变化的重要指标。需要IT运维人员通过巡检的方式进行主动监控。
安全监控 随着信息化建设的不断深入,企业网络也从封闭的内部网络转换成与外界进行有限沟通的广域网络,网络信息安全已经成为企业能否维持其信息网络安全、稳定运行的又一重要保证因素。目前,网络安全的监控主要体现在以下几个方面: l 访问控制,包括监控企业网络是否存在越权使用信息的情况;是否存在黑客进入企业内部网络,进行非法操作的情况;是否存在企业内部泄密的情况等等。 l 电脑病毒攻击,监控企业信息网络是否受到病毒的攻击; l 信息健康管理,其中包括是否存在非法的信息访问和浏览,是否存在企业信息非法向外传播的情况等等。
应用监控 企业的信息网络上,运行着大量的企业应用信息系统,有资料表明,企业应用软件的数量已经在企业的整个软件系统中占有超过80%以上,因此企业应用系统的运维管理,是企业信息网络稳定运营的主要最主要保证。 实际上,系统监控中反映的问题其主要产生根源来自应用系统的运行,因此,对应用信息系统的监控管理目前已经成为专门的研究课题。由于目前没有产品化的系统作为工具帮助企业实现对应用系统的监控,但企业的IT专业运维人员仍然能够通过应用系统产生的日志,并借助于系统监控管理手段达到对应用系统的监控。
5.2.2 问题分类和级别管理 IT服务运维的另一个工作就是对问题和故障进行分类管理,因为通过问题和故障的分类管理,可以将问题按专业进行分类,同时将问题和故障根据其解决难度以及紧急程度进行分级,从而使影响较大,而问题比较容易解决的问题优先得到解决,而对问题级别较高(难度较大的问题)集中技术力量加以解决,从而实现利用有限的技术服务资源,取得更高的服务效率。
问题类别建议 问题分类
| 问题类别
| 问题类型说明
| 硬件系统
| 主机类型
| 1. 硬件系统故障,包括电源、网络端口、CPU和底板及插卡故障等; ITSS认证 2. 外设故障,包括显示器、键盘、鼠标、数字仪器等设备; 3. 存储故障,包括磁盘、活动硬盘和磁带库机以及光盘备份设备等。
|
| 网络类型
| 1. 通信配置问题,需要IT专业人员负责进行合理配置解决; 2. 应用数字通信设备故障问题; 3. 网络设备故障,包括路由器、集线器和交换机设备等; 4. 语音通信服务器设备。
| 系统软件
| 操作系统类
| 1. CPU占用率过高,考虑停用某些无用的进程,或增加CPU个数; 2. 磁盘空间不够,考虑备份,删除部分历史数据,或增加磁盘设备,增加存储容量; 3. 端口进程队列过长,考虑重新分配端口通信通道,提高通信端口利用率,或增加通信端口(安装更多的网卡)。 4. 通信速度不够,降低网络数据流量,合理分配用户通信带宽,把带宽分给需要实时性信息访问要求较高的用户,或申请更高的带宽,安装性能更高的网络交换设备等。
|
| 数据库系统
| 1. 访问速度慢,其中包括数据量过大,索引需要重组等,或删除历史数据,使数据库的数据量维持在响应能力之内。 2. 并发响应问题,通常出现在多用户同时访问和操作数据库的时候产生,通过改善记录锁定机制可以得到解决,但通常的锁定解决是由计算机应用软件的设计来解决的。 3. 数据丢失,一般来说,这类问题是由并发响应问题产生的,而网络中断、也是产生这类问题的主要原因,这类问题由于原因比较复杂,需要特别对待。 4. 数据计算错误问题(包括4舍5入的计算精度问题),合理选择数据类型是解决这类问题的很好的方法。
| 应用软件
| 应用软件系统
| 1. 应用系统版本问题,需要IT应用软件维护人员重新安装新的软件; 2. 数据录入错误修正,一般需要经过管理部门领导认可,由本部门关键用户负责实施修改,并报应用软件部门备案,修改前需要对原数据备份; 3. 性能问题,需要从系统软件的运行状况中找到原因,当然还要考虑应用系统设计的合理性; 4. 功能问题,从供应商那里得到新的软件版本,或需要通过修改应用软件和二次开发才能得到实现; 5. 改变应用环境,包括改变应用管理流程也是通常比较有效提升应用软件适应能力的方法。
| 安全管理
| 访问安全
| 1. 非法访问,通过重新安排授权实现。
|
| 病毒
| 1. 通过安装和定期升级防病毒软件实施。
|
| 黑客攻击
| 1. 通过安装防火墙实现。
|
问题和故障响应任务分类 依据上表列出的问题分类建议,可以设定IT服务管理部门问题响应任务分类,具体分类如下图所示:
图5.2.2-1
问题和故障的级别分类 对问题和故障进行级别分类是为了能够充分调度有限的IT服务管理资源实施最高效率的服务,解决问题,排除故障。在IT服务管理体系中,不可能所有的IT专业服务人员处在同样的技术水平,为了实现服务平衡(Balancing Service),就需要对所发生的IT问题和故障进行分级,分清“轻重缓急”,分别对待,使服务效率提高,更主要的是对问题和故障对症下药,提高服务管理效率。 问题的分级不是一成不变的,而是在服务过程中不断改进和不断完善的。建议的分级原则如下表所示: 其中,问题和故障的技术难度根据解决问题所需要的人天数和技术能力要求决定:
问题难度 部门级别
| 一级
| 二级
| 三级
| 四级
| 人天
| 等级
| 人天
| 等级
| 人天
| 等级
| 人天
| 等级
| 一级
| 事务类
| 0.5
| 1
| 1
| 1
| 1
| 2
| 1
| 3
| 二级
| 计划类
|
|
|
|
|
|
|
|
| 三级
| 决策类
|
|
|
|
|
|
|
|
| 四级
| 执行类
|
|
|
|
|
|
|
|
|
图5.2.2-2 在部门需求级别分类上,是根据部门的业务类别来进行分级的,执行类部门因为所从事的业务对信息的实时性要求较高,因此当出现IT问题和故障时必须尽快加以解决,否则将会影响其正常的业务进行。 ITSS培训 而事务类部门虽然对IT有业务需求,但仍然可以在发生问题和故障的同时采用其他手段(手工作业)继续工作,因此这些部门的问题和故障级别可以适当降低。
本帖关键字:ITSS |