本帖最后由 monicazhang 于 2015-9-24 16:57 编辑
20150924 淡然 续上
3.1.4 相关项目实施可能面临的困难(Threat) 在面临机遇和挑战的同时,也看到实现这些目标存在着一些实际困难:
v 人员 u 高层领导是否真正重视,愿意按照IT服务管理的国际标准对中心进行流程重组,并通过一些行政指令确保流程的贯彻与执行? u 组织的适当调整,并解决某些岗位的人员短缺问题? ITSS考试 u IT支持人员对流程的理解和执行程度, IT人员是否真正明白流程的重要性和对IT服务带来的好处,如果和他们日常的工作习惯相悖,如何来保证流程执行的顺利? u 能不能通过一些管理或激励手段调动员工执行流程的积极性;
v 流程 u 如何快速地提高客户满意度? u 客户是否真的能够配合IT部门的工作,还是习惯直接找熟悉的工程师等? u 如何保证制定的流程有效,尽可能符合当前工作习惯? u 如何控制‘尽善尽美’的需求,使管理流程具有可规划性,可持续性,可实施性,可执行性? u 如何通过管理流程的执行提供切实可靠有效的管理数据,提供哪些管理数据?
v 工具 u 缺乏资金和经费来进行相应的改革和完善; u 和厂家的服务合同是否可以满足业务的需要;
通过对深圳某公司IT服务管理现状的深入访谈,获取了大量有关IT服务管理的信息。现将这些结果进行再次整理,并对内容进行抽取,利用相关IT服务管理的评估工具对这些问题进行分析,得出问题的量化指标,其目的是看症结和国际标准IT服务管理的差距有多大。 在ITSM中,我们强调IT服务管理的三个关键因素分别是人员、流程和工具,这三者缺一不可,只有把这三个因素有机结合起来,才能真正有效地向IT用户提供高质量的IT服务,任何一方面的欠缺都将影响到IT部门的服务能力和服务质量。所以本节要阐述的问题也将从这三个方面去逐一分析。
3.2 IT运维管理定量分析结果 根据评估咨询的安排,与新技术开发中心的运维室相关工作人员对IT的日常运维进行了沟通和交流, 就IT运行维护中的9个方面进行了咨询和评估,这9个方面是规范运维管理中所函盖的部分,它们具体是: n 报告 reporting
——通过运维管理可以获取的相关报表,如服务器、应用系统等性能分析报表等; n 平台管理 platform administration
——指在运维工作中对操作平台、系统平台等平台的运维能力,如系统的配置支持等; n 日常生产管理 daily production management
——在日常运维工作中,对一些具体工作调度的管理,如,系统备份和恢复、备份介质管理等; n 安全访问和控制 security access and control
——在运维工作中有关安全问题的管理,如,机房环境管理、用户访问系统的安全管理等; n 事件和问题的解决 incident and problem resolution
——对突发事件和问题的管理,主要包括从故障的申报到事件或问题的解决过程中主要环节管理,如呼叫管理(事件申报管理)、事件处理升级管理等; n 服务器的监控和控制 server monitoring and control
——在运维工作中对服务器进行监视和控制的环节,主要针对服务器事件的自动发现能力等; n 硬件维护 hardware maintenance
——主要指运维工作中涉及的硬件维护过程,如,硬件的定期检修等; n 数据中心管理 data center management
——主要指灾难备份中心的管理,如,灾难备份过程、灾难中心环境管理等; n 分发管理 release to production
——主要指系统补丁的发布管理,即,将补丁投入生产环境过程的管理; 通过信息的搜集得到如下具体数据,该表的评分细则如下: 首先,在每个大项中都细分了几个小项,在评估工具中对每个小项都从工作过程评估和工作细则评估两个方面进行。
Ø 工作过程评估: 其中在工作过程的评估中将每个小项细分成几个封闭式问题,对每个问题分别评分,如,该工作过程存不存在; 如果存在,成熟度是什么样子:0-没有;1-很混乱,有时会起负面作用;2-有意识提高,但还是责任不清晰,基本上能够完成运作;3-已经有计划提高完善,在很多时候该工作过程都类似ITIL的最佳实践;4-工作过程基本成熟,能够按照ITIL的最佳实践健康运作;5-工作过程发挥了应有的功效,并且能够自我回顾和完善过程; 如果存在,考核手段如何:0-没有定义任何考核手段;1-只是定义了部分考核手段;2-考核手段被很好的定义; 如果存在,责任人情况:0-对该过程没有分派责任人;1-模糊的责任关系和职责;2-很清楚地定义了责任角色和职责。 通过对这些数据项的录入,评估工具将自动计算出该工作过程的权重和有效执行评估得分,同时评估系统会将该项的总的权重、对IT服务管理的影响、及优先级计算出相应的得分。
Ø 工作细则评估: 对每个评估项中函盖的内容确定其工作规范到什么程度,可能在某些方面有规范,但是并没有得到很好的实施,也许在某些方面并没有规范,也没有参照最佳实践。对每一个子项评分: 0-没有工作细则和最佳实践标准;1-很模糊,有时会成为负担,起负面作用;2-有意识提高,但还是责任不清晰,基本上能够完成运作,但是无法起到应有的效果;3-计划提高完善,在不断的完善情况下,很多时候该工作细则和工作规范能够类似ITIL的最佳实践;4-工作细则和规范基本成熟,能够按照ITIL的最佳实践执行;5-非常完善的工作细则和工作规范; 评估项
| | | | 报告 平均得分23分
| | 账号管理和检查
| | | 工作细则和规范:1,对用户账号管理细则和规范;2,定期/不定期检查账号机制; 工作过程:1,对用户账号的及时调整、增加和删除;2,检查账号的实际和数据库的一致性; | 性能趋势分析
| | | 主要从两个方面进行评估:工作过程评估和工作细则评估; 工作细则主要包括:1,有没有相应的工作量管理的分析细则,来报障IT资源能够满足业务的需要;2,对IT容量趋势管理怎么样,能不能预测业务对IT服务容量的需求等; 工作过程主要包括:1,是否管理应用、系统、数据库性能并且标出应用性能的问题;2,是否监控系统性能等; ITSS认证 | 性能数据搜集, 检查和汇报
| | | 工作细则主要包括:1,通过定义性能指标参数监控和报告性能状况;2,对业务单元的交易量和其它性能数量来衡量IT资源的容量;3,对容量数据分析能够衡量出需要关注的对象; 工作过程主要包括:1,配置标准的工具来收集性能数据;2,分析和汇报资源的使用趋势;3,监控和报告存储性能; | 平台管理 平均得分39分
| | 系统配置和支持
| | | 工作细则和规范:1,系统管理员有没有管理规范和过程;2,系统管理和用户之间有没有服务级别协议; 工作过程:1,开发存储管理架构;2,定义和创建初始文件系统;3,定义和优化系统、数据库、应用等性能;4,定义启机/宕机时间任务表; | 打印机定义和管理
| | | 工作细则和规范:1,打印机输出管理体制,确保时时监控打印机的问题; 工作过程:1,有没有在系统中定义打印队列;2,有没有配置打印队列和处理缓冲池; | 预防性的数据库管理
| | | 工作细则和规范:1,有没有数据库设计、维护和控制管理的规范; 工作过程:1,有没有按照数据库架构创建数据库;2,对数据库表空间等指标项的维护情况;3,在必要时执行数据库的导入/导出工作; | 日常管理 平均得分32分
| | 系统的备份和恢复
| | | 工作细则和规范:1,存储重要业务数据的管理规范;2,每日备份重要业务数据管理细则;3,对所有平台都有备份/恢复方案;4,终端用户有没有规定将内容备份到文件服务器; 工作过程:1,通过备份介质恢复一个或多个任务;2,执行恢复方案后,滚动分析日志;3,监控、分析备份和恢复时的任务; | 备份介质的管理
| | | 工作细则和规范:1,对磁盘、磁带等分类管理;2,带库环境管理规范;3,对带库的进出记录规范;4,远程备份的技术指标要求;5,自我审计和检查备份数据的有效性规定;6,管理办法同公司法律部门条款的一致性; 工作过程:1,执行增量/完全备份和恢复;2,标识备份介质;3,维护备份库;4,远程备份功能的可用性; | 后台任务调度
| | | 工作细则和规范:1,在操作者、计划者和程序员之间有明确的任务划分;2,对于重启的任务有详细的记录;3,存在标准的JCL/Script脚本;4,规范的发布和投产过程;5,放弃的任务需要严格的记录; 工作过程:1,根据业务要求控制批处理任务;2,执行生产任务计划;3,恢复/重新执行失败的任务; | 安全访问和控制 平均得分43分
| | 用户管理
| | | 工作细则和规范:1,用户管理过程和用户环境的维护;2,对用户隐私信息的保护; 工作过程:1,必要时才创建操作系统的用户;2,维护共享用户;3,维护群组用户; | 物理场地安全
| | | 工作细则和规范:1,进出数据中心的规范;2,存取安全设备的审计规范;3,对机房环境安全的管理规范; 工作过程:1,周期性地测试机房环境地安全;2,维护安全细则;3,产生安全分析报表; | 系统安全
| | | 工作细则和规范:1,为IT用户提供IT资源存取的安全细则; 工作过程:1,执行安全控制;2,管理密码和共享用户; | 病毒检测和防范
| | | 工作细则和规范:1,对IT用户定义病毒防范规范; 工作过程:1,对病毒防御和控制; | 事件和问题的解决 平均得分27分
| | 呼叫管理
| | | 工作细则和规范:1,定义服务呼叫范围;2,定义授权用户;3,定义受理台工作职责; 工作过程:1,接受和记录事件申报;2,跟踪事件单的处理过程;3,必要时升级事件单;4,向用户确认事件处理完毕,记录用户满意度; | 通知和升级管理
| | | 工作细则和规范:1,定义事件升级的过程,确保能够及时升级重要事件;2,定义事件升级条件; 工作过程:1,记录升级明细;2,对事件进行影响分类; | 被动的性能支持
| | | 工作细则和规范:1,制定衡量系统资源需求的标准; 工作过程:1,校验用户性能方面出现的问题; | 服务器的监控和控制 平均得分28分
| | 服务器事件检测和通知
| | | 工作细则和规范:1,对IT环境的事件进行关联和收集的规范;2,建立IT环境监控的标准; 工作过程:1,对硬件进行监控;2,对操作系统、数据库和应用进行监控;3,监控主控台,并产生事件通告;4,记录事件; | 数据库事件检测和通知
| | | 工作细则和规范:1,建立数据库监控指标; 工作过程:1,数据库实例运行监控;2,表空间使用率监控; | 硬件维护 平均得分54分
| | 系统预防性维护
| | | 工作细则和规范:1,系统健康指标; 工作过程:1,使用厂商的预测工具进行健康检查;2,定期获取系统补丁; | 数据中心管理 平均得分0分
| | 灾难恢复
| | | 工作细则和规范:1,灾难备份/恢复的需求和执行规范; 工作过程:1,进行灾难备份和恢复; | 灾难中心物理环境
| | | 工作细则和规范:1,定义灾备中心物理环境的管理规范; 工作过程:1,记录灾备中心环境指标; | 分发管理 平均得分36分
| | 投入运行
| | | 工作细则和规范:1,制定规范的投产发布管理过程;2,所有生产环境的变更必须通过发布管理实现;3,制定硬件、软件等标准的投产配置; 工作过程:1,建立和进行投产环境测试;2,对于重大的发布之后进行回顾;3,确保发布的正确执行; |
本帖关键字:ITSS
|