学习资料: ITIL培训基地专家讲堂直播 300期视频回放
可用性管理是ISO20000的核心应用,也是数据中心工作的重点。而事件管理、变更管理、可用性管理、服务级别管理这四个管理流程则构成了数据中心从用户到客户的管理轴心,这个轴心使得数据中心的管理有了抓手。在这个抓手的配合下,可用性管理服务发挥了主导作用。
金融业处于一个加速变化、竞争日益激烈的业务环境中,各金融机构都希望通过业务大集中和数据大集中,扩大业务规模,为客户提供更多更好的业务和服务。业务大集中、数据大集中的实施,使得数据中心在各金融机构中占有极其重要的地位。大集中后的数据中心面临着规模与管理水平、管理手段不对等的问题,怎样更好更有效率地管理好数据中心,以及如何降低管理风险,消除管理盲区,成为各个数据大集中后的金融机构数据中心管理者所面临的重要课题。
新成立的数据中心的管理者在如何有效地管理好数据中心方面做了很多努力。比如很多机构聘请了国外专家来做咨询,在同行中进行交流,最终都因环境不同、文化不同、面临的管理困难和挑战不同而失败。有的即使做出了非常漂亮的管理方案及文档,但因其与实际环境差距太大没有能有效付诸实践而被束之高阁。于是很多管理者就把视线转向ITIL以及IT服务管理上来,在组织中引入ITIL最佳实践的管理方法,通过建立服务台将事件、问题、配置、变更逐步先管理起来。随着服务台建立的数据中心的日常故障处理工作逐步纳入正轨,管理者有时间来考虑更重要的问题:如何更有效地管理数据中心,减少宕机事故,加强安全生产。
变更管理最为关键
对于数据中心来说,所有工作的重中之重是安全生产。在与很多金融机构的数据中心管理层沟通的过程中,“安全生产”这个词是提及率最高的。“安全生产”正是我们在ISO20000中所说的可用性管理。换句话说,可用性管理在数据中心工作中一直是核心工作,但可用性管理不是空中楼阁,是需要其他管理流程来支撑的。对于数据中心来说,在ISO20000管理体系中其他的管理流程以及整个管理体系都是为可用性管理服务的。
可用性管理与容量管理、持续性管理关系最为紧密,这三个管理流程构成了数据中心管理的核心区域。容量管理里面最核心的是容量计划,容量计划应与业务管理管理形成顺畅的接口,将业务发展信息能及时的带回数据中心,并由业务关系经理对业务信息进行分析、分解、翻译成数据中心人员可以理解的业务需求;再由容量管理经理根据业务需求换算成各个业务部门下一年度的发展所需的IT容量规划;同时对于人员的规划也将纳入这个容量计划,这个的容量计划转换成预算计划,采购计划等,在每个季度分别进行回顾。这样打通的流程使得数据中心能从容应对容量问题,解决了当前的和未来的容量问题为提高可用性打下基础。对于金融机构的数据中心,最重要的基础工作是做好变更管理流程。变更管理流程是管控的流程,不抓住变更管理流程就很难说抓住了安全生产的主动权。抓变更管理首先就要抓住变更管理管控的过程,使得不合格、不合理、不在恰当时间的、没有准备充分的、没有与客户达成共识的、没有完成审批手续的变更申请都不得进行变更。这个抓手要是松一下,可能会带来很多救火的工作,甚至造成可用性事故。
下面就让我们来看一下某银行数据中心一个变更经理一天的工作。某行数据中心的变更管理由一个变更经理组进行日常管理,这个小组每天都会有1~2个执行变更经理来负责变更的协调跟踪和督促各方工作:每天早上上班后会检查ITSM系统,看一下是否有新提出的等待处理的变更单。执行变更经理会与变更申请人沟通,接受或拒绝该变更,如果接受该变更,则将变更单转派给变更的受理组进行规划设计。变更受理组开始对这个变更单进行处理时,变更单的状态变为规划中。执行变更经理在处理完当天新提出的变更后会看一下长期处于规划中的变更单,尤其是时间超过一个月的变更单,会电话与变更规划人进行沟通,看变更条件是否成熟,是否有需要帮助协调的工作,对于规划好的变更还会检查变更计划,变更时间是否在变更窗口,是否有回退计划,是否得到测试等,如不合格还要发回重新规划。对于不同的变更还规定了不同的变更审批路径,规划好的变更需要得到该变更种类的变更路径上的相关人员审批后方能进行变更操作。如果有重大变更,执行变更经理还要担负起协调各方,以及督促各个技术审批人及管理审批人审批的工作。每周还要公布未来两周的的变更计划,使得变更相关人员了解变更进度以及相关系统人员了解到该变更信息。变更经理一天的工作能反映出变更管理主要的各个管控环节,抓住这些管控环节就抓住了日常工作中影响生产系统可用性的重要的控制点。所以很多金融机构都是将变更管理作为日常管理的重点工作,尤其对变更的审批控制得极为严格。在深圳证券交易所系统运行部,每个变更都要经历编制方案、测试方案、各方技术会审、各层领导会审,同时还要征求业务部门意见后才能付诸实施。这样的过程看似复杂,但每一步都必不可少,缺少一步都会造成不可挽回的损失。当然他们有一套行之有效的IT系统来承载进行这样的审批流程,使得审批手续变得十分的流畅。
事件管理作为数据中心对用户的管理流程,一般都通过服务台来接入客户的事件,由一线或二线工程师来帮助用户解决问题。事件管理在金融机构的数据中心一般都能管理较好并得到落实,管理的方法可能略有不同,但都遵循ITIL提出的事件管理要求。ISO20000还特别提出了事件管理要与安全事件、可用性事件、连续性事件加强联动,使得体系更加强壮。
服务级别管理在各个金融机构中可能呈现的形式和内容有较大差异,但核心一点都是明确了数据中心服务的客户及提供的服务的内容和服务级别。所有的服务内容和服务级别都有由其他管理流程所提供的数据基础,尤其是可用性管理流程。同时系统还要定期对服务情况进行报告,通过服务报告流程将向客户承诺的服务进行总结报告。
四个流程构成轴心
事件管理、变更管理、可用性管理、服务级别管理这四个管理流程就构成了数据中心从用户到客户的管理轴心。这个轴心使得数据中心的管理有了抓手,可以以此轴心为基础开展工作,打通各个流程之间的联系,使得基于ISO20000的服务管理体系更加强壮和富有活力。
数据中心的管理必须有全局观,一些失败的情况都是没有考虑到全局观,都是要么只考虑了技术因素没考虑到管理,要么就是只考虑到了流程是否完美没有考虑到是否能够真正执行,要么是完全引进其他企业的方法没有考虑自身特点。恰恰ISO20000作为管理体系最为强大的一点就是它是一个完整的整体,从管理者的职责以及人员要求、文档化要求、流程要求等,都要求数据中心在实施时通盘考虑,统一规划然后进行实施。一个经验丰富的咨询公司会在体系构建中给予数据中心以有效的帮助。
|