本帖最后由 monicazhang 于 2015-9-24 16:37 编辑
20150924 淡然 续上
4.3 远期建议 Ø 建立IT成本管理——实现IT服务的可成本核算管理流程; 由于IT部门在深圳某公司始终是‘花钱’的部门,虽然,各个层面都意识到IT部门的重要性,都承认IT支撑部门在公司的价值勿庸置疑,但是,在处理具体事情上的时候,人们又总是忽视了这些,还是将IT支撑部门当作完全不能创造效益、不能盈利的部门来看。业务部门永远都希望,也需要IT部门无条件地去完成业务需求和故障处理;IT部门非常需要将IT资源成本化,但是,IT资源成本化是个非常复杂的课题,它需要建立在成熟的ITSM服务管理基础上,所以,我们将其列在远期目标。 ITSS考试 将IT资源成本化,必须在项目计划初期和公司制定战略初期就要开始核算。通过下表可以了解核算所关注的内容: 可以看出,在IT成本管理中主要涉及了预算管理、IT核算管理、收费管理。其中IT核算是非常复杂的过程,如何将IT资源分解成为每一个可以独立核算的成本单元,这本身都需要在获得事件管理、配置管理、问题管理、变更管理等大量数据的基础上,再进行分析才能得出每一项成本单元。同时,针对IT核算,还需要成立‘成本中心’,由成本中心监控每一个IT成本单元的花费情况。一般建议,为IT核算部分建立相应的软件工具去实现相应的管理,称为IT核算系统。 在成本核算的这三个部分,每一个部分总体上来讲,建议至少需要考虑的因素和内容:
o 预算(Budgeting) 1) 管理IT组织的预算; 2) 准备预测性费用预算,并且协助用户将这些预算加入他们的预算计划中; 3) 经常性地向IT经理和用户报告,以共同确认预算;
o IT核算(IT Accounting) 1) 为了收集成本数据,选择合适的工具和流程; 2) 开发适当的成本模型; 3) 使相关人员对合适的IT核算原则达成一致; 4) 在进行成本-受益的方案分析时,协助公司的IT投资计划; 5) 在成本-收效的IT解决方案方面,提供更资深的管理建议;
o 收费(Charging) 1) 在公司收费的原则下,标识收费方法; 2) 为收费提供有力的理由和收费参照; 3) 为用户准备正规的帐单; 4) 如果需要,为服务准备价格清单;
Ø 建立IT可用性管理 ——实现可以核算的IT可用性管理; 由于IT技术及设计的持续演进,系统的可用度及稳定度大幅提升。不管是硬件或软件,都因为容错及自动校正技术,现在出错的机率已大幅降低,使得企业IT可达到更高的可用度。但面对这样可用度及稳定度已大幅提升的背景下,对可用度管理的需求其实更甚已往。因为经过前期的IT有效的服务管理,业务流程与系统运作之间形成了更密切的关系。 在业务竞争日益扩大的时期,用户满意度对于企业所提供的服务更加重要,不能够一味地依赖用户忠诚度。对服务可用度及稳定度不满常常是用户决定转向另一个运营商地关键。IT服务可用度及稳定度会直接影响客户满意度及公司的声誉。 系统可用度是在ITIL中定义的,指在所同意的正常服务时间内,维持正常运转的总时间百分比,具体公式: 系统可用度 = (所同意的正常服务时间 - 停机时间)/ 所同意的正常服务时间 此外,在此期间还需要同时提高评估可用度品质的四个组成要素: Ø 系统可用度:在所同意的正常服务时间内,维持正常运转的总时间百分比。 Ø 稳定度:系统能正常运行、不发生错误的能力; Ø Maintainability(可维护度):能让IT持续运作的能力; Ø Serviceability(可服务度):对外面合作厂商管理的能力; 为了建立可用性管理,建议需要的工作事项: Ø 在规划全新或改经现有的IT服务时,考察业务面在可用度方面的需求; Ø 了解IT服务如何结合及支持业务; Ø 监看可用度数据,并与Service Level Agreement对应,帮助确保服务达成目标; Ø 预测及设计可用度等级; Ø 持续检视及改善可用度; Ø 制作可用度计划文件(Availability Plan); ITSS认证 可用度计划文件内容至少应该包括:主动改善可用度长期计划和设计可用度。设计可用度的方法分成两个步骤:第一步,了解及分析IT基础架构设计可能出错的弱点,其方法有单点故障检查-Single Point Of Failure(SPOF)、风险管理、测试或模拟。第二步,根据第一步分析的结果提出相应的改进计划。
Ø 建立IT持续性管理 ——提高业务持续运行的能力; 在远期目标中建立IT持续性管理的意义,当IT服务管理建设得日益成熟时,业务对于IT要求的一些硬指标就变得可行,同时变得非常必要,其中可用度及IT服务持续性管理可以说是举足轻重的两个重要程序。运营服务能否持续每天24小时,一周7天不间断的正常运作,变得越来越重要。可用度能左右用户满意度,并且能快速的影响企业整体声誉及业务是否成功。IT服务持续性管理流程是要确保正常可用的解决方案发生问题后,依然能够持续提供另一个等级的IT服务给客户。 很多因素能够影响服务的可用度,像是硬件、环境因素或人为错误。如电源供应器或硬盘坏掉等硬件错误就是最常见的情况。如果服务器唯一的电源供应器发生错误,该服务器就会被迫暂时中止。如果服务器配备有两个电源供应器,便能够安然渡过象这样的危机。如果整个计算机机房或数据中心停电,可以先用电池或不断电系统(UPS)支持短暂时间,然后由发电机取代。象以上这些例子都是遇上了可用度危机,而我们可采取的作为都是反制措施(Countermeasure)。而如果这些反制措施没有办法完全涵盖或应付,那么就必须要有更进一步的措施来应付这样的状况。 这些措施都必须事先规划,这就称为应变计划(Contingency Plan)。应变计划常被称为B计划。应付正常操作及日常危机与反制措施是A计划,B计划则是当企业业务遭到中断后,企业持续提供事先决定好及同意的IT服务来支持业务最低需求能力的计划。IT服务持续管理程序的目的就是要有一个系统化的方式产生一个应变计划来恢复及处理服务停止的情况。 举例来说,虽然企业准备有备用发电机,但是可能发生柴油供应短缺的情况,这时IT主管必须启动应变计划(即将该事件纳入IT持续性管理),把IT服务移到另一个有电力供应的地点,达到持续提供服务。这些IT中断危机只要事先规划好反制措施,是可以一定程度地控制的,但是当这些反制措施没有办法完全涵盖或应付,就必须启动应变计划。 可用度管理及IT服务持续性管理的关系很密切,这两个管理程序都是试图减少IT服务的可用度的危机。可用度管理的焦点主要是集中在处理日常可能出现会影响到可用度的危机,如果无对应的反制措施或反制措施没有办法完全涵盖或应付时,这些危机就由应变计划及IT服务持续管理程序来处理。 在建立IT服务持续性管理程序时,建议分3个步骤:第一步,是取得Service Level Agreement,并将IT服务分成下列层级:
Ø 服务 Ø 应用软件 Ø 中间件 Ø 操作系统 Ø 硬件 Ø 网络 Ø 环境 Ø 外在影响因素
然后分析及找出每层的危机。第二步,提出这些紧急状况的解决方法,包括两个部分:Failover和Recovery。FailOver包括几个选择:Cold Standby、Warm Standby及Hot Standby。Cold Standby是另外准备一套空的计算机机房备用,当危机发生之后再安装硬件装置与软件;Warm Standby则是备用的计算机机房已有这些硬件装置,但数据尚未同步、加载或设定;Hot Standby则是计算机机房、硬件装置、数据都一应俱全,危机发生时可立即接手作业。Recovery则通过排除故障恢复生产。第三步,制作应变计划;应变计划内容至少应该包括:详列可授权启动应变计划的高层主管人员名单、应变准则、回复计划小组的成员、回复策略、应变详细步骤及检查表。
Ø 建立IT能力(容量)管理——提高业务能力需求和IT资源容量的匹配程度; 为了更好的提高IT容量管理能力,在远期目标中建议实现IT容量管理流程。容量管理(Capacity management)的目的是要确保以最有效率和实时的方式提供目前及未来因业务成长所需的IT容量,这个过程必须建立在近、中期目标实现的基础上,建议该管理过程应该包括; 监看目前IT服务的执行效能; 了解公司业务目前对IT资源及服务的需求,并根据趋势预测未来需求; 订出要达到支持Service Level Agreement所需的资源,并对未来IT服务资源需求做出预测、建议及规划,以及制订出容量规划(Capacity Plan)文档; 同时,在实现容量管理过程时,建议在下列事项上进行平衡: Ø 支出 vs. 容量:确保由业务角度观点出发,目前的支出所能购置的IT处理容量,足以应付规划时程内的业务需求; Ø 供应 vs.需求:确保由业务角度观点出发,所购置的IT处理容量可以应付现在及未来的需要; 在实现容量管理过程时,建议分成三个步骤进行。第一步,收集与容量相关的技术信息、SLA、服务指南、业务规划、IT计划、业务需求及数量大小,和财务规划及预算。第二步,根据以上这些信息来源进行以下三个事项: Ø Business Capacity Management(BCM):了解、规划、预测未来业务需要的服务; Ø Service Capacity Management (SCM):管理服务的执行效能、监看测量SLA内详细订定的对象,并收集、记录、分析、与产生报告及数据; Ø Resource Capacity Management (RCM):管理IT基础架构各个组件的执行效能、监看测量所有有限的资源,并收集、记录、分析、并产生报表和数据;
第三步,提供下列报告和计划: Ø Capacity Plan:主要分析目前的SLA需求、分析系统目前的执行效能、预测未来IT服务资源需求,然后针对要达到支持SLA所需的资源等级及变更提出建议和规划; Ø Capacity Database (CDB):CDB与Configuration Management Database(CMDB)不同,这个数据库主要是在容量管理时使用。它包含所需技术、业务、服务等级等等的详细数据。它是用来记录目前资源及服务执行效能等级,为Capacity Plan与Capacity Report提供所需的数据来源。 Ø Capacity Report:在一定期间内系统的执行效能,并与SLA数据对照结果。 ITSS培训 举例说明,如果事前先利用工具对目前产品的效能进行测试,提供详细的BenchMark数据,并预测未来IT服务资源需求,然后针对要达到支持SLA所需的资源等级及变更做出Capacity Plan,这样,项目建造成功的机率就很高。
|