《ITSS认证IT服务工程师培训教材》_试用版_2011_0311--IT服务技术(3)
本帖最后由 tom615 于 2014-10-22 11:48 编辑干货推荐:
ITSS题库
中国ITSS白皮书2.0【第二版】PDF
ITSS服务项目经理培训
ITSS服务项目经理培训——2-基本概念及方法
ITSS服务项目经理培训——3-IT服务设计
ITSS服务项目经理培训——4-IT服务转换
ITSS服务项目经理培训——5-IT服务运营(3)
ITSS服务项目经理培训——6-IT服务改进
ITSS服务项目经理培训——7-IT服务项目类别
ITSS服务项目经理培训——9-IT服务项目管理知识体系(1)
ITSS服务项目经理培训——10-IT服务项目群管理
2.3 常用IT 服务管理工具
随着IT 资源规模不断增加、业务复杂度的不断深入,IT 服务工程师只通过人工手段来维护已经不能满足业务这些需求。需要借助自动化的工具和手段来提高自己工作的有效性和效率。
IT 服务工程师在日常工作中通常会用到三大类工具:
[*]监控类工具。通过此类工具,IT 服务工程师能够对组织IT 环境中的资源进行监控,及时了解IT 资源的基础信息、动态信息、告警信息,为业务部门提供稳定、安全、持续的IT 服务;
[*]管理类工具。通过此类工具,IT 服务工程师能够实现通用的IT 服务流程管理,记录日常工作,与其他IT 服务工程师之间实现协调和沟通;
[*]其他工具。通过此类工具,IT 服务工程师能够进行重复工作、批量工作的自动化管理。
IT 服务工程师通过监控类工具,监控组织IT 环境中的告警信息,将告警信息在管理工具中记录和协调资源寻找解决方案,最后通过控制工具具体解决事件。
2.3.1 监控类工具
通过部署监控工具作为基础设施监控管理系统,实现对底层IT 资源对象的自动监控与管理功能。网络监控管理系统实现对组织内所有IT 对象的运行状况和系统性能进行实时的监控,并将监测信息以图形化的方式直观地展现出来。应用监控管理系统实现对组织应用系统的全面、细粒度的监控。在复杂异构的IT 资源环境中,构建面向业务的管理模型,实现多维度的展现业务运行状况和分析视图。
IT 服务工程师通过监控工具能够及时发现系统运行中出现的异常及时报警,同时通过预设性能监控阀值,在系统出现问题之前预知告警的发生。从而可以积极主动地发现问题,改变被动管理的局面,保障系统的高可用性。可对获得的告警事件进行自定义规则的事件过滤、事件合并、事件压制、事件关联分析等。避免大量非关键事件、同类事件信息干扰服务台的事件处理。
分 类
系统自带监控工具
早期的IT 服务工程师通过各系统自带的监控工具监控各系统,来保证业务系统的正常运行。各厂商自带的监控工具能够获得本产品的配置信息、性能信息和告警信息。IT 服务工程师可以登录每个系统的监控工具来查看系统信息。
由于这些监控工具是系统自带的,了解其自身的工作情况和内部结构,因此能够对本系统信息和运行状况进行最深入的监控。但是IT 服务工程师无法通过各个系统自带监控工具,全面了解组织内IT 资源的逻辑结构和综合信息。各个信息都分散存储在各个系统中,形成信息孤岛,不利于IT服务工程师进行告警的快速定位和解决。而且这种分散的监控方式,需要IT 服务工程师同时登录许多系统,耗费IT 服务工程师的工作时间和资源。
综合监控工具
综合监控工具与系统自带监控工具相比,具有全面、综合、分析的特点。IT 服务工程师通过该工具,能够从集中的监控平台, 查看组织内软硬件的全面信息,以及相互之间的关联关系。不需要分别进入每一个系统自带监控工具,就可以查看IT 运行全面信息。
综合监控工具完成对被管对象的集中监控、集中维护和集中管理,被管对象包括网络设备、服务器、PC 设备、数据库、中间件、存储、备份、安全设备、应用系统等。
IT 服务工程师通过该工具主要完成对被管网元配置、性能、告警信息的采集、处理和分析。通过网管数据的采集和处理,实现对系统的统一监控,形成告警数据、性能数据和配置数据。工具能够及时发现各类告警和性能异常,进行数据分析和整合,同时以适当的形式进行呈现;另一方面,IT 服务人员借助综合管理系统应能进行相关操作,及时完成维护管理职能。
[*] 全面:管理多种类型、厂家、型号设备,包括网络设备、安全设备、服务器设备、桌面PC、数据库设备、中间件设备、存储设备、备份设备等,用户在信息化系统建设及扩容时可集中考量性能问题,而不需要烦恼管理兼容性的问题;
[*] 分析:提供多种监控视图,包括地理区域图、网络拓扑图、机房拓扑图、机柜拓扑图、设备面板图等,不同视图之间可进行链接,能够满足不同层面、不同部门、不同地区人员的管理需要。能够对采集的各设备的各类信息进行关联分析和告警,通过过滤、压缩、整合,形成集中的告警信息;
[*] 综合:可监控不同开发商提供的应用软件系统,包括进程、应用接口、日志、文件目录、页面内容等应用软件特征。
监控信息
IT 服务工程师通过该工具能够对组织内确定的监控对象,监控4 类信息:网络拓扑图、配置信息、性能信息、告警信息。这些监控信息能够全面反映组织内IT 资源的部署情况、告警情况和使用情况。
网络拓扑
提供网络自动拓扑视图,而且可以实现逻辑拓扑视图,如:网络视图、主机系统视图和应用系统视图,以及定制的各种视图,并可以根据需要将网络的物理分布与地图系统结合,更加直观的反映整体网络结构。网络拓扑中,管理对象以节点的形式显示在页面上,拓扑图中实时显示网络元素和链路的状态,用不同颜色标识不同状态;根据拓扑图能快速进行定位故障,找到故障影响的设备和业务范围。
配置数据
组织内IT 设备的基础配置信息,例如网络设备的型号、软件版本、IP 地址列表、各接口列表、CPU、内存、硬盘、配置文件、设备上的板卡、插槽,并形成配置元素之间的关联关系。
性能数据
组织内IT 设备的使用性能信息,例如网络设备中的CPU、缓存、内存的利用率、各个端口的流量、各个端口状态等;网络设备中的转包率、丢包率、错包率等指标;网络设备的接口流量、带宽利用率等指标;可以模拟用户行为测试网络服务(HTTP、FTP、DNS、POP3、SMTP 等)的实际响应情况和服务状态。
监告警信息
监控工具通过多种监控方式采集具体对象的各项指标,并与各对象的基线指标进行对比分析,对于不匹配的信息将作为告警信息提交给相关的IT 服务工程师。监控工具能够实现监控数据的采集、归并、筛选、过滤、关联等预处理。告警信息主要包括告警类型、告警设备、告警状态、告警时间、告警详细描述。
监控方式
监控工具的监控方式一般采用代理和无代理的监控方式。
代理监控,是指安装在被管理的生产系统机上的一个或是多个代理程序,它负责采集被管理机上的一系列配置、告警、性能数据,并把数据传递给服务器数据库。
无代理监控,不需要在被监控系统中安装任何代理程序,而是定期地、主动地从被监控系统采集数据,从而把管理成本和对生产系统的影响情况减小到最低。
代理监控
(1)优 点
Agent 可以主动地采集数据,经过本地加工、过滤、聚合后,再传回给Manager,从而提高了监控数据的质量,减少了数据传输对网络资源的占用。
Agent 可以不间断地采集数据,即便网络出现了故障,Agent 也可以暂时把数据缓存在本地,当网络恢复以后,再把数据送回给Manager。
Agent 可以利用优化算法,从内核级采集并计算,生成第一手数据。
(2)缺 点
虽然Agent 可以以较低的优先级和较少的资源消耗运作,但还是无法避免这样一个问题,那就是当生产系统发生性能危机情况时,无法排除Agent 对系统产生了多大的影响。换而言之,Agent的存在,干扰了对生产系统的维护和性能问题的诊断。尤其是在有众多服务器的环境中,为了保障托管服务器的绝对的安全和无干扰。系统一旦以分布式运行,有代理方案的TCO 就会大大增加,由此造成ROI 大幅度地降低。当被监控点非常多时,Agent 的安装、部署、升级和维护成本将会比较
高。
无代理监控
(1)优 点
采用了与操作系统、数据库和应用系统厂商的性能监控方案进行集成的方法,可以在不修改被监控主机的情况下,对其进行全面的系统、数据库和应用系统性能管理。无代理方式把生产系统的日常运行和管理系统的操作分离开来,使得管理系统对生产系统的消耗和影响降到了最低点。
无代理监控方案采用非侵入式的方式来远程监控所有IT 系统组成部分,由此产生的大量收益将最终创造出更高的ROI。
无代理监控方式可以快速地安装、配置和部署,维护成本非常低。
(2)缺 点
无代理监控要求被监控系统已经有完备的性能监控手段去采集数据,而Manager 要做的工作只是定期去收集那些数据。因此,对于一些没有很好监控手段的系统来说,无代理方式就不可能去监控。
如果网络中断,无代理监控方案将无法获得数据。不过它会主动发送网络告警。但是在大多情况下,网络中断事件很少发生,即便发生了,业务系统也将停止运行。
由于无代理监控器是远程连接到生产服务器的,所以会产生较大网络流量。
完美互补
对于具体的监控对象以及监控对象负载的业务重要程度,可以利用有代理和无代理的监控方案的优缺点,选择适合的监控方式。
一般的方案是,对数据中心的主机系统,采用有代理方案,对于大量分布式的前置系统和终端系统,采用无代理方式。对于操作系统、网络以及任何支持SNMP 的设备、文件打印、MS Backoffice等,采用无代理方案,对于J2EE 性能诊断和主机系统,采用有代理方案。
2.3.2 管理类工具
IT 服务工程师通过管理工具,可以实现IT 服务管理流程和日常工作的自动化管理。通过管理工具,组织内实现运维工作的流程化、规范化、电子化和自动化。
IT 服务流程工具
IT 服务流程工具是IT 服务工程师工作平台,实现IT 服务流程的事件管理、问题管理、变更管理、配置管理的电子化管理,通过该平台能够:
[*] 自动接收监控工具提交的告警信息,将处理结果可返回监控工具;
[*] 记录所有IT 服务流程,支持各流程各种操作(创建、处理、转、派、追、退、关闭);
[*] 只关心自己要处理的事情,处理完成后工具将根据流程条件自动流转;
[*] 查看历史处理记录日志;
[*] 流程间相关信息可以相互共享和传递,提高工作效率;
[*] 全面了解组织的IT 资源基础情况和相互关系,以及整个生命周期的变动情况。
IT 服务流程工具的使用者主要是组织内的各类IT 运维人员,包括值班人员、维护人员、流程经理、管理人员等。工具主要是依据IT 服务流程规范和要求,根据组织内运维组织机构和人员组成情况,实现IT 服务流程工作的流程化、规范化、电子化和自动化,建立监控工具与IT 服务工程师之间的有机联系。
工具相关截图示例如下:
(1)服务台
为流程的起点和终点,是IT 服务部门和业务部门提供的统一服务窗口,统一受理事件、申告、投诉和告警等申请。
服务台建立了IT 服务工程师与用户之间单一联系点,统一受理用户的咨询、服务请求、任务分派、事件报修、投诉、任务追踪等情况,通过事件管理流程及时处理,及时跟踪和通报处理进展,借助知识库和以往事件的解决方案,解决大部分常规事件。
服务台可记录用户的服务请求,为用户发布服务、故障等信息,了解、跟踪服务的进度,对服务时间、服务质量、服务类别等进行统计分析,具有排班、交接班管理等功能。
(2)事件管理
对于事件管理的流程化处理,事件来源包括系统监控中的告警管理模块以及电话、传真、手工生成等,事件管理的核心是注重事件的快速解决和业务迅速恢复。
事件管理流程是负责解决IT 服务的事件、问题、投诉和客户请求等的IT 服务流程,具有事件接收记录,事件分类,事件指派,事件升级、事件处理/关闭,事件统计功能。对关键的告警事件执行派单操作,实现处理过程的闭环管理,做到故障处理过程闭环化、流程化、规范化、制度化。
(3)问题管理
寻求故障根源,解决存在或多发问题的流程,问题管理的核心是注重消除或减少事件的发生,实现系统的逐步优化,提高现有系统的稳定性。
(4)变更管理
对变更请求进行记录、跟踪与管理的流程,消除或减少变更对生产系统的影响和风险,保证变更的顺利完成。
(5)配置管理
配置管理可以管理组织中IT 资源的整个生命周期,从采购,使用到报废,包括软硬件配置信息。它主要有三部分工作,登记组成服务的资产信息,登记这些资产之间的关系,并且维护这种关系使得其他管理流程可以高效的使用这些信息。这些信息统一记录在配置管理数据库(CMDB)中。另外,配置管理追踪和监控资产配置项在整个生命周期内的变化。它不仅仅为问题与变更管理提供相关的资产信息,同时也提供了例如服务合同、各资产项以及组织机构之间关系的查询等功能。
(7)知识库管理
通过对知识库系统维护和使用,不仅可以在故障自动处理和人工处理的过程中在知识库中得到相关故障维护的分类和快速定位,找到匹配的处理案例,便于处理人进行借鉴,而且知识库具有的业务帮助功能,使相关人员可以通过关键字查询业务帮助、产品、市场活动、发生过的处理流程、电子文档等。
IT 服务管理工具,能帮助各级IT 服务工程师提高技能水平,简化IT 服务任务。同时降低对具体某个个体依赖的手段,通过知识经验的积累和共享来完成。
将成熟可行的解决方案录入知识库,进行知识共享,方便查询,快速排除故障,达到提高服务能力和效率的目的。各级IT 服务工程师在工作中将事件、问题的表现、原因、处理方式、解决办法等创建在知识库中,通过长时间积累,将在知识库中包含大量运维信息。知识库主要功能,包括采集、分析、运维知识库等不同层,包括知识的输入、分类、查询、检索、文档管理,通过知识建设降低对个人依赖,实现运维知识的有效共享。
电子工单工具
IT 服务工程师的日常工作,在进行IT 服务流程的处理外,还需要进行其他方面的IT 运维工作,例如自动执行排班和值班计划、按周期运行的作业计划、业务系统的其他申请等。电子工单工具作为IT 服务流程工具的补充,实现IT 服务工程师其他的日常工作自动化处理。
(1)值班管理
值班管理用于实现统一的电子化值班管理,规范值班管理制度。值班管理功能包括:参数化的班次周期的个性化定制、异常交接班的处理和记录、提供灵活的提醒机制、全面地记录值班过程中的大量事务、为绩效管理提供考核数据。
将值班日志、交接班记录、维护作业记录,以及由各项维护规程中确定的周期性维护作业计划等任务,集成至该工具中,IT 服务工程师使用该工具能够准确、高效的完成各项维护任务。
IT 服务工程师通过该工具,实现灵活的排班、倒班、交接班、替班。能够记录值班人员在上班时的工作记录,执行值班中相关的作业计划,并将重要内容记录于值班日志。
(2)作业计划
任务计划为IT 服务工程师提供一个灵活、高效地计划任务的解决方案,提高了IT 服务的水平。任务计划功能包括:多样化的任务类型选择、个性化地计划一项任务、系统巡检、提供灵活的提醒机制、记录任务计划的执行情况、辅助变更管理和发布管理中的任务规划。
(3)公告管理
[*] IT 服务工程师通过公告管理实现信息通知;
[*] 发布信息给所有使用本系统的用户;
[*] 用户能够查看发布的公告;
[*] IT 服务工程师可查看公告的查看信息。
2.3.3 其他工具
使用这些工具,IT 服务人员能实现对网络终端进行集中统一的管理,能够从被动分散的维护转变为主动集中的控制和管理。
应用程序进程管理工具
进程管理主要是为IT 服务人员提供管理客户端应用程序进程的手段,使IT 服务人员能够根据企业整体计算机的管理需要、各单位内部的管理需要,制订出多层次的管理方案。
进程管理的目的是使组织内部的计算机能够根据组织工作需要而发挥作用,杜绝不相干的应用程序运行,降低系统故障的概率,同时也对应用程序的合法性进行管理,避免其他程序对系统安全性造成负面影响。
进程管理包括如下几项功能:
[*] 查询计算机运行的进程;
[*] 实时结束进程;
[*] 制订进程管理策略;
[*] 部署进程策略。
补丁管理工具
软件分发主要是为IT 服务人员提供对客户端PC 安装系统补丁、升级应用程序、安装软件、统一执行计算机指令等功能,使IT 服务人员不用每台机器都亲自动手,以最省时省力的方法来完成那些烦琐的批量任务。
具体的功能可以分成如下几类:
[*] 自动更新Microsoft 发布的重要和关键补丁,包括Windows 操作系统补丁,IE 补丁,office补丁,SQL 补丁等;
[*] 分发MSI 应用程序包,升级、安装或卸载应用程序;
[*] 分发应用程序和数据到客户端PC 并统一执行。
通过预定执行时间、执行具体时段、对于当天没有分发到位的可安排后面几天执行、未开机的采用唤醒等多种策略来确保分发任务执行的有效性。
为了保证分发的准确性,设定分发条件和分发结果,使分发成功与否非常清晰地反映给IT 运维人员。
软件分发工具
软件批量安装,指的是IT 服务人员可以为客户端PC 统一安装软件。通过软件批量安装功能,IT 服务人员可以避免为安装同一软件而需要进行的大量的重复性工作。软件批量安装功能可以批量安装的软件包括MSI 程序包、应用软件和数据文件,通过软件分发的功能,把需要安装的软件通过FTP 下发到客户端PC 本地运行。
远程桌面管理工具
远程桌面管理主要是协助IT 服务人员遥控远端主机,当远端主机发生一般故障,如发生显卡驱动不正确或者打印机无法打印等问题的时候,IT 运维人员可以不用到该主机所在地,而只需要远程接管这台主机的桌面到本地主机,然后进行必要的配置。这样做的好处是不需要IT 服务人员亲赴现场,从而不需要为一个3 分钟就可以搞定的问题,而花20 分钟在途中。从而降低了运作成本,节省了时间。
网络访问管理工具
网络访问管理主要是针对终端PC,通过网络访问管理策略的部署,可以针对不同的PC,授予不同的网络访问权限,从而达到管理PC 网络行为的目的。
网络访问管理提供“时段定义”、“策略定义”、“策略部署”,“端口查询”等功能。
定义网络访问策略:通过对访问目标IP 地址范围、目标主机的哪些应用服务端口、在什么时间段等进行定义,形成一个关于PC 访问端口的策略。
可以定义多套策略,用来分别针对不同的管理需求。定义策略分两部分,第一部分为增加一个新的策略,并给这个策略起个名称,同时把相应的描述信息输入;第二部分为给一个策略设置详细的访问权限和访问对象。
访问策略部署:将已经定义好的策略,部署到不同的终端PC 上,进而通过策略的启动和停止,使策略在什么样的终端PC 上及在什么时间范围发挥作用。
接入安全管理工具
接入安全控制提供了对非法用户接入网络、终端IP 非法变更、卸载关键软件等进行了阻断及重定向等管理手段。其主要特点为:
严密的扫描技术,接入安全管理工具服务器提供不间断的实时扫描功能,即时扫描终端PC 或其他设备的接入情况,并将扫描的信息传递给管理员,管理员便可以针对非法接入的PC 采取应对措施,从而保证了数据的安全性。
对不合要求的PC 采用阻断和重定向的策略,启动策略部署后,阻断服务器便实时地对网络内部违法策略的设备执行策略,减轻了管理员的工作量,同时也保证了数据的安全性。
B
桌面设置管理工具
桌面设置管理是主要针对终端PC 的系统设置的管理。通过桌面设置管理,IT 运维人员可以修改客户端一些常用的系统配置,达到对客户端的操作系统进行统一配置管理的目的。
外设管理工具
外设管理主要是针对终端PC 的USB 设备、串口设备、并口设备、PCMCIA 设备、智能卡、光驱及软驱等外设的管理。通过外设管理策略的部署,授予不同PC 不同的外设使用权限,达到对PC外设访问许可的统一策略化控制的目的。
外设策略定义包括“定义USB 策略”、“定义串口策略”、“定义并口策略”、等绝大多数外设的控制策略,根据需要,可以定义多套策略,用来分别针对不同的管理需求。各种策略定义的模式和方法都是一样的。
预警管理工具
IT 服务人员的工作职责是维护网络实际的正常运行秩序,出现异常情况能够及时处理。但是在实际的网络运行中,IT 服务人员缺乏实际的手段来获取网络和计算机运行情况。也就无法做到随时跟踪网络异常,更无法及时处理。
网络预警分析的目的就是通过客户端代理程序,获知网络的异常情况,并汇报给服务器。服务器转发给IT 服务人员,供IT 服务人员处理。
本章主要从常见IT 服务类型、常用IT 服务管理流程和常用IT 服务支撑工具三个方面,向IT 服务工程师介绍了在日常工作中需掌握的通用IT 服务技术。
本章知识要点包括:常见IT 服务类别及形态;常用IT 服务管理流程间及流程中关键活动的关联关系;常用IT 服务支撑工具的用途、功能特点及适用范围等。
本章实践要点包括:明确IT 服务工程师在IT 服务管理流程中的角色定位及与其他角色的互动关系和相互影响;根据现实IT 服务技术需求进行常用IT 服务支撑工具的选型及组合应用。
本章参考资料为:《IT 服务 分类与代码》和《IT 服务 运行维护 第1 部分:通用要求》。
返回到首页 《ITSS认证IT服务工程师培训教材》_试用版_2011_0311连载http://ITIL-foundation.cn/thread-36464-1-1.htmlITSS、培训、服务、资格、评估、ITSS培训师、ITSS评估师、实施ITSS、ITSS符合性、ITSS服务工程师、ITSS服务项目经理、ITSS标准、ITSS咨询、ITSS工具、IT服务监理、ITSS体系、ITSS服务质量、评价、指标、运维、治理、咨询、ITSS出版物、ITSS产品、服务监理工具、服务质量评价工具、标准符合性评估工具、服务管理工具、服务治理工具、系统监控工具、辅助决策分析、服务支持管理、基础设施监控、ITSS基础教材、ITSS标准、ITSS服务人员培训教材、标准化、专业化、人员(People)、流程(Process)、技术(Technology)和资源(Resource),简称PPTR、规划设计(Planning&Design)、部署实施(Implementing)、服务运营(Operation)、持续改进(Improvement)和监督管理(Supervision),简称PIOIS、服务交付规范、资源要求、外包管理、服务交付、分类、代码、服务指南、通用要求、指标体系、ITSS落地实践交流-QQ群:21542747
感谢分享
页:
[1]