20150624 MONICAZHANG 续上
5 功能模块详细设计5.1 监控与集中事件管理平台5.1.1 监控系统体系架构
根据监控管理平台“集中监控、集中维护、集中管理”的原则,以及611所IT环境分布的特点,我们建议611所的监控管理平台采用如下的体系架构: ISO20000培训 附图1. 体系结构图 本平台从611所业务应用角度出发,着重于及时发现各类告警和性能异常,进行数据分析和整合,同时以适当的形式进行呈现;另一方面,维护人员借助该系统能够进行相关操作,及时完成维护职能。 其主要功能描述如下: u 实现对业务系统的运行状态的统一监控。 ITIL培训 u IT系统的被监控对象包括平台部件类的主机、数据库、中间件、网络、存储、机房等设备和应用部件类的各系统的应用软件。 u 数据采集层通过与被管系统的接口采集网管数据,送到处理层进行数据处理。 u 数据处理层一方面对数据进行判断产生告警信息并发送到展现层,另一方面在数据库集中存放性能数据。 u 数据展现层不仅展现告警信息,而且展现各种监控视图,如服务影响视图。 u 预留与服务管理平台的接口,监控管理平台有选择性地将告警信息送到服务管理平台,形成事件提交运维管理人员处理。 下面按数据采集层、数据处理层及数据展现层介绍各部分的功能。 ITSS培训
5.1.1.1 数据采集层 数据采集层,主要是完成各类数据的采集工作,建立相关的数据采集接口,并能够根据需要定制在特定的时间(或周期性)进行数据的采集,并为数据处理层提供相关的数据。目前采集可以支持的手段有:RPC、SNMP、SYSLOG、专用Agent、脚本方式等。这一层主要是由通过设置在各个点的各类采集设备组成。 ITSS认证 该层管理基础架构组件和应用系统的运营状况、可用性及性能等,被管对象主要分为两类,一类为平台部件,包括主机、数据库、中间件、网络、存储、硬件等;另一类为应用部件,主要针对各业务系统的各类应用。主要功能: u 采集数据,包括告警数据、性能数据 ITSS体系 u 从服务器、数据库、中间件、网络以及其它方面监视基础设施的运行状况 u 确定和诊断事件,快速恢复服务 u 控制环境并将其自动化 ITSS软件 系统通过获取相应的数据达到监控整个系统的目标。告警数据用于及时反映系统运行状态。性能数据用于评价平台运行质量,通过分析历史指标的情况、预测未来的发展,提升管理层次,达到面向服务品质的管理。
5.1.1.1.1 告警数据 告警数据分为故障告警、性能阈值告警等。 ITSS团购 u 故障告警:指平台的非正常状态触发的告警事件,以及从平台日志中提取的故障事件(部分平台日志中已有明确的故障事件说明)。 u 性能阈值告警:指性能指标数据超过设定阈值触发的告警事件。 在本解决方案中,我们采用BMC ProactiveNet Performance Manager(BPPM)采集告警数据,以及监控管理。 同时,为了保护用户的已有投资,利用BMC的集成模块,也支持第三方管理软件,如Tivoli/HP/CA TNG等,共同完成对各类应用及其服务器设备等各类数据进行实时的数据采集,收集各项性能指标,及时发现影响业务系统的各类告警和性能异常,发送告警事件。 ITSS工具
5.1.1.1.2 性能数据 性能指标分为二级: u 一级性能指标:指对系统运行最重要的,属于核心和常用的,有明确阈值定义,能够判断系统是否正常运行的性能指标。 u 二级性能指标:对于分析系统性能有参考意义的,一般不设定阈值。 性能指标通过设定阈值来触发相应的性能阈值告警,对于性能指标的阈值定义,既支持静态阈值方式,也支持动态阈值方式。静态阈值和动态阈值既可以单独工作,也可以协同工作,实现灵活的阈值设置。 在本解决方案中,我们采用BMC PoractiveNet Performance Manager(BPPM)采集性能数据,BPPM支持基于Agent(代理)和Agent-less(无代理)的采集方式。 基于Agent的采集方式采用单一Agent架构,既可以采集告警数据,同时又可以采集性能数据,并且资源消耗少,支持广泛的系统及平台。 ITSS考试 无代理的采集方式支持WMI、Telnet、SSH、SNMP等多种方式,通过部署在管理端的BMC Remote Service Monitor进程可以实现对被管理对象的无代理监控。
本帖关键字:ITSS ISO20000 |