20150624 MONICAZHANG 续上
5.1.2 系统功能结构5.1.2.1 系统组成结构与功能 ITSS体系
整个综合监控管理平台基于BMC ProactiveNet Performance Manager(BPPM)和BMC Performance ProactiveNet8.0两大系列产品,BPPM系列产品主要提供对IT基础架构中各IT部件的监控与管理,如对网络、操作系统、数据库、中间件、应用等监控与管理,并提供集中的用户监控管理界面对系统性能和可用性以进行集中监控,使用集中的配置管理界面对监控策略进行集中的配置和管理。ProactiveNet主要提供集中的事件管理平台、服务影响视图和动态基线性能平台,通过集中事件管理平台可实现事件的处理策略和定制,防止事件风暴的发生,同时通过各种事件处理策略的定制丰富事件内容,从而为ITIL流程中的事件管理流程提供详细的事件信息。
在整个BPPM系列产品中主要包括有代理监控的BMC Patrol代理程序和无代理监控的BMC Portal客户端 。 Patrol代理程序包括agent(Patrol Agent智能的执行机构)、知识模块(Patrol KM监控对象、报警及相应处理措施的定义)、Common Service(Patrol分布式通信中间件、用户安全控制及通信控制模块的互备) 、管理控制台(被管对象集中监控、管理和监控策略的集中配置和管理)。 ITSS团购
Portal客户端包括BMC Performance Manager Console和RSM采集器。可配置对主机、网络设备、数据库、中间件等网络基础设施的无代理监控。 ProactiveNet是一个集中的事件管理平台,包括事件处理单元(BMC Event Impact Manager)、事件适配器(BMC Event Impact Manager Adapter)、事件管理控制台(BMC Event Impact Explorer)、动态基线控制台(BMC ProactiveNet Baseline)、业务影响管理(BMC Services Impact Manager) 下面按数据采集层、数据处理层层及数据展现层介绍各部分的功能。
5.1.2.1.1 数据采集层 在整个监控管理平台方案中,数据采集层的主要作用是通过BMC相关管理模块的工作,生成告警数据、性能数据。告警和性能数据采集主要通过BMC代理、知识模块及网管软件产生。 u 告警数据和性能数据的采集(有代理监控) 通过在业务系统运行所依赖的服务器上安装BMC的代理或使用Portal无代理监控来对业务系统运行的软件环境进行监控与管理,包括对系统、数据库、中间件、应用、存储等,这些监控对象通过BPPM相应的知识模块或RSM采集器对其进行监控与管理。通过网络管理模块实现对网络的性能监控,并在同一用户界面上进行展现。网络管理模块通过标准的SNMP协议获取网络性能和告警信息。 BMC的代理程序及其知识模块可通过远程分发的方式进行安装和升级,其运行消耗的资源很少,代理程序同BMC其它管理模块之间的通信通过TCP的某一端口进行,相对于SNMP或其它的通讯方式,传输安全可靠。BMC代理是完全智能的,可不连任何控制台通过知识模块完成相应的监控功能,并能在本地进行数据存储及处理,可通过公开的API、知识模块和SNMP的方式将事件和性能数据发送给第三方的管理软件。 ITSS考试 BMC Portal可通过浏览器访问配置管理控制台。不需在被管环境安装任何代理程序,只依赖于网络通断性和标准的端口、协议开放。 以下分节介绍BMC ProactiveNet Performance Manager整体的体系架构、Unix操作系统告警和性能数据的采集、数据库告警和性能数据的采集、中间件告警和性能数据的采集、存储告警和性能数据的采集、应用告警和性能数据的采集。 BMC ProactiveNet Performance Manager(BPPM)体系结构 BPPM在每一个被管对象安装代理和相应的知识模块实现对被管对象运行状况的监控,缺省的知识模块巳进行了预配置,以确定监控哪类资源、报警门阈值、恢复措施等。管理人员可使用集中的控制台进行统一的监控策略的配置。安装在被管服务器上的代理向主控台发出系统的有关信息,管理员在主控台上可以看到全局的情况,并且可以定义系统的参数,控制系统的运行。 BPPM典型的体系结构图如下所示: BPPM Patrol Agent/Console 上图中,代理程序通过被管服务器上的操作系统进行调度运行,通过知识模块确定被监控对象的监控参数、阈值的定义、报警的触发条件、报警时的恢复动作等。在BMC提交的监控管理平台解决方案中,包括了针对操作系统、数据库、中间件、网络等监控对象的知识模块。代理程序是一个完全独立的智能程序,无需同任何监控管理控制台连接就可完成大部分的监控管理操作。知识模块加载后通过缺省的监控参数定义对被监控对象进行监控与管理,可按用户定义的值在本地保存指定天数的告警和性能数据,可通过公开的API、SNMP、命令行接口、性能数据传送知识模块等方式提供同第三方管理软件的集成。 BPPM采取三层次架构进行性能和告警数据的采集、汇总和展现,采集通过代理和知识模块进行,通过Common Service(RT Server和Console Server,多个RT Server可进行互备)进行数据的汇总,通过C/S界面(Patrol Central – Windows,可集成在BMC Portal中)和B/S界面(Patrol Central – Web,可集成在BMC Portal中)进行展现。三层架构如下图所示:
Patrol三层体系结构 上图中,RT Server和Console Server形成了Common Service。 q Agent Agent是自主的智能多任务代理。它安装在每个被管理的服务器上,可以自动操作和发现被管理的服务器上所有已知的应用,数据库和系统部件,监测用于多个控制台的数百个参数;检测事件并使事件相互关联;初始化纠错操作;并提供事件通知和升级。由于Patrol代理是完全自动化的,所以它不需要控制台连接来进行日常操作,这使得它极端的有效和稳定。 Agent与需要经常进行网络轮回和在每个服务器上加载一个控制台 的分层体系结构不同,它使用同级间配置,与控制台完全独立。这样只需要一个控制台就可以监控整个系统的运行情况。 ITIL培训 Agent与众不同的一个关键特点是代理体系结构中内置的公开的API。该API提供了更有效、安全和可靠的集成方法,用以查看和控制外部应用和第三方管理框架内的事件。该API允许这些外部部件与代理进行交互作用,以完成一系列管理活动,其中包括生成一个事件;关闭、确认或删除一个事件;升级一个事件;完成事件查询和查询对象状态。
q 知识模块 知识模块提供了用来发现、监测和检查事件、采取正确操作以及信息通知所应遵循的规则。针对特定的产品采用专用管理模块,这样使用户对于内部的非标准应用和进程也可以集中管理。BMC监控平台的的管理框架是易于扩充的。通过为第三方产品的最新版本提供及时的管理支持,用户也可以插入更新的知识模块。 – Unix操作系统数据采集 ITSS培训 通过在被管的Unix服务器上安装代理和相应的Unix操作系统知识模块,可实现对被管服务器上Unix操作系统运行情况的监控。BMC的Unix知识模块支持多种UNIX操作系统,通过UNIX的知识模块为任何规模的服务器提供丰富的资源管理和监控功能。它可以自动监控CPU,硬盘,网卡,操作系统日志文件,内存及交换区等诸多参数的工作情况,为Unix操作系统提供不间断监测,发现问题时提出警告,并提供自动修复功能,不仅使管理员从费时的重复工作中解脱出来,专心于其它任务关键的活动,而且帮助系统管理员从被动的事后管理转化为主动的事前监控,从而保障了系统的高可用行和高可靠性。 下图所示是BPPM针对某一Unix操作系统采集的性能数据的展示图。
BMC代理采集的Unix性能数据性能 BMC针对Unix操作系统的知识模块提供以下主要功能: 直接连到操作系统的核心,提供快捷方便的对系统核心的存取。 利用BMC的数据点技术,该技术使管理员能够迅速检索附加的与上下文数据相关的参数值。 自动监控CPU的综合利用率及CPU的各详细资源使用情况。通过监测CPU的利用情况识别可能降低系统性能的用户生产率的活动。这有利于去除或重新安排那些使资源萎缩的无必要活动,提高系统的性能和吞吐量。 自动监测系统内存的使用情况,识别由过多分页和交换(或数据被装入卸出内存的频度)所带来的性能问题。问题被发现之后就会通知管理员采取措施。 ITSS认证 实时监控交换区SWAP,确定SWAP空间的使用情况。识别由于SWAP剩余空间过少而引起的系统性能问题。可以及时采取措施,保障系统的高可用性。 监测TCP/IP上的通信状况,通过研究网络使用趋势分析中有用标准值来测量网络的运行情况。如果发现问题,KM for Unix就通知管理员,如高数据冲突率(可降低网络性能和阻碍通信。利用提供的信息,管理员可加强网络性能,例如,NFS的通信能力就可从客户一端的缓冲受益,提高用户生产率)。 监测文件系统的使用情况,确定哪个磁盘被占用得很多,可能没有自由空间。这条信息可帮助系统管理员迅速识别和消除潜在的瓶颈,减少丢失数据和磁盘错误的危险,提高系统可用性。同时可以自动监控操作系统的日志文件。 在系统级提供安全监控,包括口令、探测不恰当的权限设置和以及系统级日志方式存取等。这些都与已有Unix安全设施不冲突,但是加强了管理控制以阻止未授权的系统存取。 自动监测打印队列的大小,在满之前通知管理员,从而避免了不必要的打印错误和用户效率损失。KM与Berkeley和SVR4打印管理系统完全兼容,通过对行业标准的支持提供灵活性。 监测磁盘I/O和占用情况,定位网络中的热超限使用的磁盘。热磁盘可能成为系统瓶颈,或者更严重的导致昂贵的系统错误。有了这些信息,管理员就可以有效地将数据文件分散到多个磁盘上,或使文件系统分布在几个磁盘上,从而降低不可预计的故障时间和支持企业范围内的更高的系统可用性和吞吐量。 跟踪系统用户数和精确决定正在运行的进程数。管理员可以确定哪个进程占有对系统资源的最多请求。当请求不太多时,KM,可自动提示管理员,促使管理员在系统能力极限达到之前,在系统性能未显著下降之前采取措施。 通过每一个监控参数报警阈值和相关报警条件的定义,一旦触发报警时,告警信息将实时传送到管理控制台。可根据用户定义的值在本地保存指定天数的告警信息和性能数据。 ITSS软件
– 数据库数据采集 通过BMC ProactiveNet Performance Manager for Database、Application、Middleware产品中针对数据库管理的知识模块可以对不同的数据库进行告警和性能数据的采集,包括Oracle、DB2、Sybase、Informix、MS SQL Server等。通过针对数据库管理的知识模块可以实现以下主要功能: 为数据库提供不间断的监测。其中包括自动发现环境,在监测到潜在的问题或错误时发生警告和警报,在适当的情况下执行自动纠正例程; 在被授权的情况下,通过分配最大的可用空间来调整增长的数据库对象的大小,从而避免空间不足的问题影响用户生产率; 为有关恢复或用户定义操作的报告提供解释数据点。管理员可以通过一个本地数据点快速地检索关于参数值、历史和警报的更详细的上下文数据。也可以使用图形解释具有历史参数的上下文中的进程清单和SQL脚本; 监测活动事务总数数据库实例限制的百分比。当这个值达到100%的时候,用户会发现Database的错误增加了。BMC提供了自动化的监测和先进的报警功能,它可以将管理员的注意力从其他正常运行的关键任务上转移过来,在用户生产率受到影响之前解决这一潜在的问题; 自动测量档案目的设备上的可用自由空间量,并确定适合于剩余空间的档案日志数量。为维护充足的档案容量提供有价值的管理效率。基于预先确定的警报值,可以配置Patrol,使它能够压缩这些日志文件以创建附加的空间; 使用独有的SQLVIEWER功能,管理员可以在SQL执行期间有效地获取关于这些SQL语句作者及其初始来源的详细信息; 跟踪在为服务器实例指定的时间段内发生的存取连锁行的次数; ITSS工具 测量导致等待的自由缓冲区访问尝试的百分比。; 跟踪在每个轮询期间等待阻塞恢复的比率,它为数据库性能提供了一个关键的基准数据,高的等待率表明存在潜在的表冲突问题; 监测缓冲命中率,显示了读取数据缓存的操作与全部读操作的比率; 监测一段时间内关键表空间的增长情况,当表空间的可用性低于用户定义的水平时发送一个管理警报; 知识模块中其它支持管理效率的部件包括: 添加到报告提示和菜单命令中的响应功能; 格式化的报表; 以批操作的方式执行SQL任务以及执行远程SQL命令的能力; 同时管理多个数据库; 添加监测参数,设置参数报警值,确定自动恢复操作的能力; 先进的参数报告,包括多行图形和三维图表。 通过每一个监控参数报警阈值和相关报警条件的定义,一旦触发报警时,告警信息将实时传送到管理控制台。可根据用户定义的值在本地保存指定天数的告警信息和性能数据。
– 中间件数据采集 通过BMC ProactiveNet Performance Manager for Database、Application、Middleware产品中针对中间件管理的知识模块可以对611所的中间件进行监控,实时获取中间件运行时的告警和性能数据。 ISO20000培训 例如针对WebSphere主要提供以下主要功能: 监控WebSphere服务器的运行状况和资源消耗情况; 监控J2EE各部件的性能和资源消耗情况,如JSP、Servlet、Java Bean、EJB; 监控Java虚拟机的运行情况,如可用空间大小、垃圾回收情况等; 监控JDBC的运行情况,如可用的数据库连接数、连接上执行的SQL语句的效率等; 监控JMX的运行情况。 监控JTA的情况 通过每一个监控参数报警阈值和相关报警条件的定义,一旦触发报警时,告警信息将实时传送到管理控制台。可根据用户定义的值在本地保存指定天数的告警信息和性能数据。
本帖关键字:ITSS ISO20000 |