Nagios监测BGP会话时会有哪些报警信息
来自:网络 【2014年2月17日 51CTO外电头条】作为一款用途广泛的网络监控工具,Nagios可以监测各种网络元件(比如路由器和交换机)的健康状况。除此之外,Nagios经过配置后,还可以监测路由器的边界网关协议(BGP)会话;只要现有的一个或多个BGP会话出现了什么问题,就会发出警报。现在有几个面向Nagios的BGP监测插件工具。这些工具适用于监测路由器的关键BGP对等体,并且为它们发出警报。这篇教程将解释如何使用Nagios插件工具,监测BGP邻居。 监控软件 测试的平台[*]测试后证明,与思科ASR 1000系列路由器非常兼容。
[*]测试后证明,与思科3700系列第三层交换机非常兼容。
[*]应该与其他思科设备也能兼容。
[*]测试后测试,与Quagga路由器无法兼容。
[*]未在JunOS上进行测试。
测试的拓扑结构wyfs02/M02/12/46/wKioL1MBeUjSU_9jAADbRPadsrI661.jpgNagios可以监测路由器1的所有BGP会话。BGP邻居AS 50和AS 70对正常工作而言至关重要,所以一个单独的脚本将用于监测这些特定的邻居,万一它们变得联系不上,就发出警报。在Nagios中为路由器1创建主机在我们开始入手之前,我们将为路由器1定义一个主机,如下所示。 nagios实施
# vim /etc/nagios3/conf.d/bgp-host.cfg define host{ use generic-host host_name router-1 alias router-1 address 100.100.100.100 [*]}
监测路由器1的所有BGP会话Nagios随带一款名为check_bgpstate的内置工具,可以使用SNMP,检查路由器的BGP状态。这款工具可以手动运行,通过提供必要的参数,检查路由器1。
# /usr/lib/nagios/plugins/check_bgpstate -c myCommunity 100.100.100.100 [*]OK: host '100.100.100.100', sessions up: 4, down: 0, shutdown: 0
现在,我们将在Nagios中定义一个命令,以便使用这个工具,开始监控路由器1的所有BGP会话。 nagios培训
# vim /etc/nagios-plugins/config/bgp.cfg define command{ command_name check_all_bgp command_line /usr/lib/nagios/plugins/check_bgpstate '$HOSTADDRESS$' -C '$ARG1$' [*]}
鉴于该命令已准备就绪,我们将定义一个新的服务,这个服务将把该命令应用于路由器1。
# vim /etc/nagios3/conf.d/bgp-service.cfg define service { host_name router-1 service_description All BGP session summary check_command check_all_bgp!myCommunity check_interval 1 use generic-service notification_interval 0 ; set > 0 if you want to be re-notified [*]}
如果需要添加额外的路由器,我们只需要为路由器2、路由器3等其他路由器定义相应主机,并且将命令check_all_bgp应用于每一个路由器,就像应用于路由器1那样。 nagios配置在重新启动Nagios服务之前,通过执行一次试运行(dry run),证实所有的参数都已正确配置,如下所示。
[*]# nagios3 -v /etc/nagios3/nagios.cfg
如果一切看起来没问题,我们就重新启动Nagios服务。
[*]# service nagios3 restart 开源监控软件
要是一切运行顺利,Nagios应该会检查所有BGP会话的概要情况,这可以在Nagios门户网站处(即http://serverIP/nagios3 > Services)进行证实。wyfs02/M00/12/46/wKioL1MBenGCGCdvAADHxmK125o624.jpg监测路由器1的某个或某些BGP邻居前面的check_bgpstate工具只为BGP会话概要(即上面3个,下面1个)提供了警报。要是检测到任何有问题的BGP会话,用户就需要人工登录到路由器,检查哪个BGP会话出了故障。至于关键的BGP邻居(比如拓扑结构图中提到的AS 50和AS 70),你可能想要监测个别的BGP邻居。想让Nagios能够监测某些BGP邻居(比如AS 50和AS 70),并发出警报,就要使用一个名为check_bgp的单独脚本。准备check_bgp脚本check_bgp脚本(最新版本是0.4)可以从官方网站([ ttp://exchange. /directory/Plugins/Network-Protocols/BGP-2D4/check_bgp/details]http://exchange. /direc ... 4/check_bgp/details)下载。下载该脚本后,它被拷贝到Nagios插件目录,并更名。另外针对脚本,设置必要的权限。
# cp check_bgp.0.4.pl /usr/lib/nagios/plugins/check_bgp.pl [*]# chmod +x /usr/lib/nagios/plugins/check_bgp.pl
鉴于脚本已准备就绪,我们先进行一番试运行,检查脚本的输出结果。
# cd /usr/lib/nagios/plugins/ # ./check_bgp.pl -H 100.100.100.100 -C myCommunity -p 50.50.50.50 [*]OK - 50.50.50.50 (AS50) state is established(6). Established for Duration.
鉴于脚本已准备可供使用,我们接下来配置Nagios。准备Nagios首先我们在Nagios中定义一个命令,该命令会检查某个BGP对等体。 nagios安装
# vim /etc/nagios-plugins/config/ define command{ command_name check_bgp command_line /usr/lib/nagios/plugins/check_bgp.pl -H '$HOSTADDRESS$' -C '$ARG1$' -p '$ARG2$' [*]}
鉴于命令已定义完毕,我们将定义两个新的服务,它们将把该命令分别应用于AS 50和AS 70。
# vim /etc/nagios3/conf.d/bgp-service.cfg define service { host_name router-1 service_description BGP check with AS 50 check_command check_bgp!myCommunity!50.50.50.50 check_interval 1 use generic-service notification_interval 0 ; set > 0 if you want to be re-notified } define service { host_name router-1 service_description BGP check with AS 70 check_command check_bgp!myCommunity!70.70.70.70 check_interval 1 use generic-service notification_interval 0 ; set > 0 if you want to be re-notified [*]}
在我们重新启动Nagios服务之前,执行一次试运行,证实所有的参数都正确配置,如下所示。
[*]# nagios3 -v /etc/nagios3/nagios.cfg
要是一切看起来没问题,我们重新启动Nagios服务。
[*]# service nagios3 restart
Nagios应该会开始监测路由器1中的两个BGP邻居:AS 50和AS 70。两个BGP对等体的状态可以在Nagios门户网站(http://serverIP/nagios3 > Services)中加以核查。要是任何一个BGP会话中出现了可疑情况,Nagios就会发出警报。要是一切运行顺利,Nagios门户网站中应该会显示下面这个屏幕截图。wyfs02/M02/12/45/wKiom1MBer2D9dLoAADBq0BSCiM768.jpg想做Nagios, Zabbix,Cacti,iTop各种交流的,可以进入开源监控工具Nagios交流QQ群号 :476809427
页:
[1]