导读 | OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。它能以史上第二快的速度,对事件进行智能的组织、排序和分类,从而极大地提高团队在处理运维告警与事件时的协作能力 |
[url=][/url] 1、 认识OneAlrt 通过使用 OneAlert 的监控工具集成功能,轻松对接第三方监控工具告警事件。每一个需要集成的第三方工具,都是一个OneAlert App应用,每个应用的安装方式有些差异。 通过Agent集成,如Zabbix、Nagios、Solarwinds、VMWare vSphere 等工具,基本上需要在监控服务器部署告警Agent探针,该探针的作用是将监控工具的告警信息转发至云平台。 直接集成[无Agent],针对阿里云、腾讯云、OneAPM SaaS版、监控宝、Open-Falcon 等工具,仅需要界面配置,直接通过公网集成,无需安装Agent探针。 1.1、官方文档 官方wiki:quick-start/
官方wiki有多种告警集成方式,文中以Zabbix集成为例,具体请阅读官方wiki。 1.2、Zabbix集成 支持Zabbix2.2、2.4 和 3.0版本,将告警事件集成至OneAlert ,实现统一压缩合并、分派和通知
使用一键式安装模式,支持centos和redhat,使用通用安装版,支持其他版本linux 1.3、agent安装 一键式安装
注意:目前支持Centos6、Centos7,RedHat6、RedHat7,需要注册OneAPM账号,登录OneAPM 平台,选择onealert模块,选择配置按钮,选择添加应用 [url=][/url] 添加应用名称linuxprobe
点击继续生成AppKey
根据生成的一键agent来自动安装,以Centos6.8为例 [root@zabbix ~]# sudo AppKey=390567e3-5a1c-33a4-593a-7acb7c8f4c86 Plugin=zabbix sh -c "$(curl -L oneapm/onealert-agent-installer/master/onealert-zabbix-install-centos6.sh)"[url=][/url] #安装成功提示如上图,如果感觉一键安装不安全的同学,请参考integration/zabbix-manual.html,此种方式笔者之前实现过,文中不赘述。 #使用initctl重启onealert initctl restart onealert1.4、#扩展:initctl是Upstart中的一个命令 Upstart来源:大约在 2006 年或者更早的时候, Ubuntu 开发人员试图将 Linux 安装在笔记本电脑上。在这期间技术人员发现经典的 sysvinit 存在一些问题:它不适合笔记本环境。这促使程序员 Scott James Remnant 着手开发 upstart。 Upstart解决了sysvinit使用的一些缺点,其采用事件驱动模型,Upstat可以更快的启动系统、当新硬件被发现时动态启动服务,硬件被被拔除时动态停止服务, 1.5、Upstart概念和术语 Upstart 的基本概念和设计清晰明确。UpStart 主要的概念是 job 和 event。Job 就是一个工作单元,用来完成一件工作,比如启动一个后台服务,或者运行一个配置命令。每个 Job 都等待一个或多个事件,一旦事件发生,upstart 就触发该 job 完成相应的工作。
更多有关Upstart的信息,参考:developerworks/cn/linux/1407_liuming_init2/
安装重启完成onealert,配置告警的分派策略(不同级别的告警发送到指定人员) #提示:注意提前设置告警分派用户的告警操作,例如shaon #当告警发生时,可以通过多种方式推送给运维人员,可以设置多重策略来过滤警告级别及推送人员,重要的是可以电话,真的很不错!(目前使用中),不过需要注意onealert免费提供的配额,目前没使用完过,不知道使用完是会收费还是不推送告警信息。 2、onealert测试验证 Zabbix-web首页 [url=][/url] 登录onealert-->分析—>应用-->下拉选择linuxprobe,得到下图: [url=][/url] #对比zabbix-web监控页面和onealert后台分析页面能够看出onealert已经能够正常发送告警。 #主要说明:
和Onealert产品经理沟通,一键部署成功之后。Zabbix-web’页面不需要做另外的配置,能够正常发送告警
查看日志: cat /var/log/onealert/agent.log | egrep ‘v1’ | less查看返回的日志信息,包含v1格式如下表示onealert已经正常运行, [url=][/url] #测试停掉一台zabbix-agent(salt-master),能够收到短信通知告警,微信告警(截图如下),如果告警不处理持续半个小时,onealert会通过智能语音电话拨打你的手机(此处不测) [url=][/url] [url=][/url] 解决告警,会收到告警解决的通知 [url=][/url] [url=][/url] #上面是电话告警截图,这个方式告警比微信稍微简单一点(配置),由于笔者比较菜,原理请自行脑补。 原创:王辉
|