×

扫描二维码登录本站

QQ登录

只需一步,快速开始

标签: 暂无标签
20150617 MONICAZHANG
续上





5.5.3 告警等级
根据告警信息的严重程度,将告警级别进行划分,具体分为六个级别。具体划分请参见表6-1。           ITSS体系   

6‑1 告警级别划分
严重级别
说明
致命
         致命告警,仅由严重告警升级而成。当严重告警半小时没有处理时需要升级为致命告警。
         致命告警需要上报某公司总部,并需要进入流程平台生成工单进行处理。
         致命告警需要通过短信、邮件、界面告警等方式通知用户。
严重
         严重告警,当网络、设备、数据库、中间件、操作系统、应用系统等DOWN或不可用时,产生严重告警。例如服务器、网络设备的宕机、数据库实例停止运行、应用服务端口关闭等
         严重告警需要上报某公司总部,并需要进入流程平台生成工单进行处理。                        ITSS软件
         严重告警需要通过短信、邮件、界面告警等方式通知用户。
次严重
         次严重告警。性能数据超过一定的阈值,会威胁到系统可用性时产生次严重告警。当次严重告警未处理时间超过一定范围(如半小时)时,升级为严重告警。
         次严重告警可选择手工生成工单
         次严重告警需要通过邮件、界面告警等方式通知用户,也可以选择短信方式
警告
         警告告警。当性能数据超过一定阈值时作为预警信息反应当前系统运行状况
         警告告警可选择手工生成工单,并可定期清除
         警告告警需要通过界面告警方式通知用户,也可以设置邮件方式
无害
         无害告警。可能是流程平台的工单返回信息,或系统的一些提示信息
         不需要生成工单,可定期清除           ITSS团购
         无害告警仅需要通过界面告警方式通知用户
未知
         未知级别的告警。需要人工判断其告警级别
         未知告警在确定其告警级别后,再进行相应处理


根据设备或应用的重要程度,以及告警的严重级别,可以确认此告警的紧急度(Priority)。紧急度具体分为3个级别(高、中、低)。
设备或应用的重要程度可参考“附件二 设备分级”中对被管理对象的级别划分。告警严重级别定义可参照表6-1。表6-2为告警的紧急度定义:
6‑2 告警紧急度定义
重要度\告警等级
致命
严重
次严重
警告
无害
一级
二级
三级
四级


5.5.4 告警响应                                                       ITSS工具
通过告警管理软件的自动化任务,为不同告警设置不同的响应方式,可以在告警管理服务器或远程服务器,甚至是同时在多个系统上执行。
根据某公司的要求,对告警需要提供声音、邮件、短信以及自动化任务等告警响应。对于这些告警响应实现方式的设计如下:
        声音告警:当特定的告警发生后,在指定的工作站发出告警声音,提示管理员发生了故障。不同的告警级别将采用不同的告警声音进行区分。
        邮件报警:当特定的告警发生后,发送邮件通知到对应的管理维护人员告知或敦促进行处理。用户可以在“告警订阅”界面中设定发送邮件的告警类别或告警级别。
        短信通知:当特定的告警发生后,发送手机通知到对应的管理维护人员告知或敦促进行处理。用户可以在“告警订阅”界面中设定发送短信的告警类别或告警级别。                             ITSS考试
        自动化任务:最常见的情况就是当发现某些服务、进程处于Down的状态时,可以自动重新启动这些服务和进程;或者当发现某个文件系统可用空间非常紧张的时候,能够自动分配空间。当然,执行自动化相应应该非常谨慎,而且任何自动化响应的动作都需要留下日志记录。


5.5.5 告警处理规则
告警处理应遵循以下原则:
        实时性:保证关键告警信息及时得到处理。
        准确性:保证告警信息根据所属级别得到准确处理。                    ISO20000培训
        参数化管理:提供灵活的参数化配置,保证告警处理具有很强的适应性
告警管理服务器包含一个告警处理引擎,能够根据规则库中的各种规则对告警进行处理,包括进行以下的操作:
        告警故障定位
告警故障定位应与IT资源管理数据和应用逻辑相结合,根据设备厂商或应用软件开发商提供的最小粒度定位,如CPU、路由模块、网络接口卡、关键业务点等。
        告警过滤
针对单位时间内发生大量告警的情况,按维护要求和管理部门的要求及实际管理情况,过滤从底层提取的告警信息中不重要的信息,减少轻微告警的干扰,以提高监控与处理的效率。同时可以根据业务与平台的关联关系,对业务与平台两层面的告警数据进行关联分析,定位主要告警、过滤掉关联告警,提高告警的处理效率。
告警过滤需要提供灵活的过滤规则,可按告警网元、告警级别、告警类别或告警标题等设置过滤规则。
可根据告警信息的内容,屏蔽掉一些次要的字段。对已设定的过滤规则需要提供保存和修改功能,便于维护人员灵活选择。
告警过滤应实现对以下告警的过滤:                                ITIL培训
n        频繁发送的同一告警
n        由主要告警引起的相关大量的关联告警
n        已进入服务管理流程进行处理,重复发送的告警
n        特殊情况下,只需要记录不需要展现的特殊资源的相关告警
        告警升级
对于系统中持续出现以及超过规定处理时间仍未解决的告警,需要升级该告警的告警级别,以保证得到优先及时的处理。
        告警重定义
根据系统平台及应用逻辑在结构、功能等方面发生的变化,重新定义告警数据所属的类别和级别,保证告警系统处理的正确性。
        告警前转
系统提供告警前转功能,将告警信息以各种手段(手机短信、EMAIL等)转至指定的维护人员。            ITSS培训
1、告警前转方式
自动前转:根据事先的设定,将告警信息自动前转其它综合网管系统或相关人员。
手工前转:由监控人员把告警手工前转其它系统或相关人员。
2、告警前转条件
告警前转的设置条件:告警级别、告警类型、被管资源类型、告警设备所在地区、需要通知的相关系统和人员、告警的处理时间等。
管理员可以存储设定的告警前转条件,并可对告警前转条件列表进行增、删、改、查等操作。
        告警清除
对于系统中已经处理完毕的告警信息,需要设置相关的标志,标记为清除,退出告警处理流程。
告警的展现功能将在统一展现平台功能模块设计中体现。                    ITSS认证







本帖关键字:ITSS ISO20000







上一篇:告警管理功能为什么是ITSS综合网管的最基本功能
下一篇:ITSS资源管理的详细说明
monicazhang

写了 2297 篇文章,拥有财富 12859,被 21 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

返回顶部