monicazhang 发表于 2015-6-18 15:01:06

怎样的综合网管告警管理才能达到ITSS标准?

20150617 MONICAZHANG续上





5.5.3 告警等级根据告警信息的严重程度,将告警级别进行划分,具体分为六个级别。具体划分请参见表6-1。         ITSS体系   
表 6‑1 告警级别划分
严重级别说明
致命         致命告警,仅由严重告警升级而成。当严重告警半小时没有处理时需要升级为致命告警。         致命告警需要上报某公司总部,并需要进入流程平台生成工单进行处理。         致命告警需要通过短信、邮件、界面告警等方式通知用户。
严重         严重告警,当网络、设备、数据库、中间件、操作系统、应用系统等DOWN或不可用时,产生严重告警。例如服务器、网络设备的宕机、数据库实例停止运行、应用服务端口关闭等         严重告警需要上报某公司总部,并需要进入流程平台生成工单进行处理。                      ITSS软件         严重告警需要通过短信、邮件、界面告警等方式通知用户。
次严重         次严重告警。性能数据超过一定的阈值,会威胁到系统可用性时产生次严重告警。当次严重告警未处理时间超过一定范围(如半小时)时,升级为严重告警。         次严重告警可选择手工生成工单         次严重告警需要通过邮件、界面告警等方式通知用户,也可以选择短信方式
警告         警告告警。当性能数据超过一定阈值时作为预警信息反应当前系统运行状况         警告告警可选择手工生成工单,并可定期清除         警告告警需要通过界面告警方式通知用户,也可以设置邮件方式
无害         无害告警。可能是流程平台的工单返回信息,或系统的一些提示信息         不需要生成工单,可定期清除         ITSS团购          无害告警仅需要通过界面告警方式通知用户
未知         未知级别的告警。需要人工判断其告警级别         未知告警在确定其告警级别后,再进行相应处理


根据设备或应用的重要程度,以及告警的严重级别,可以确认此告警的紧急度(Priority)。紧急度具体分为3个级别(高、中、低)。设备或应用的重要程度可参考“附件二 设备分级”中对被管理对象的级别划分。告警严重级别定义可参照表6-1。表6-2为告警的紧急度定义: 表 6‑2 告警紧急度定义
重要度\告警等级致命严重次严重警告无害
一级高高高中低
二级高高中中低
三级高中中低低
四级中中低低低


5.5.4 告警响应                                                       ITSS工具 通过告警管理软件的自动化任务,为不同告警设置不同的响应方式,可以在告警管理服务器或远程服务器,甚至是同时在多个系统上执行。根据某公司的要求,对告警需要提供声音、邮件、短信以及自动化任务等告警响应。对于这些告警响应实现方式的设计如下:      声音告警:当特定的告警发生后,在指定的工作站发出告警声音,提示管理员发生了故障。不同的告警级别将采用不同的告警声音进行区分。      邮件报警:当特定的告警发生后,发送邮件通知到对应的管理维护人员告知或敦促进行处理。用户可以在“告警订阅”界面中设定发送邮件的告警类别或告警级别。      短信通知:当特定的告警发生后,发送手机通知到对应的管理维护人员告知或敦促进行处理。用户可以在“告警订阅”界面中设定发送短信的告警类别或告警级别。                           ITSS考试       自动化任务:最常见的情况就是当发现某些服务、进程处于Down的状态时,可以自动重新启动这些服务和进程;或者当发现某个文件系统可用空间非常紧张的时候,能够自动分配空间。当然,执行自动化相应应该非常谨慎,而且任何自动化响应的动作都需要留下日志记录。

5.5.5 告警处理规则告警处理应遵循以下原则:      实时性:保证关键告警信息及时得到处理。      准确性:保证告警信息根据所属级别得到准确处理。                  ISO20000培训       参数化管理:提供灵活的参数化配置,保证告警处理具有很强的适应性告警管理服务器包含一个告警处理引擎,能够根据规则库中的各种规则对告警进行处理,包括进行以下的操作:      告警故障定位告警故障定位应与IT资源管理数据和应用逻辑相结合,根据设备厂商或应用软件开发商提供的最小粒度定位,如CPU、路由模块、网络接口卡、关键业务点等。      告警过滤针对单位时间内发生大量告警的情况,按维护要求和管理部门的要求及实际管理情况,过滤从底层提取的告警信息中不重要的信息,减少轻微告警的干扰,以提高监控与处理的效率。同时可以根据业务与平台的关联关系,对业务与平台两层面的告警数据进行关联分析,定位主要告警、过滤掉关联告警,提高告警的处理效率。告警过滤需要提供灵活的过滤规则,可按告警网元、告警级别、告警类别或告警标题等设置过滤规则。可根据告警信息的内容,屏蔽掉一些次要的字段。对已设定的过滤规则需要提供保存和修改功能,便于维护人员灵活选择。告警过滤应实现对以下告警的过滤:                              ITIL培训n      频繁发送的同一告警n      由主要告警引起的相关大量的关联告警n      已进入服务管理流程进行处理,重复发送的告警n      特殊情况下,只需要记录不需要展现的特殊资源的相关告警      告警升级对于系统中持续出现以及超过规定处理时间仍未解决的告警,需要升级该告警的告警级别,以保证得到优先及时的处理。      告警重定义根据系统平台及应用逻辑在结构、功能等方面发生的变化,重新定义告警数据所属的类别和级别,保证告警系统处理的正确性。      告警前转系统提供告警前转功能,将告警信息以各种手段(手机短信、EMAIL等)转至指定的维护人员。            ITSS培训1、告警前转方式自动前转:根据事先的设定,将告警信息自动前转其它综合网管系统或相关人员。手工前转:由监控人员把告警手工前转其它系统或相关人员。2、告警前转条件告警前转的设置条件:告警级别、告警类型、被管资源类型、告警设备所在地区、需要通知的相关系统和人员、告警的处理时间等。管理员可以存储设定的告警前转条件,并可对告警前转条件列表进行增、删、改、查等操作。      告警清除对于系统中已经处理完毕的告警信息,需要设置相关的标志,标记为清除,退出告警处理流程。告警的展现功能将在统一展现平台功能模块设计中体现。                  ITSS认证






待续http://ITIL-foundation.cn/thread-49145-1-1.html本帖关键字:ITSS ISO20000



页: [1]
查看完整版本: 怎样的综合网管告警管理才能达到ITSS标准?