monicazhang 发表于 2015-6-18 11:21:12

一、二级ITSS设备监控指标的全面分析

本帖最后由 monicazhang 于 2015-6-18 11:21 编辑

20150617 MONICAZHANG续上



10 附件三 一级设备监控指标一级设备是某公司业务运行和保障的关键设备,其监控指标应当全面、深入。因此对于一级设备,其监控指标应为10.2 节中的所有指标。

11 附件四 二级设备监控指标表 13‑1 二级设备监控指标
编号KPI_IDKPI名称KPI描述数据类型指标级别采样间隔建议阈值
PN网络设备
1PN-01-01网元状态网络中各网元运行的UP/DOWN状态            ITSS体系 字符型(U/D)高5分钟DOWN
2PN-01-02设备端口状态网元设备的各端口的UP/DOWN状态字符型(U/D)高5分钟DOWN
3PN-01-03网络链路状态在信息网网络中,网络链路状态是通过网络设备状态间接获取。包含:链路通/断两种状态字符型(U/D)高5分钟断开
4PN-02-02CPU负载网元的CPU负载数值型高10分钟> 85%
5PN-02-03MEM利用网元的内存利用率数值型高10分钟> 85%
6PN-02-04RUNTIME网元的运行时间数值型中30分钟

7PN-02-05CPU温度网元的CPU温度      数值型中1小时

8PN-03-02网元数信息网网络中各种类型设备数目数值型中1月

9PN-04-02端口类型网络设备配置的端口模块类型;包括:以太网口、串口等,其中以太网口又可分百兆、千兆口等字符串中1月

10PN-04-03端口数量网络设备配置各种类型端口的数目             数值型中1月

11PN-04-04端口物理地址网络设备端口固化的物理地址字符串高1月

12PN-04-05端口IP地址网络设备端口配置的IP地址以及其掩码字符串高1月

13PN-04-07物理端口是否真正存在的端口逻辑型高1月

14PN-04-08速率(出)网络设备端口支持的最大传输速率(输出)          ITSS工具    数值型中1月

15PN-04-09速率(入)网络设备端口支持的最大传输速率(输入)数值型中1月

16PN-04-10所在VLAN网络设备端口所划分的vlan设置字符串中1月

17PN-05-02端口状态端口的状态(UP/DOWN)数值型高5分钟DOWN
18PN-05-03总比特流量端口的总吞吐速率数值型中30分钟

19PN-05-04出比特流量端口发送的比特速率数值型中30分钟

20PN-05-05入比特流量端口接收的比特速率数值型中30分钟

21PN-05-06总单播帧流量端口的总的单点帧吞吐速率数值型中30分钟

22PN-05-07出单播帧流量端口发送单点帧的速率数值型中30分钟

23PN-05-08入单播帧流量端口接收单点帧的速率数值型中30分钟

24PN-05-09总广播帧流量端口的总的广播帧吞吐速率数值型中30分钟

25PN-05-10出广播帧流量端口发送广播帧的速率数值型中30分钟

26PN-05-11入广播帧流量端口接收广播帧的速率数值型中30分钟

27PN-05-12总丢包量端口总的丢包量数值型中30分钟>1
28PN-05-13出丢包量端口发送包的丢失量数值型中30分钟>1
29PN-05-14入丢包量端口接收包的丢失量数值型中30分钟>1
30PN-05-15总错包量端口总的错包量      ITSS考试数值型高30分钟>1
31PN-05-16出错包量端口发送错包量数值型高30分钟>1
32PN-05-17入错包量端口接收错包量数值型中30分钟>1
33PN-05-18平均帧长度端口出/入帧的平均字节数数值型中30分钟

34PN-05-19出帧长度端口发送的帧的平均字节数数值型中30分钟

35PN-05-20入帧长度端口接收的帧的平均字节数数值型中30分钟

36PN-05-21总带宽占用比端口出/入带宽的利用率数值型高30分钟> 85%
37PN-05-22出带宽占用比端口发送的带宽利用率数值型高30分钟> 85%
38PN-05-23入带宽占用比端口接收的带宽利用率数值型高30分钟> 85%
PL网络链路
39PL-01-08速率(上行)线路上行方向的最大传输速率数值型高1月

40PL-01-09速率(下行)线路下方向的最大传输速率数值型高1月

41PL-02-02线路状态线路的状态(UP/DOWN)数值型高5分钟DOWN
42PL-02-03总比特流量线路的总传输速率数值型高30分钟

43PL-02-04上行比特流量线路上行的比特速率数值型中30分钟

44PL-02-05下行比特流量线路下行的比特速率数值型中30分钟

45PL-02-06总单播帧流量线路的总的单点帧吞吐速率数值型高30分钟

46PL-02-07上行单播帧流量线路上行单点帧的速率数值型中30分钟

47PL-02-08下行单播帧流量线路下行单点帧的速率数值型中30分钟

48PL-02-10上行播帧流量线路上行广播帧的速率数值型中30分钟

49PL-02-11下行广播帧流量线路下行广播帧的速率数值型中30分钟

50PL-02-13上行丢包量线路上行包的丢失量数值型中30分钟>1
51PL-02-14下行丢包量线路下行包的丢失量数值型中30分钟>1
52PL-02-15总错包量线路总的错包量数值型高30分钟>1
53PL-02-16上行错包量线路上行错包量数值型中30分钟>1
54PL-02-17下行错包量线路下行错包量   数值型中30分钟>1
55PL-02-19上行帧长度线路上行的帧的平均字节数数值型中30分钟

56PL-02-20下行帧长度线路下行的帧的平均字节数数值型中30分钟

57PL-02-21总带宽占用比线路出/入带宽的利用率数值型高30分钟> 85%
PH主机设备                      ITSS认证
58PH-01-01主机状态主机运行的UP/DOWN状态字符型(Y/N)高5分钟DOWN
59PH-01-02主机内置盘的运行状态主机的内置盘是否正常字符型(Y/N)高5分钟异常
60PH-01-03主机网卡状态该主机网卡的工作状态字符型(Y/N)高5分钟异常
61PH-01-04主机当前用户连接主机当前不同用户的连接进程数量结构高5分钟

62PH-01-05关键应用进程状态关键应用进程是否工作正常(关键进程由用户指定)结构(多行记录)高5分钟DOWN
63PH-02-01CPU使用率用户CPU时间百分比和系统CPU时间百分比的平均值。数值型高10分钟> 90%
64PH-02-02CPU运行队列中进程个数CPU运行队列中进程个数数值型高10分钟

65PH-03-01内存的使用率主机内存的使用量与内存总量的比值数值型高10分钟> 90%
66PH-03-02内存交换页换进量内存交换页的换进数量数值型高10分钟

67PH-03-03内存交换页换出量内存交换页的换出数量数值型高10分钟

68PH-04-01磁盘空间使用比率磁盘的已使用空间与磁盘总空间的比率数值型高1小时> 90%
69PH-05-01文件系统名称文件系统的标示称字符型高1小时

70PH-05-02文件系统的总空间主机文件系统总的可用量数值型高1小时

71PH-05-03文件系统使用比率文件系统已使用的空间与总空间的比值         ITSS培训 数值型高1小时> 90%
72PH-06-01文件名称文件名称(含路径)字符串高1小时

73PH-06-02状态存在/不存在逻辑型高1小时不存在
74PH-06-03大小文件的大小(兆字节)数值型高1小时

75PH-07-01进程ID进程的标示符字符型中10分钟

76PH-07-02父进程ID父进程的标示符字符型中10分钟

77PH-07-03占用CPU时间进程单位时间在CPU中运行的时间数值型高5分钟

78PH-07-04进程状态进程状态包括运行,等待,阻塞,挂起,停止字符型高5分钟停止、挂起
79PH-07-05控制进程的终端运行进程的终端名字符型中10分钟

80PH-07-06进程用户名运行进程的用户名字符型中10分钟

81PH-07-07进程名称进程名称字符型高5分钟

82PH-07-08进程用户组ID运进程用户组的ID标志字符型中10分钟

83PH-07-09进程开始时间进程启动的时间时间型中10分钟

84PH-07-10进程运行时长进程已运行的时间时间型高10分钟

85PH-07-11进程的规模进程占用内存的空间大小数值型高10分钟> 70%
86PH-08-01主机名主机的标识字符型高1月

87PH-08-02主机地址主机的IP地址数值型高1月

88PH-08-03主机用户信息主机用户的名称,目录等结构型中1月

89PH-08-04主机类型指是哪种类型的机器,比如UNIX则指明是IBM还是HP等结构型高1月

90PH-08-05主机CPU个数指主机配置了多少个CPU数值型高1月

91PH-08-06主机内存大小指主机的物理内存容量数值型高1月

92PH-08-07主机操作系统版本操作系统的版本号和位数(32/64)字符型高1月

93PH-08-08内置硬盘的大小描述主机内置硬盘的容量字符型高1月

PD数据库                            ITIL培训
94PD-01-01数据库状态数据库所处状态,0-正常,1-DOWN,2-只读,3-恢复数值高5分钟= 1
95PD-02-01数据库告警信息数据库产生的告警信息和通过数据库的各种日志文件经过信息的过滤筛选产生的警告信息字符高5分钟

96PD-03-01表空间大小该表空间总体大小数值中1小时

97PD-03-02可用表空间大小该表可用空间的大小数值高1小时

98PD-03-03表空间使用率该表可用空间的百分比数值高1小时> 85%
99PD-04-01进程ID进程的ID数值中1小时

100PD-04-02进程占用CPU时间进程占用CPU时间数值高1小时

101PD-04-03占用内存大小进程的占用内存大小数值高1小时> 85%
102PD-04-04数据库进程的个数所有数据库进程的总个数数值中1小时

103PD-05-01共享内存的大小共享内存的设定大小数值中1小时

104PD-05-02共享内存使用百分比共享内存已经利用的部分占总体的百分比数值高1小时> 90%
105PD-05-03共享内存的读写命中率共享内存的读写命中率数值高1小时

106PD-06-01表空间名数据库内各表空间名字符中1小时

107PD-06-02表空间的读操作命中率该表空间的读操作命中率数值中1小时

108PD-06-03写操作命中率该表空间的写操作命中率数值中1小时

109PD-07-01数据设备名数据库内某数据文件或数据设备名字符
1天

110PD-07-02读操作命中率该数据设备的读操作命中率数值中1天

111PD-07-03写操作命中率该数据设备的写操作命中率数值中1天

112PD-08-01表空间名数据库内某表空间名字符中1天

113PD-08-02碎片程度该表空间的碎片程度百分比数值高1天

114PD-09-01表名数据库特定表名称字符中1小时

115PD-09-02初始值该表建表的空间初始值数值中1小时

116PD-09-03next扩展值该表下次空间扩展值数值中1小时

117PD-09-04扩展最大极限值该表空间扩展的扩展最大次数数值中1小时

118PD-09-05扩展次数该表已经完成的扩展次数数值中1小时

119PD-09-06是否有分区指该表是分区表还是变通表字符型(Y/N)中1小时

120PD-10-01回滚段名数据库日志空间或回滚段名字符中1小时

121PD-10-02回滚段大小数据库的回滚段的大小字符中1小时

122PD-10-03利用情况其对应空间利用的百分比数值高1小时> 90%
123PD-10-04竞争情况数据库日志空间或回滚段数据快等待操作占总操作的百分比情况可以其显示竞争情况数值高1小时

124PD-12-03用户对象占用的数据库存储空间大小用户对象占用的数据库存储空间大小和个数字符中10分钟

PM中间件                                              ITSS团购
125PM-01-04服务器状态当前服务器是否激活字符型高10分钟

126PM-02-01JVM堆栈大小JVM堆栈大小数值型中30分钟

127PM-02-02JVM堆栈利用率JVM堆栈利用率超过门限定义产生告警事件数值型中30分钟>90%
128PM-03-01总连接数JDBC连接总数数值型中30分钟

129PM-03-02活动连接数当前活动的JDBC连接数数值型中30分钟

130PM-03-03等待连接数当前处于等待状态的连接数数值型中30分钟

131PM-03-04等待最大时间等待的最大时间数值型中30分钟

132PM-03-05连接池最大容量JDBC连接池的最大容量大小数值型中30分钟

133PM-04-01全部回滚事务比率全部回滚事务的比率数值型中30分钟

134PM-04-02资源错误事务回滚数出现资源错误的事务回滚数目数值型中30分钟

135PM-04-03资源错误事务回滚率出现资源错误的事务的回滚比率数值型中30分钟>5%
136PM-04-04APP事务回滚数应用程序事务回滚的数量数值型中30分钟

137PM-04-05APP事务回滚比率应用程序事务回滚的比率数值型中30分钟

138PM-04-06系统错误回滚事务数系统错误回滚事务的数量数值型中30分钟

139PM-04-07系统错误回滚事务比率系统错误回滚事务的比率数值型中30分钟>5%
140PM-05-01当前激活会话数当前处于激活状态的会话数目数值型中30分钟

141PM-05-02最大会话数定义的会话数目的最大值数值型中30分钟

142PM-05-03会话总数会话总数数值型中30分钟

143PM-05-04ORB线程池利用率ORB线程池使用百分比数值型高30分钟>90%
144PM-05-05Web线程池利用率Web容器线程池使用百分比数值型高30分钟>90%
145PM-06-02Servlet平均执行时间Servlet平均执行时间数值型中30分钟

146PM-06-03Servlet最大执行时间Servlet最大执行时间数值型中30分钟

147PM-06-04Servlet执行次数Servlet执行次数数值型中30分钟

148PM-07-03激活次数激活(Activation)次数数值型中30分钟

149PM-07-04钝化次数钝化(Passivation)次数数值型中30分钟

150PM-07-05缓存EJB的个数缓存EJB的个数数值型中30分钟

151PM-07-06正在使用的EJB个数当前正在使用的EJB个数数值型中30分钟

152PM-07-07正在空闲的EJB个数当前处于空闲状态的EJB个数数值型中30分钟

153PM-07-08正在超时的EJB个数当前处于超时状态的EJB个数数值型中30分钟

154PM-07-09正在等待的EJB个数当前处于等待状态的EJB个数数值型中30分钟

155PM-07-10提交的事务总数提交的事务总数数值型中30分钟

156PM-07-11回滚的事务总数回滚的事务总数数值型高30分钟

157PM-07-12超时的事务总数超时的事务总数数值型高30分钟

158PM-08-01服务器线程池大小服务器线程池大小字符型中30分钟

159PM-08-02Socket访问比率用于提供Socket访问的线程比率字符型高30分钟

160PM-09-01服务器状态服务器启动和关闭字符型高5分钟DOWN
161PM-09-02配置属性状态服务器配置属性是否修改字符型高1天

162PM-09-03日志告警应用服务器日志异常信息字符型高5分钟

163PM-10-01响应时间Web站点的响应时间数值型高10分钟

164PM-10-02请求数Web站点请求数数值型中10分钟

165PM-10-03匿名连接数当前匿名连接用户数数值型中10分钟

166PM-10-04404错误数找不到文件的错误数数值型高10分钟

PS存储管理                                     ITSS软件
167PS-01-01存储阵列状态存储阵列是否处于运作状态,即UP/DOWN状态字符型(U/D)高10分钟DOWN
168PS-01-02硬盘状态硬盘是否出现物理或逻辑损坏逻辑型(T/F)高10分钟异常
169PS-01-03热备盘状态热备盘是否已接管逻辑型(T/F)高10分钟异常
170PS-01-04存储CACHE状态企业级存储内部用作数据读写CACHE的内存硬件是否出现异常逻辑型(T/F)高10分钟异常
171PS-01-05磁盘适配卡状态存储内的磁盘适配卡是否出现异常逻辑型(T/F)高10分钟异常
172PS-01-06磁盘通道状态磁盘适配卡上每个磁盘通道是否有异常逻辑型(T/F)高10分钟异常
173PS-01-07主机通道卡状态存储内的主机通道卡是否出现异常逻辑型(T/F)高10分钟异常
174PS-01-08主机通道状态主机通道卡上每个主机通道是否有异常逻辑型(T/F)高10分钟异常
175PS-01-09其它部件状态其它可被监控部件是否有异常;如:风扇、电源模块等逻辑型(T/F)高10分钟异常
176PS-02-01CACHE读命中率采样区间内从存储中读取的数据中,能直接从CACHE中读取的字节数占总读取数据字节数的百分率数值型中30分钟

177PS-02-02CACHE写命中率采样区间内写入存储中的数据中,写CACHE空间未满情况下写入的字节数占总写入数据字节的百分率数值型中30分钟

178PS-03-01磁盘IO利用率存储阵列各硬盘每秒钟读写数据的字节数数值型中30分钟

179PS-03-02LUN的IO利用率存储阵列划分的逻辑卷(在光纤通道上的映射为LUN)每秒钟读写数据的字节数数值型中30分钟

                                                                                              ISO20000培训                           






待续http://ITIL-foundation.cn/thread-49177-1-1.html
本帖关键字:ITSS ISO20000
页: [1]
查看完整版本: 一、二级ITSS设备监控指标的全面分析