×

扫描二维码登录本站

标签: 暂无标签
这份文档是华为技术有限公司发布的《IT运维管理:ITIL先锋论坛—行业IT运维白皮书-监控技术规范》,主要描述了华为统一运维服务在监控IT资源方面的技术标准。文档的目的是为客户提供对各种IT资源的统一监控能力,确保IT系统的稳定可靠运行。适用对象包括华为行业运维服务销售和服务交付等相关人员。


文档结构与内容概述

文档分为六个主要部分,涵盖了从机房环境动力到应用系统的监控技术规范。

1. 概述
- 目的:提供统一的IT资源监控能力,涵盖机房动力环境、物理资源、云基础资源、应用系统运行环境及应用系统资源等。
- 适用对象:主要面向华为的运维服务相关人员。
- 术语定义:对弹性云服务器、云硬盘、裸金属服务器等术语进行了定义,帮助理解文档内容。

2. 机房环境动力
- 监控对象:包括供配电设施、暖通和制冷设施、机房环境、安防和消防设施等。
- 监控指标:详细列出了配电柜、UPS、发电机、空调等设备的监控指标,如电流、电压、负载率、温度等。
- 监控告警:定义了各种设备的告警条件,如电压异常、负载过高、设备故障等。

3. 物理资源监控
- 服务器:监控指标包括CPU使用率、内存使用率、磁盘I/O等。
- 宿主机:涉及虚拟化平台的CPU和内存使用情况。
- 网络设备:包括路由器、交换机等的CPU利用率、内存利用率、流量值等。
- 存储设备:涵盖块存储、SAN交换机和文件存储的监控指标,如存储容量、IOPS、响应时间等。

4. 云基础资源监控
- 计算资源:包括弹性云服务器和裸金属服务器的CPU、内存、网络和存储使用情况。
- 存储资源:对象存储服务的上传下载流量、请求次数等。
- 网络资源:弹性IP和弹性负载均衡的流量、连接数等。

5. 应用系统运行环境监控
- 操作系统:监控Linux和Windows系统的CPU、内存、网络状态等。
- 中间件:包括Nginx、IIS、WAS、Tomcat等中间件的端口连通性、进程状态、性能指标等。
- 数据库:Oracle、SQL Server、MySQL等数据库的连通性、性能指标、资源利用率等。

6. 应用系统
- 监控指标:访问成功率、首屏用时、客户端崩溃率、服务端口可达性、URL可达性、响应时间等。
- 业务数据:关注关键业务数据的总量、待处理量和已处理量,以揭示性能问题。

文档特点与应用场景

- 全面性:文档涵盖了从基础设施到应用系统的全方位监控,确保IT系统的各个层面都能得到有效监控。
- 标准化:提供了统一的监控标准和指标,便于运维人员进行标准化的监控和管理。
- 实用性:详细列出了各种设备和系统的监控指标和告警条件,为运维人员提供了实用的参考依据。
- 适用性:适用于不同规模和类型的IT系统,无论是大型数据中心还是中小型企业,都能从中找到适用的监控规范.


这份文档为IT运维管理提供了一套全面、标准化的监控技术规范。通过详细的监控指标和告警条件,运维人员可以更好地掌握IT系统的运行状态,及时发现和处理潜在问题,从而保障系统的稳定性和可靠性。这对于提升IT运维效率和质量具有重要意义.



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x




上一篇:IT某银行数据中心Zabbix智能运维建设方案 (IT运维管理)
下一篇:行业IT运维标准白皮书-应用日志运维规范 (IT运维管理)
slbenben

写了 1721 篇文章,拥有财富 10545,被 9 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by ITIL  © 2001-2025
返回顶部