该文档是某公司的IT监控管理制度,主要涵盖总则、组织与职责、工作内容和要求、监督与检查及附则等内容,旨在规范IT运维中心信息系统监控管理工作,提升监控质量与系统健康水平,保障业务需求。
1. 总则 - 目的:加强IT运维中心信息系统监控管理,提高监控质量与系统适应性,结合实际制定本制度。 - 适用范围:适用于IT运维中心及各承建单位运维岗位。 - 原则:坚持“全程监控随时响应”,实行统一领导、分级负责。
2. 组织与职责 - 流程负责人:全面负责监控体系建设与实施,对实践结果、原则等决策,监控有效性与效率,必要时发起改进。 - 流程经理:负责流程开发、设计、实施等,制定考核指标,跟踪分析KPI,确保流程记录可追溯,管理事态生命周期。 - 监控规划经理:定义监控目标、对象、优先级等,评估监控标准,定义事态类型与阈值,建立服务运行模型,确定响应团队。 - 监控专家:设计监控指标,确保准确反馈状态,优化指标与分类规则,设计新指标。 - 监控工具工程师:搭建、维护监控工具,实现数据互联互通,开发新监控方式与指标。 - 监控工程师:实时监控关键组件,通知负责人,跟进事态处理,记录并报告相关信息。 - 事态响应工程师:处置告警,排查故障,优化系统,确保系统正常运行。
3. 工作内容和要求 - 监控内容分类 - 监控规划:由监控规划经理与监控专家完成,包括定义监控目标、内容、对象事态类型、阈值、服务运行模型、关联规则集及行动角色通知关联。 - 事态处理:由运维工程师或与维保单位共同完成,涵盖事态检测、记录、过滤、分类、响应选择、通知与执行策略。 - 监控和事态管理评审:由监控和事态流程经理牵头,确定评审目标、纬度,执行评审与优化。 - 工作要求原则 - 优先级区分:明确确定和记录IT组件优先级的方法及调整策略。 - 组件可监控性:在采购和开发时考虑监控需求,纳入开发生命周期。 - 纳入监控体系:生产环境中的IT组件应自动纳入监控体系,新组件上线及时更新文档与策略。 - 专门响应团队:指定人员响应告警并提供培训。 - 监控阈值优化:基于数据驱动定期优化阈值。 - 数据驱动监控:监控活动基于数据收集、处理、分析与可视化展示。 - 全面监控:覆盖IT基础设施、网络、应用性能和用户体验。 - 灵活性与可扩展性:监控系统具备适应变化的能力,采用模块化设计与开放标准协议,定期审查更新。
4. 监督与检查:IT运维中心负责对信息系统IT运维监控工作进行评价和考核。
5. 附则:制度由IT运维中心负责解释与监督执行,自发布之日起生效。
|