本文是一份关于IT运维数据治理与AIOps交互支撑能力框架的报告,旨在探讨如何通过数据治理和智能运维的结合,提升IT运维的效率和效果。报告由国内最大的数字化时代IT服务管理交流社区——ITIL先锋论坛的解决方案副总裁在GOPS全球运维大会2022·上海站上提出。
效率与成本的冲突 报告指出,智能运维已进入“深水区”,在提升效率的同时,面临着数据治理的挑战。例如,黄金指标检测和告警收敛虽已成熟应用,但在全领域指标应用异常检测和提升隐患感知时,受限于运维数据的整体质量和完整性。此外,信息系统常规趋势性发展带来的资源增长,虽已应用智能趋势预测,但在建设综合的业务与应用关联预测时,因数据关联不完整而难以有效规划。
交互式建设方案 报告提出了交互式建设方案,强调运维场景与数据治理建设的相互支撑。通过融合数据治理和智能数据治理,实现全面智能自动降噪、资产发现、特征识别和动态关联。运维场景建设包括主机检测、网络诊断、应用瓶颈和容量预测等,而数据治理建设则涵盖数据资产、标准治理、数据模型和数据审计等方面。
新一代数据底座:数智平台建设方案 报告详细介绍了新一代运维数据底座——数智平台的建设方案。数智平台具备数据管理、自我观测、数据标准化和数据模型等关键特性。它通过开箱即用的数据获取、应用成效反馈优化和智能数据底座,实现完整性覆盖、服务化应用和场景化组织。数智平台的运维管理模型基于原子运维数据模型,融入运维标准问题解决的最佳实践,将关键运行逻辑、知识、规则转化为数据的组织结构。
共生式的智能运维建设 报告强调智能运维与数据底座的共生式建设。通过引入运维管理模型,一方面为更多运维场景提供开箱即用的有效数据支撑,另一方面通过智能运维场景的成功应用数据经验,沉淀入运维数据治理,实现智能运维和数据底座的共生发展。
展望 报告展望了AI提升数据治理效率的未来,强调场景能力与数据能力的融合发展。智能运维平台将整合运维场景应用、异常检测、告警收敛、根因分析和资源规划等功能,而数据治理场景则涵盖维度降噪、元素发现、特征识别和关联发现等方面。通过智能数据底座,实现运维大数据、CMDB、日志、APM、NPM、基础监控和业务监控等数据的整合和应用。
报告提出了一个全面的IT运维数据治理与AIOps交互支撑能力框架,强调通过数据治理和智能运维的结合,提升IT运维的效率和效果。通过新一代数据底座——数智平台的建设,实现运维场景与数据治理的相互支撑和共生发展,为未来的IT运维管理提供了新的思路和方法。
|