2026年1月29日,PeopleCert正式发布了ITIL 第5版。作为ITIL官方中国区产品大使,我将会推出系列文章帮大家解读ITIL 第5版到底有哪些重大的更新。
AI 时代最贵的不是模型,而是“脏数据”,对平台、数据、运维负责人来说,新版本里最值得你高度警惕的一句话可以概括成这样:没有数据质量,就没有可控的自动化;没有可控的自动化,就很难谈真正的效率与治理。
很多组织这两年在生成式 AI 上投入很积极:买平台、接模型、做聊天机器人、做智能告警、做自动分派、做自动补救。可你在一线一定见过另一面:
- 模型回答看似流畅,但引用的知识条目过期,误导用户;
- 自动分派速度很快,但分类字段不一致,结果“快错”;
- 自动补救执行得很果断,但配置记录缺失,动作打在错误对象上;
- 仪表板很漂亮,但数据口径不统一,决策被“假象”牵着走。
这些问题归根到底不是模型问题,而是数据质量问题:准确性、完整性、一致性、可追溯与可审计性。一旦你把 AI 与自动化引入到端到端价值流里,数据质量就从“平台优化项”变成“管理硬门槛”。因为 AI 和自动化的本质,是把决策与执行规模化;数据越差,错误也会被规模化。
一、更新内容概述:六个要点里,为什么“信息和技术”会成为底层约束
我们先来了解一下 ITIL 第5版的核心更新内容,我会从“信息和技术维度”的视角解释:为什么六个变化都会落到数据与技术治理上。
1、定位升级:数字化产品和服务管理
管理对象扩展后,数据不再只是 IT 内部运维数据,而是贯穿产品、交付、支持与体验的数据。没有统一的数据基础,你很难做端到端对齐。
2、生命周期模型升级:八个活动覆盖从发现到支持
八个活动意味着更多交接与决策点。每个决策点都需要可靠信息支撑:验收准则、风险评估、依赖关系、配置状态。信息不可靠,活动对齐就会变成扯皮。
3、人工智能进入方法论核心
AI 的价值高度依赖高质量数据与知识资产。更关键的是,AI 输出必须可追溯、可审计,否则治理会失效。
4、指导原则更强调取舍:尤其是优化和自动化
自动化是否值得做,不是看脚本能不能写,而是看数据能不能支撑闭环。数据质量不够,自动化越深,风险越大。
5、实践从清单走向组件库:强调适用性与可裁剪
实践组合的前提,是你能用数据衡量效果,能用数据识别瓶颈,能用数据验证改进。否则组合只是凭感觉。
6、迁移与学习路径更强调能力栈与路线图
数据治理与可观测性本身就是能力栈的一部分。你要把它纳入路线图,否则 AI 相关工作会长期陷入“demo 很好看,上线很难用”。
所以你会看到,ITIL 第5版强调 AI、强调价值流、强调可裁剪,背后都有一个共同前提:信息基础必须可靠。
二、数据质量为什么会从“好事”变成“硬门槛”:三个链式反应
平台团队经常被要求“补数据质量”,但很多业务与管理层并不理解为什么要先做这件事。他们会说:先把 AI 上起来,数据慢慢补。听起来合理,但在系统里往往会触发三个链式反应,让你越走越难。
1、自动化把错误放大
在人工操作时代,脏数据最多让人慢一点、烦一点;人还能凭经验纠错。但自动化时代,系统会按数据做动作,错误会被快速、持续、规模化执行。
2、AI 把不确定性放大
AI 善于生成“看起来合理”的内容。数据不完整或不准确时,它不会像传统规则那样直接报错,而是更可能给出自信的错误建议。你会得到一种更危险的失败:错误不明显,但影响持续存在。
3、治理把缺口放大
一旦出现事故或合规审计,你需要证据链:谁做了什么决定,依据是什么,记录在哪里。数据质量差意味着证据链断裂,可审计性下降,最终治理只能通过更强的审批来弥补,组织速度下降。
所以数据质量不是锦上添花,而是决定你能不能把 AI 与自动化做成“组织能力”,而不是做成“风险来源”。
三、平台负责人最常见的四种数据质量问题:你不承认,它也会在事故里逼你承认
我把最常见的数据质量问题归成四类,你可以对照自检。它们几乎会出现在任何 ITSM 平台、CMDB、日志与监控体系里。
1、记录不完整:关键字段缺失
- 工单没有配置项 (CI)
- 变更没有关联服务或关键业务功能
- 事件记录缺少影响范围、恢复动作、根因线索
结果是:你没法做可靠分类、没法做依赖分析、没法做趋势判断。
2、口径不一致:同一概念多种写法
- 同一服务在不同系统里名字不一致
- 同一故障类型在不同团队用不同分类
- 同一指标在不同仪表板口径不同
结果是:数据分析失真,报告无法对齐,治理决策被误导。
3、不可追溯:你不知道数据从哪来、怎么变的
- 配置记录被修改但没有变更轨迹
- 知识条目更新没有版本控制
- 自动化规则调整缺少审批记录
结果是:出了问题你找不到原因,复盘只能凭猜。
4、缺基线:你不知道“正常状态”是什么
- 没有基线就无法判断偏差
- 没有基线就无法定义验收准则
- 没有基线就很难设计回滚与恢复
结果是:自动化无法可靠闭环,AI 的建议也缺少参照。
这四类问题看似是数据问题,实则是治理问题:谁负责维护、谁负责审核、谁负责持续监督、谁负责改进。
四、ITIL 第5版语境下的数据质量:不是“做干净”,而是“能支撑决策与闭环”
很多团队一听“数据治理”就害怕,觉得是无底洞。我建议你换个定义:数据质量不追求完美,追求“够用”。够用的标准是:能支撑关键决策、能支撑自动化闭环、能支撑可审计性。
你可以用三个“够用标准”来定义最低门槛:
1、够用的准确性与完整性
- 关键字段必须齐全:服务、配置项 (CI)、影响范围、优先级、责任人
- 关键关系必须可信:服务与配置项的关联、依赖关系的方向
2、够用的一致性
- 统一命名与分类体系
- 统一口径的度量与报告
- 统一的字段定义与使用规范
3、够用的可追溯与可审计性
- 配置记录、规则变更、知识更新必须留痕
- 关键决策必须能回溯:谁批准、依据是什么
- 自动化执行必须能追踪:做了哪些动作、结果如何、失败如何恢复
你做到这三条,就已经具备了把 AI 与自动化做成“可控能力”的基础。
五、落地抓手:平台团队可以立刻做的五件事
下面我给你五个最务实的抓手,它们不需要大项目,也不需要一口吃成胖子,但能快速改善数据质量与可控性。
1、定义“最小数据集”,并做质量门禁
- 每类记录的必填字段是什么
- 哪些字段缺失就不能进入下一步(例如不能进入变更实施、不能进入自动分派)
- 把门禁写进工作流,而不是写进培训材料
2、建立数据口径字典,先统一“关键对象”
优先统一:
- 服务与产品名称
- 配置项 (CI) 命名与分类
- 事件与请求的分类体系
- 关键指标的计算口径
先统一关键对象,再逐步扩展,别一上来全覆盖。
3、把“留痕”当成默认:规则、知识、配置都要可追溯
- 配置记录修改必须关联变更
- 知识条目更新必须版本化
- 自动化规则调整必须有审批与记录
这不是为了折磨人,而是为了让证据链完整,责任清晰。
4、把可观测性做成“平台能力”,而不是监控工具
你要能看到:
- 数据缺失率与错误率
- 分类一致性与偏差
- 自动化成功率、回滚率、误触发率
- AI 建议被采纳率、被否决率、导致返工率
没有这些指标,你就无法持续改进。
5、选一条价值流做试点,用数据质量证明价值
不要在抽象层面争论“数据治理重要不重要”。选一条价值流:例如“服务请求到交付”“事件到恢复”“变更到发布稳定期”。
- 先定义最小数据集与门禁
- 再引入自动化或 AI 辅助
- 用周期时间、返工率、升级率、事故率对比前后
当你能用数据证明价值,组织的支持会自然上来。
六、信息和技术维度的终点:让 AI 与自动化闭环可控,而不是让风险闭环更快
平台团队最怕的,是把自动化闭环做成“错误闭环”:一旦触发就一路执行,错得更快。ITIL 第5版强调治理与可裁剪,其实是在告诉你:闭环不是目标,可控的闭环才是目标。
你至少要把三个控制点设计进去:
- 人工确认点:高风险动作必须批准
- 失败恢复点:自动化失败时如何回滚与恢复
- 证据链点:关键输入、输出、批准与执行轨迹必须可追溯、可审计
当这三个点存在,你才真正拥有把 AI 与自动化规模化推广的底气。
信息和技术维度之所以在 ITIL 第5版里变成硬门槛,是因为 AI 与自动化把决策和执行规模化了:数据质量不够,错误就被规模化;证据链不完整,治理就会失效。平台团队只要先抓最小数据集、质量门禁、可追溯与可观测性,再用一条价值流试点把效果跑出来,你就能把“数据治理”从口号变成组织能力。
我是AI+ITIL教练长河achotsao,欢迎添加长河老师微信 achotsao 深入交流,即可第一时间获得ITIL 第5版最新动态及官方特邀中国区大使的深度解析,全网同名。
|
|