×

扫描二维码登录本站

标签: 暂无标签
2026年1月29日,PeopleCert正式发布了ITIL 第5版。作为ITIL官方中国区产品大使,我将会推出系列文章帮大家解读ITIL 第5版到底有哪些重大的更新。


11.png



AI 时代最贵的不是模型,而是“脏数据”,对平台、数据、运维负责人来说,新版本里最值得你高度警惕的一句话可以概括成这样:没有数据质量,就没有可控的自动化;没有可控的自动化,就很难谈真正的效率与治理。


很多组织这两年在生成式 AI 上投入很积极:买平台、接模型、做聊天机器人、做智能告警、做自动分派、做自动补救。可你在一线一定见过另一面:
  • 模型回答看似流畅,但引用的知识条目过期,误导用户;
  • 自动分派速度很快,但分类字段不一致,结果“快错”;
  • 自动补救执行得很果断,但配置记录缺失,动作打在错误对象上;
  • 仪表板很漂亮,但数据口径不统一,决策被“假象”牵着走。

这些问题归根到底不是模型问题,而是数据质量问题:准确性、完整性、一致性、可追溯与可审计性。一旦你把 AI 与自动化引入到端到端价值流里,数据质量就从“平台优化项”变成“管理硬门槛”。因为 AI 和自动化的本质,是把决策与执行规模化;数据越差,错误也会被规模化。


粘贴上传202602041621111321..png



一、更新内容概述:六个要点里,为什么“信息和技术”会成为底层约束


我们先来了解一下 ITIL 第5版的核心更新内容,我会从“信息和技术维度”的视角解释:为什么六个变化都会落到数据与技术治理上。
1、定位升级:数字化产品和服务管理
管理对象扩展后,数据不再只是 IT 内部运维数据,而是贯穿产品、交付、支持与体验的数据。没有统一的数据基础,你很难做端到端对齐。
2、生命周期模型升级:八个活动覆盖从发现到支持
八个活动意味着更多交接与决策点。每个决策点都需要可靠信息支撑:验收准则、风险评估、依赖关系、配置状态。信息不可靠,活动对齐就会变成扯皮。
3、人工智能进入方法论核心
AI 的价值高度依赖高质量数据与知识资产。更关键的是,AI 输出必须可追溯、可审计,否则治理会失效。
4、指导原则更强调取舍:尤其是优化和自动化
自动化是否值得做,不是看脚本能不能写,而是看数据能不能支撑闭环。数据质量不够,自动化越深,风险越大。
5、实践从清单走向组件库:强调适用性与可裁剪
实践组合的前提,是你能用数据衡量效果,能用数据识别瓶颈,能用数据验证改进。否则组合只是凭感觉。
6、迁移与学习路径更强调能力栈与路线图
数据治理与可观测性本身就是能力栈的一部分。你要把它纳入路线图,否则 AI 相关工作会长期陷入“demo 很好看,上线很难用”。
所以你会看到,ITIL 第5版强调 AI、强调价值流、强调可裁剪,背后都有一个共同前提:信息基础必须可靠。




二、数据质量为什么会从“好事”变成“硬门槛”:三个链式反应


平台团队经常被要求“补数据质量”,但很多业务与管理层并不理解为什么要先做这件事。他们会说:先把 AI 上起来,数据慢慢补。听起来合理,但在系统里往往会触发三个链式反应,让你越走越难。
1、自动化把错误放大
在人工操作时代,脏数据最多让人慢一点、烦一点;人还能凭经验纠错。但自动化时代,系统会按数据做动作,错误会被快速、持续、规模化执行。
2、AI 把不确定性放大
AI 善于生成“看起来合理”的内容。数据不完整或不准确时,它不会像传统规则那样直接报错,而是更可能给出自信的错误建议。你会得到一种更危险的失败:错误不明显,但影响持续存在。
3、治理把缺口放大
一旦出现事故或合规审计,你需要证据链:谁做了什么决定,依据是什么,记录在哪里。数据质量差意味着证据链断裂,可审计性下降,最终治理只能通过更强的审批来弥补,组织速度下降。
所以数据质量不是锦上添花,而是决定你能不能把 AI 与自动化做成“组织能力”,而不是做成“风险来源”。




三、平台负责人最常见的四种数据质量问题:你不承认,它也会在事故里逼你承认


我把最常见的数据质量问题归成四类,你可以对照自检。它们几乎会出现在任何 ITSM 平台、CMDB、日志与监控体系里。
1、记录不完整:关键字段缺失
  • 工单没有配置项 (CI)
  • 变更没有关联服务或关键业务功能
  • 事件记录缺少影响范围、恢复动作、根因线索

结果是:你没法做可靠分类、没法做依赖分析、没法做趋势判断。
2、口径不一致:同一概念多种写法
  • 同一服务在不同系统里名字不一致
  • 同一故障类型在不同团队用不同分类
  • 同一指标在不同仪表板口径不同

结果是:数据分析失真,报告无法对齐,治理决策被误导。
3、不可追溯:你不知道数据从哪来、怎么变的
  • 配置记录被修改但没有变更轨迹
  • 知识条目更新没有版本控制
  • 自动化规则调整缺少审批记录

结果是:出了问题你找不到原因,复盘只能凭猜。
4、缺基线:你不知道“正常状态”是什么
  • 没有基线就无法判断偏差
  • 没有基线就无法定义验收准则
  • 没有基线就很难设计回滚与恢复

结果是:自动化无法可靠闭环,AI 的建议也缺少参照。
这四类问题看似是数据问题,实则是治理问题:谁负责维护、谁负责审核、谁负责持续监督、谁负责改进。
粘贴上传202602041622328453..png





四、ITIL 第5版语境下的数据质量:不是“做干净”,而是“能支撑决策与闭环”


很多团队一听“数据治理”就害怕,觉得是无底洞。我建议你换个定义:数据质量不追求完美,追求“够用”。够用的标准是:能支撑关键决策、能支撑自动化闭环、能支撑可审计性。
你可以用三个“够用标准”来定义最低门槛:
1、够用的准确性与完整性
  • 关键字段必须齐全:服务、配置项 (CI)、影响范围、优先级、责任人
  • 关键关系必须可信:服务与配置项的关联、依赖关系的方向

2、够用的一致性
  • 统一命名与分类体系
  • 统一口径的度量与报告
  • 统一的字段定义与使用规范

3、够用的可追溯与可审计性
  • 配置记录、规则变更、知识更新必须留痕
  • 关键决策必须能回溯:谁批准、依据是什么
  • 自动化执行必须能追踪:做了哪些动作、结果如何、失败如何恢复

你做到这三条,就已经具备了把 AI 与自动化做成“可控能力”的基础。




五、落地抓手:平台团队可以立刻做的五件事


下面我给你五个最务实的抓手,它们不需要大项目,也不需要一口吃成胖子,但能快速改善数据质量与可控性。
1、定义“最小数据集”,并做质量门禁
  • 每类记录的必填字段是什么
  • 哪些字段缺失就不能进入下一步(例如不能进入变更实施、不能进入自动分派)
  • 把门禁写进工作流,而不是写进培训材料

2、建立数据口径字典,先统一“关键对象”
优先统一:
  • 服务与产品名称
  • 配置项 (CI) 命名与分类
  • 事件与请求的分类体系
  • 关键指标的计算口径

先统一关键对象,再逐步扩展,别一上来全覆盖。
3、把“留痕”当成默认:规则、知识、配置都要可追溯
  • 配置记录修改必须关联变更
  • 知识条目更新必须版本化
  • 自动化规则调整必须有审批与记录

这不是为了折磨人,而是为了让证据链完整,责任清晰。
4、把可观测性做成“平台能力”,而不是监控工具
你要能看到:
  • 数据缺失率与错误率
  • 分类一致性与偏差
  • 自动化成功率、回滚率、误触发率
  • AI 建议被采纳率、被否决率、导致返工率

没有这些指标,你就无法持续改进。
5、选一条价值流做试点,用数据质量证明价值
不要在抽象层面争论“数据治理重要不重要”。选一条价值流:例如“服务请求到交付”“事件到恢复”“变更到发布稳定期”。
  • 先定义最小数据集与门禁
  • 再引入自动化或 AI 辅助
  • 用周期时间、返工率、升级率、事故率对比前后

当你能用数据证明价值,组织的支持会自然上来。




六、信息和技术维度的终点:让 AI 与自动化闭环可控,而不是让风险闭环更快


平台团队最怕的,是把自动化闭环做成“错误闭环”:一旦触发就一路执行,错得更快。ITIL 第5版强调治理与可裁剪,其实是在告诉你:闭环不是目标,可控的闭环才是目标。
你至少要把三个控制点设计进去:
  • 人工确认点:高风险动作必须批准
  • 失败恢复点:自动化失败时如何回滚与恢复
  • 证据链点:关键输入、输出、批准与执行轨迹必须可追溯、可审计

当这三个点存在,你才真正拥有把 AI 与自动化规模化推广的底气。


信息和技术维度之所以在 ITIL 第5版里变成硬门槛,是因为 AI 与自动化把决策和执行规模化了:数据质量不够,错误就被规模化;证据链不完整,治理就会失效。平台团队只要先抓最小数据集、质量门禁、可追溯与可观测性,再用一条价值流试点把效果跑出来,你就能把“数据治理”从口号变成组织能力。


我是AI+ITIL教练长河achotsao,欢迎添加长河老师微信 achotsao 深入交流,即可第一时间获得ITIL 第5版最新动态及官方特邀中国区大使的深度解析,全网同名。


slbenben

写了 2197 篇文章,拥有财富 13157,被 9 人关注

B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by ITIL  © 2001-2025
返回顶部