返回 Papers
AI 底层逻辑 / 经典论文

AI Maturity Model:能力评估与路线图

一句话:

221ai-foundations/papers/81-ai-maturity-model-roadmap-capability-assessment.md

AI Maturity Model / Roadmap / Capability Assessment 解读

面向对象: AI Transformation Lead / Enterprise Architect / AI Product Lead / Senior BA / Portfolio Owner / Capability Owner。 核心问题: AI 成熟度不能用“有多少模型、多少 POC、多少调用量”衡量。真正的成熟度是组织能否持续发现高价值机会、交付可靠系统、复用平台能力、控制风险、证明收益、响应变化。 学习目标: 建立 AI maturity model、capability domains、evidence standard、roadmap sequencing 和个人/组织能力成长映射。


Source Anchors

SourceLink用途
CMMI Institutehttps://cmmiinstitute.com/参考 capability maturity、过程能力和持续改进语言
NIST AI RMFhttps://www.nist.gov/itl/ai-risk-management-framework用 Govern / Map / Measure / Manage 组织 AI 风险与能力成熟度
ISO/IEC 42001https://www.iso.org/standard/81230.html参考 AI management system、运营、绩效评价和持续改进
TOGAFhttps://www.opengroup.org/togaf参考架构开发、能力规划、路线图和治理思想

一句话:

AI Maturity Model 是用证据衡量组织是否具备持续、安全、可规模化交付 AI 业务价值的能力, 而不是统计 AI 项目数量。


1. AI 成熟度不等于 POC 数量

低成熟度组织也可以有很多 POC:

  • demo 很亮眼。
  • 高管看起来满意。
  • 调用量上升。
  • 业务线都在试。

但它可能没有:

  • 明确 use case selection 标准。
  • 数据/知识治理。
  • eval 和 release gate。
  • 模型/供应商/成本治理。
  • 人工监督和异常处理。
  • 事故响应和复盘。
  • 收益兑现。
  • 平台复用。
  • 审计证据。

成熟度应该看:

Can the organization repeatedly turn AI opportunities
into reliable, governed, adopted, measurable, reusable products?

2. Capability Domains

Domain成熟度问题关键证据
Strategy / PortfolioAI 投资是否和战略、能力、风险偏好连接portfolio scorecard、funding gate、scale/stop memo
Product Discovery是否能识别真实机会和 AI fitOST、JTBD、assumption map、pilot evidence
Data / Knowledge数据和知识是否可用、可信、可授权、可追溯source registry、lineage、quality SLO、permission model
Model / Platform模型、RAG、工具、工作流是否平台化model gateway、RAG platform、tool gateway、SLO
EvalOps是否有上线前后评估体系eval set、rubric、release gate、monitoring gate
RiskOps / Governance风险分层、控制、证据是否可运营AI inventory、control library、evidence binder
Integration / ArchitectureAI 是否真正接入业务系统和流程C4、sequence、BPMN/DMN、ADR、integration patterns
Product Adoption用户、员工、运营是否采纳并产生收益adoption dashboard、training、workflow metrics
Operating Model团队、RACI、决策权和节奏是否清晰product trio+、RACI、review cadence
Talent / Learning组织是否有可持续能力建设role matrix、portfolio evidence、community of practice

这比“AI readiness checklist”更有价值, 因为每个 domain 都要求可检查证据。


3. Maturity Levels

Level名称特征证据
L1Ad hoc个别团队做 POC, 依赖个人能力demo、零散 prompt、临时数据
L2Repeatable有重复模板和基础门禁use case intake、basic eval、risk pre-screen
L3Managed有平台、RACI、release gate 和监控AI inventory、model gateway、eval report、runbook
L4Scaled多业务线复用平台和控制体系product line assets、portfolio funding、cross-domain telemetry
L5Optimized数据、模型、流程、风险和收益持续优化causal learning、adaptive portfolio、automated evidence, maturity reviews

成熟度升级不是每个 domain 同步升级。金融零售组织可能:

  • RiskOps L4, 但 Product Discovery L2。
  • Data Governance L3, 但 EvalOps L1。
  • Platform L4, 但 Adoption L2。

这就是 capability heatmap 的价值。


4. Roadmap Sequencing

推荐顺序:

Foundation
  -> pilot evidence
  -> platformization
  -> governance scaling
  -> product-line reuse
  -> optimization
Phase重点产物
Foundation建立共识、能力地图、风险分层、数据/知识基线AI capability map、risk tier matrix、source registry
Pilot Evidence用少数高价值场景验证假设pilot memo、eval report、benefits baseline
Platformization把重复能力平台化model gateway、RAG platform、tool gateway、EvalOps
Governance Scaling把控制和证据做成可运营机制AI inventory、control library、release gate、incident runbook
Product-Line Reuse把多个场景做成产品族core asset map、variation matrix、reuse telemetry
Optimization用数据持续改进价值、质量、风险、成本portfolio learning loop、causal evidence、maturity review

不要跳过 pilot evidence 直接平台化。没有真实场景证据的平台, 容易成为技术展示。 也不要只做 pilot 不平台化。没有平台化的 pilot, 不能规模化。


5. Individual Capability Map

用户已经是 CBAP, 所以重点不是补基础 BA, 而是把能力升级成 AI-era evidence。

Role Path应形成的证据
AI BArequirements-to-eval、BPMN/DMN trace matrix、data/knowledge readiness、control/evidence map
AI PMportfolio scorecard、AI PRD、metrics tree、adoption plan、scale/stop memo
AI Architectreference architecture、C4/sequence/control views、ADR、platform capability map
AI Business Architectcapability map、value stream、maturity heatmap、roadmap dependency
AI Governance LeadAI inventory、control library、evidence binder、risk appetite matrix
AI Platform PMplatform service catalog、core asset map、SLO/cost/adoption telemetry

个人成长也可以用成熟度:

  • L1: 能解释概念。
  • L2: 能做单个 artifact。
  • L3: 能把 artifact 连接成交付闭环。
  • L4: 能跨案例复用方法和平台资产。
  • L5: 能指导组织级路线图和治理机制。

6. Financial Retail Case: AI Maturity Assessment

评估对象: 银行客服、信贷、AML、KYC 四条 AI 线。

DomainCurrentEvidenceGap
Strategy / PortfolioL2有 use case list 和优先级缺 funding gate 和 stop rule
Data / KnowledgeL2有知识库和数据 owner缺 source freshness、permission trace
PlatformL3有 model gateway 和 RAG prototypetool gateway 和 HITL queue 不成熟
EvalOpsL2有人工测试集缺线上 monitoring gate 和 segment eval
RiskOpsL3有 AI inventory 和风险分层control evidence 不自动化
AdoptionL1有培训材料缺 workflow metrics 和 change plan
Product Line ReuseL1每个业务线各做缺 core asset map 和 variation model

Roadmap:

  1. 90 天内补齐 portfolio gate、eval contract、source registry。
  2. 180 天内平台化 model/RAG/tool gateway 和 evidence capture。
  3. 12 个月内形成 case-assist product line 和跨业务线 reuse telemetry。

7. Artifact Templates

Maturity Scorecard

DomainLevelEvidenceRiskNext MoveOwner
能力域L1-L5当前证据风险/差距下一步owner

Capability Heatmap

CapabilityBusiness CriticalityCurrent MaturityTarget MaturityDependencyQuarter
例如 EvalOpshighL2L4eval set, platform, riskQ2-Q3

Roadmap Dependency Map

AI inventory
  -> risk tiering
  -> eval contract
  -> model/tool gateway
  -> release gate
  -> monitoring
  -> evidence binder
  -> scale decision

8. ADR Draft

项目内容
决策采用 evidence-based AI maturity model, 用 capability domains 和 L1-L5 证据评估 AI 转型路线
背景单纯 POC 数量和模型调用量不能说明组织具备可靠 AI 交付能力
替代方案成熟度只由 CoE 主观打分; 只看工具采购; 只看 ROI
选择理由evidence-based maturity 能连接战略、产品、数据、架构、风险、运营和人才能力
影响需要季度 maturity review、capability owner、roadmap dependency tracking 和 evidence repository
反转条件若模型过度复杂导致评估成本太高, 可先聚焦 top 5 critical capabilities

9. 面试表达

30 秒版本

AI 成熟度不是 POC 数量, 而是组织是否能持续把 AI 机会转成可靠、可治理、可采纳、可度量、可复用的产品能力。我会按 strategy/portfolio、data/knowledge、platform、EvalOps、RiskOps、integration、adoption、operating model 和 talent 等 domain 做 evidence-based assessment, 再形成 roadmap。

2 分钟版本

我会先定义能力域, 再按 L1 ad hoc 到 L5 optimized 做成熟度评估, 但每一级都必须有证据。例如 EvalOps L3 需要 eval set、rubric、release gate 和 monitoring gate; Platform L3 需要 model gateway、RAG platform、SLO 和 owner; RiskOps L3 需要 AI inventory、risk tier、control library 和 evidence binder。 评估后不是简单打分, 而是做 capability heatmap 和 roadmap dependency。比如如果组织想 scale customer-facing AI, 但 knowledge governance 和 HITL queue 只有 L1, 那路线图要先补知识权限、source freshness、人工队列和申诉机制。

Transformation Lead / Enterprise Architect 版本

成熟度模型的价值是让 AI 转型从项目状态报告变成能力路线图。Enterprise Architect 关心 capability gap 和 architecture runway, Product Lead 关心 portfolio 和 adoption, Risk Lead 关心控制证据, HR/Enablement 关心人才能力。一个好的 maturity model 应该同时服务投资决策、路线图、组织设计和个人能力成长。