返回 Papers
AI 扩展计划 / Playbooks

AI Control Library / Assurance Evidence Graph Playbook

这些来源作为控制库和证据图谱的设计锚点。实战中不要把它们机械转成问卷, 而要转成 control objective、control activity、test method、evidence、owner、cadence 和 gate decision。

514AI_CONTROL_LIBRARY_ASSURANCE_EVIDENCE_GRAPH_PLAYBOOK.md

AI Control Library / Assurance Evidence Graph Playbook

定位: 面向 AI PM / AI BA / Solutions Architect / Enterprise Architect / Risk / Compliance / Internal Audit 的 AI 控制库与证据图谱实战手册。

目标: 把 AI control objective、control activity、test evidence、assurance case、claim-argument-evidence、control-to-requirement traceability、release gate、monitoring 和监管问询材料连接成一套可运营、可审计、可复核的 evidence graph。

核心观点: AI 控制库不是一张 checklist, 而是一套能证明“哪些 AI 风险在什么边界内被哪些控制降低到可接受水平”的证据系统。

使用方式: 每个高影响 AI use case 在 pilot、release、scale 三个阶段维护一张 control-to-evidence graph, 并把关键节点同步到 PRD、ADR、eval contract、control matrix、release gate 和 audit binder。

重要说明: 本文是学习、作品集和治理设计材料, 不是法律意见、审计意见、模型验证结论或监管解释。正式项目必须由 Legal、Compliance、Risk、Model Risk、Internal Audit、Security、Privacy、Data Owner 和业务管理层按适用司法辖区确认。


1. Source Anchors

这些来源作为控制库和证据图谱的设计锚点。实战中不要把它们机械转成问卷, 而要转成 control objective、control activity、test method、evidence、owner、cadence 和 gate decision。

AnchorOfficial Link在本文中的用法
NIST AI RMFhttps://www.nist.gov/itl/ai-risk-management-framework用 Govern / Map / Measure / Manage 组织 AI 风险、控制、评估和持续监控
NIST SP 800-53 Rev. 5https://csrc.nist.gov/publications/detail/sp/800-53/rev-5/final借鉴控制库的结构化语言: control family、control objective、control enhancement、assessment procedure、evidence
NIST Cybersecurity Framework 2.0https://www.nist.gov/cyberframework用 Govern / Identify / Protect / Detect / Respond / Recover 连接 AI security、privacy、incident 和 resilience 控制
ISO/IEC 42001https://www.iso.org/standard/81230.html用 AI management system 视角组织范围、责任、风险机会、运行控制、绩效评价、持续改进和管理评审

使用纪律:

  • Source anchor 提供控制语言和治理结构, 不直接给出某个机构的合规结论。
  • AI control library 必须按 use case、风险等级、业务流程、模型形态、数据敏感性和自动化程度裁剪。
  • 每个高风险 claim 必须能追到 evidence, 每份关键 evidence 必须能追回 control objective 和 release decision。
  • 对监管、内审和模型风险问询, 不用“我们遵循某框架”作为回答终点, 而要展示证据链。

2. One-Sentence Positioning

AI Control Library defines what must be controlled; Assurance Case explains why the controls are sufficient; Evidence Graph proves the controls operated with traceable artifacts.

中文表达:

AI 控制库定义“必须控制什么”, assurance case 说明“为什么这些控制足以支撑上线主张”, evidence graph 证明“控制在特定系统、版本、数据、流程和时间窗口内真实运行过”。

最小闭环:

Business requirement
-> AI risk
-> control objective
-> control activity
-> test method
-> evidence
-> claim-argument-evidence
-> release gate
-> production monitoring
-> regulator-ready evidence graph

三者分工:

对象回答的问题典型产物
Control library对某类 AI 风险, 组织要求哪些控制目标和控制活动?control catalog、risk-control matrix、control standard
Assurance case在某个 use case 和版本边界内, 为什么可以认为系统满足上线主张?claim-argument-evidence memo、residual risk statement、sign-off
Evidence graph哪些证据支持哪些 claim、control、test、owner 和 review cadence?evidence graph table、traceability graph、audit binder index

3. 为什么 AI 控制不能只靠 checklist

Checklist 的价值是提醒团队别遗漏常见事项, 但它不能独立证明 AI 系统可上线、可运营、可接受监管和审计挑战。AI 控制的核心难点不是“有没有控制项”, 而是“控制项是否覆盖具体风险, 是否被测试, 是否有证据, 是否仍然有效”。

3.1 Checklist 的典型失效方式

失效方式表面看起来实际问题
无上下文“已完成人工复核控制”不知道复核哪个输出、哪个角色、覆盖比例、是否能覆盖自动化偏见
无证据充分性“已完成模型评估”不知道测试集是否覆盖真实失败模式、阈值如何设定、失败样本如何处置
无版本边界“RAG 已测试通过”prompt、retriever、index、policy source、embedding model 变更后证据失效
无运行证明“上线时通过安全评审”生产中 prompt injection、权限漂移、日志泄露、供应商变更没有持续监控
无责任链“风险可接受”不知道谁接受、接受到什么时候、触发什么条件需要重新评审
无问询路径“材料都在共享盘”监管问起某个 claim 时, 团队无法在有限时间内拿出同一口径的证据链

3.2 AI 控制需要图谱化的原因

AI 系统的风险来自多个层面同时变化:

  • 业务流程会变: 客户群、操作人员、审批节点、政策解释发生调整。
  • 数据会变: 数据源、质量、权限、标签、知识库版本、保留规则发生变化。
  • 模型会变: vendor model、内部模型、prompt、system instruction、tool schema、guardrail 发生变化。
  • 使用方式会变: 用户从“参考 AI”逐渐变成“默认采纳 AI”。
  • 外部要求会变: 监管关注、审计范围、供应商条款、安全威胁和行业事件持续变化。

因此 AI 控制必须从静态 checklist 升级为 evidence graph:

Requirement traceability: 业务和监管要求追到控制
Risk traceability: 风险追到控制目标和控制活动
Evidence traceability: 控制追到测试、证据、owner 和复核节奏
Change traceability: 变更追到受影响的 claim、control、test 和 evidence
Question traceability: 监管问询追到标准回答和证据索引

3.3 好控制表达与弱控制表达

弱表达问题强表达
“系统有 human-in-the-loop。”没有说明人工复核的强度和证据“所有 AML high-risk alert 的 AI narrative 在进入 case record 前必须由 L2 analyst 审批; 日志记录 AI draft、human edit diff、approval user、timestamp 和最终 disposition。”
“RAG 会引用来源。”没有证明来源正确或当前有效“生产回答必须引用 approved policy repository 中 effective status 为 active 的 source id; citation audit 每周抽样 100 条, high-risk wrong citation 为 release blocker。”
“模型经过测试。”不知道测试覆盖什么风险“Eval contract 覆盖 common、edge、missing-data、policy-conflict、adversarial 和 historical incident cases; critical unauthorized-action failure 必须为 0。”
“供应商已评估。”无法连接到具体 AI 风险“Vendor due diligence 覆盖 data use terms、model update notice、subprocessor、incident notification、exit plan 和 no-training configuration, 并映射到第三方 AI 控制目标。”

4. Control Library Taxonomy

AI control library 应该按控制域组织, 但每个控制项都必须能落到 use case。下面的 taxonomy 适合金融零售 AI 项目, 尤其是 customer-facing AI、AML / KYC / fraud agent、credit policy RAG、投诉处理助手和运营 Copilot。

DomainControl ObjectiveControl ActivityTest EvidenceGate Signal
Governance所有 AI use case 被登记、分级、审批和问责建立 AI inventory、risk tiering、RACI、stage gate、exception registerAI inventory record、risk tier worksheet、committee minutes、owner attestation无 owner、无 risk tier、无审批记录则不能进入 pilot
Data数据使用可授权、可追溯、可最小化、可按权限隔离维护 data lineage、data classification、PII handling、quality checks、retention ruledata flow diagram、data quality report、privacy review、access log sample未批准敏感数据或权限不清则不能接入生产
Model模型用途、限制、表现、变更和监控清楚维护 model record、model card、benchmark、risk-tiered evaluation、version controlmodel card、eval report、model selection memo、change log高风险失败未关闭则不能 release
RAG知识来源受控, 检索结果可引用、可复核、可更新source approval、index versioning、citation requirement、freshness check、retrieval evaluationsource inventory、index build record、citation audit、retrieval eval reportwrong citation 或 stale source 超阈值则 no-go
Agent / Tool工具调用受 allowlist、权限、审批和审计约束tool registry、scope restriction、dry-run、human approval、execution logtool permission matrix、test run log、approval workflow sample能执行客户影响动作但无人工审批则 no-go
Security / PrivacyPrompt、日志、模型调用、向量库和工具链不扩大安全与隐私风险threat modeling、RBAC、DLP、prompt injection defense、log minimization、encryptionthreat model、red-team report、access review、DLP finding closurecritical security finding 未关闭则不能生产
Human Oversight人工复核是真实可操作的控制, 不是形式签字define reviewer role、override ability、review queue、training、quality samplingSOP、training record、override log、review sample用户不能理解或推翻 AI 输出则不能高影响上线
Monitoring上线后持续证明质量、安全、成本、漂移和采用情况production metrics、KRI/KPI dashboard、alert threshold、sampling review、claim drift checkmonitoring dashboard、alert history、sample review report监控盲区覆盖高风险 claim 则限制发布范围
IncidentAI incident 和 near miss 可发现、升级、隔离、复盘和整改severity taxonomy、stop rule、rollback、RCA、customer impact assessmentincident runbook、drill record、postmortem、control retest无 stop authority 或 rollback 机制则不能 release
Vendor第三方 AI 服务、模型、数据处理和变更受控TPRM review、contract terms、model update notice、SLA、exit plan、subprocessor reviewvendor due diligence、DPA、SLA、exit test evidence高风险 vendor 缺合同关键条款则不能接入敏感场景
Adoption用户采用、信任校准和业务价值被运营, 防止 over-trust 与 under-trustonboarding、usage analytics、trust calibration、feedback loop、change managementtraining completion、usage dashboard、feedback themes、benefit tracking价值无法衡量或自动化偏见上升则暂停扩展

4.1 控制 ID 命名建议

控制 ID 不追求复杂, 但要支持检索、映射和版本管理:

AICL-GOV-001  AI use case inventory and ownership
AICL-DATA-002 Data lineage and authorization
AICL-RAG-003  Approved source and citation control
AICL-AGT-004  Tool allowlist and human approval
AICL-MON-005  Production quality and safety monitoring

每个控制项至少包含:

字段说明
Control ID唯一编号, 支持版本和引用
Domain控制域, 如 data、RAG、agent/tool
Risk Statement控制要降低的 AI 风险
Control Objective希望达成的控制状态
Control Activity实际执行的动作、系统规则或流程门禁
Test Method设计有效性和运行有效性的测试方法
Evidence可检查材料, 包括日志、报告、审批、抽样结果
Owner控制 owner 和 evidence owner
Frequency触发式、每次发布、每周、每月、季度、年度
Failure Condition什么情况导致 release blocker、incident 或整改

5. Evidence Graph

Evidence graph 的目标是让一个监管、内审或架构评审问题可以从高层 claim 追到具体证据, 也可以从某份证据反向追到它支撑了哪些控制和上线决策。

5.1 标准链路

Claim
-> Risk
-> Control Objective
-> Control Activity
-> Test
-> Evidence
-> Owner
-> Review Cadence
Node解释示例
Claim可审查的可信性主张“AML Agent 不会自动关闭告警或提交 SAR。”
Risk该 claim 管理的风险AI 越权执行监管敏感动作
Control Objective控制希望达成的状态所有 case disposition 和 SAR submission 保留人工审批
Control Activity实际控制动作移除 disposition API 写权限, 工具调用仅允许 read / draft, SAR 提交按钮只对 human role 开放
Test验证控制是否设计并运行有效RBAC 测试、API negative test、日志抽样、workflow walkthrough
Evidence测试和控制运行的证据permission matrix、negative test report、case log sample、release sign-off
Owner谁对控制和证据负责AML Ops Owner、Platform Owner、Security Owner
Review Cadence证据刷新和复核节奏每次 release、每月 access review、季度 assurance review

5.2 Edge 类型

Edge含义典型问题
supportsevidence 支持 test 或 claim这份报告支持哪个主张?
mitigatescontrol objective 降低 risk这个风险由哪些控制降低?
implementscontrol activity 实现 control objective控制目标在系统中如何落地?
verifiestest 验证 control activity控制有没有被测试?
ownsowner 对 control 或 evidence 负责证据过期时找谁?
refreshescadence 定义复核节奏多久重新证明一次?
blocksfailed test 阻断 release gate哪些失败会 no-go?
traces_torequirement 映射到 risk/control/evidence监管要求或 PRD requirement 如何落到控制?

5.3 Regulator-Ready Evidence Graph 的质量标准

一张监管就绪的 evidence graph 至少满足:

  • 每个 material claim 至少有一个 risk、一个 control objective、一个 test 和一份 evidence。
  • 每个 release blocker 有明确 failure condition、owner、decision record 和 remediation evidence。
  • 每份 high-value evidence 有版本、生成日期、复核人、样本范围、保留规则和访问权限。
  • 每个高风险变更能识别受影响的 claim、control、eval case、monitoring signal 和 regulator Q&A。
  • 每个监管问询都能定位到 factual answer、control owner、evidence path、residual risk 和管理层口径。

5.4 图谱查询示例

查询业务意义
显示所有支持 AI does not make final credit decision 的 evidence支撑客户权益和自动化决策边界说明
找出所有 RAG wrong citation 风险对应的 control 和 failed tests识别 release gate 中的质量阻断点
列出过去 90 天内证据过期的 high-risk claims做季度 assurance review
查找某次 prompt 变更影响哪些 eval contract 和 monitoring signals做变更影响分析
输出 AML Agent 对监管问询的 claim-argument-evidence map准备检查室材料

6. Release Assurance Case

Release assurance case 不是上线审批表的附件, 而是 gate decision 的理由。它用 claim-argument-evidence 结构说明: 在当前阶段、范围、用户、数据、模型和控制条件下, 系统是否可以进入下一阶段。

6.1 CAE 结构

元素作用金融零售 AI 示例
Claim明确、可挑战的上线主张“Customer Service AI 在 limited release 中只回答已批准 FAQ 和账户服务政策, 不承诺费用减免或信贷决定。”
Argument说明为什么证据足以支持 claim“RAG source 仅来自 approved policy repository; forbidden action classifier 和 response policy 阻断承诺性动作; 人工抽检覆盖高风险问题。”
Evidence支撑 argument 的材料source inventory、retrieval eval、policy violation eval、red-team report、sample QA、release gate minutes

6.2 Pilot / Release / Scale 证据深度

Stage目标证据深度Gate Decision
Pilot证明 use case 有价值, 且在窄范围内不会制造不可接受风险use case scope、risk tier、limited data lineage、baseline eval、human review SOP、manual fallback、pilot monitoringapprove pilot / restrict scope / stop
Release证明生产边界、控制设计、评测、监控、事件响应和责任链完整full PRD traceability、ADR、eval contract、control matrix、security/privacy review、release eval report、incident runbook、audit log samplerelease / limited release / no-go
Scale证明控制在更大用户、更多流程、更多流量和持续变更下仍有效trend monitoring、control operating effectiveness test、adoption and trust calibration、vendor review、drift review、incident history、quarterly assurance memoscale / hold / redesign / retire

6.3 Release Gate 的硬阻断条件

以下情况不应通过生产 release:

  • AI 可执行客户影响或监管敏感动作, 但无 tool allowlist、权限隔离和人工审批。
  • 高风险输出没有 eval contract, 或 eval 没有覆盖真实失败模式。
  • RAG 无 approved source inventory、freshness control、citation audit 或权限过滤。
  • 日志无法重建关键输出的 input reference、retrieved source、model version、prompt version、user action。
  • 供应商数据使用、模型更新通知、事件通知、subprocessor 或退出方案不清。
  • 监控无法发现 critical failure, 或无 stop authority 与 rollback path。
  • 关键 residual risk 没有 owner、expiry、review trigger 和明确接受记录。

6.4 Assurance Case 评审口径

评审时不要只问“证据是否存在”, 要问:

问题判断重点
Claim 是否过宽?是否限定 use case、用户、数据、模型版本、时间窗口和地区
Argument 是否跳跃?是否能解释为什么这些控制足够, 而不是只列材料
Evidence 是否匹配?证据是否直接证明 claim, 还是只证明团队做过相关工作
Evidence 是否新鲜?变更后是否重新测试, 证据是否仍适用
Residual risk 是否可接受?谁接受、接受多久、触发什么条件重审

7. Product / Architecture Integration

AI control library 和 evidence graph 不能只放在 GRC 工具里。它必须嵌入产品、架构、评测、发布和运营资产, 否则控制会变成事后整理。

7.1 从 PRD 到 Audit Binder 的连接

PRD
-> Risk and requirement traceability
-> ADR
-> Eval contract
-> Control matrix
-> Release gate
-> Monitoring plan
-> Audit binder
-> Regulator Q&A map
Artifact连接方式关键字段
PRD定义业务目标、用户、流程、AI 作用边界、不可接受行为AI role、decision boundary、user journey、failure mode、acceptance metric
ADR记录架构选择及其控制后果model/vendor choice、RAG pattern、tool permission、logging、fallback、tradeoff
Eval Contract把需求和风险转成可测标准scenario、rubric、threshold、critical failure、sample source、reviewer role
Control Matrix把风险、控制目标、控制活动、测试和证据连起来control ID、risk、activity、test、evidence、owner、frequency
Release Gate汇总是否允许进入 pilot、release、scalepass/fail、conditions、blockers、exceptions、approval、expiry
Monitoring Plan上线后证明 claim 仍成立metric、threshold、alert owner、sampling cadence、incident trigger
Audit Binder按问询路径组织证据evidence index、version、owner、review record、retention
Regulator Q&A Map把常见问题映射到 factual answer 和 evidencequestion、answer、claim、control、evidence、owner

7.2 产品门禁中的控制点

Product Decision必须连接的控制
AI 是否面向客户disclosure、content safety、policy boundary、complaint handling、customer impact monitoring
AI 是否生成建议grounding、explanation、human review、confidence / uncertainty display、override tracking
AI 是否执行动作tool allowlist、approval workflow、segregation of duties、transaction log、rollback
AI 是否使用客户数据data authorization、PII minimization、privacy review、retention、vendor data terms
AI 是否接入 RAGsource approval、index versioning、entitlement filtering、citation audit、stale source handling
AI 是否影响合规流程policy mapping、case record integrity、reviewer accountability、audit trail、regulatory response pack

7.3 架构门禁中的控制点

Architecture Area架构师要证明什么证据
System boundaryAI 在哪里读、写、生成、调用工具、记录日志C4 diagram、sequence diagram、data flow
Data boundary哪些数据进入 prompt、RAG、logs、monitoring 和 vendor servicedata lineage、field inventory、masking policy
Trust boundary用户输入、retrieved content、tool output 和 model output 的信任等级不同threat model、prompt injection test、content trust policy
Permission boundaryAI 不扩大用户原有权限RBAC mapping、entitlement filter test、access log
Change boundaryprompt、model、index、tool、policy source 变更都有回归路径change log、regression eval、approval ticket
Recovery boundary出错时可以停用、降级、回滚、人工接管rollback plan、manual fallback test、incident drill

7.4 Control-to-Requirement Traceability

需求不能停在 “AI should be accurate and safe”。更好的表达:

Requirement:
AML Agent must draft investigation summaries grounded in approved case evidence.

Risk:
Unsupported or misleading summary causes analyst error and weak regulatory evidence.

Control Objective:
Every material factual claim in the summary is traceable to approved case evidence.

Control Activity:
The system attaches source IDs to material facts, blocks unsupported conclusions, and requires analyst approval before saving to case record.

Test:
Grounding eval, citation audit, analyst review sample, negative test for unsupported facts.

Evidence:
Eval report, citation audit log, case record sample, approval workflow log.

8. Financial Retail Case: AML Investigation Agent Evidence Graph

8.1 场景边界

维度设定
Use caseAML Investigation Agent 辅助 analyst 阅读告警、交易、KYC 档案、历史 case notes 和 AML policy
AI roleretrieve、summarize、draft、red-flag checklist、evidence citation
AI 不做不自动关闭 alert, 不自动提交 SAR, 不更改客户风险评级, 不绕过主管审批
用户AML L1 analyst、L2 reviewer、QA reviewer
数据case management、transaction monitoring、KYC profile、approved AML policy repository
风险级别高影响, 因涉及 AML 合规义务、监管检查证据和客户影响

8.2 Top-Level Assurance Claims

Claim IDClaim
AML-C1Agent 只生成草稿和证据组织, 不执行最终 AML disposition 或 SAR submission。
AML-C2Agent 的 material factual statements 可追溯到 approved case evidence 或 approved AML policy。
AML-C3Agent 不扩大 analyst 对客户数据、历史案件或政策资料的访问权限。
AML-C4High-risk alert 的 AI 输出必须经过授权人员复核后才能进入 case record。
AML-C5生产运行中可监控 unsupported claim、wrong citation、override、latency、cost、incident 和 drift。

8.3 Evidence Graph Table

ClaimRiskControl ObjectiveControl ActivityTestEvidenceOwnerCadence
AML-C1AI 越权关闭告警或提交 SAR监管敏感动作只由授权人员执行Tool allowlist 仅允许 read、retrieve、draft; disposition API 无 AI 写权限API negative test、RBAC walkthrough、workflow sampletool registry、permission matrix、negative test report、case action log samplePlatform Owner / AML Ops每次 release 和季度 access review
AML-C2无依据 narrative 误导 analyst所有关键事实可追溯到 case evidence输出包含 source id; unsupported conclusion 被阻断或标记 evidence missinggrounding eval、citation audit、expert review sampleeval report、citation audit、review sample、failed case analysisEvalOps / AML QA每次 release, 上线后每周抽样
AML-C3AI 检索到用户无权查看的数据AI 继承 analyst 权限, 不扩大可见范围RAG retrieval 使用 entitlement filter; logs 不显示非授权字段access control test、cross-case leakage test、log masking testentitlement test result、retrieval trace sample、log masking evidenceSecurity / Data Owner每次 index 变更和月度复核
AML-C4人工复核流于形式高风险输出必须由合格 reviewer 审批UI 强制 review queue; 保存 case record 前记录 reviewer action 和 edit diffworkflow walkthrough、sample review、training validationSOP、training record、approval log、edit diff sampleAML Ops / L2 Reviewer Lead每月 QA 抽样和每次流程变更
AML-C5上线后质量或安全漂移未发现关键质量、安全、采用和事故指标持续监控dashboard 跟踪 wrong citation、unsupported claim、override、incident、cost、latencymonitoring alert test、dashboard review、incident drillmonitoring dashboard、alert history、incident drill record、quarterly assurance memoRiskOps / Platform Owner每周运营 review, 季度 assurance review

8.4 监管或内审问询响应

QuestionFactual AnswerEvidence Path
AI 是否会替代 analyst 做 AML 判断?不会。Agent 只能汇总、检索和生成草稿; disposition 和 SAR submission 仍由授权人员在 case management system 中完成。AML-C1、tool registry、permission matrix、case action log sample
如何证明 AI narrative 没有编造事实?每个 material factual statement 需要 source id; release eval 和每周 citation audit 检查 unsupported claim 和 wrong citation。AML-C2、grounding eval、citation audit、expert review sample
AI 是否扩大了客户数据访问范围?不扩大。检索层继承 analyst entitlement, 并通过 cross-case leakage test 和 access log 抽样验证。AML-C3、entitlement filter test、retrieval trace、access review
如果 AI 错误影响案件记录怎么办?触发 AI incident runbook, 冻结相关版本, 做影响范围分析、case correction、control retest 和复盘。AML-C5、incident runbook、postmortem、control retest

8.5 Customer-Facing Variant

如果场景改成 customer-facing AI, 证据图谱要额外强化:

  • disclosure 和客户理解: 客户是否知道 AI 参与服务, 何时转人工。
  • policy boundary: AI 不承诺费用减免、授信批准、监管解释或法律结论。
  • complaint and correction: 客户如何申诉、纠错和获得人工复核。
  • vulnerable customer handling: 对弱势客户、语言障碍、特殊需求客户设置更高人工转接门槛。
  • channel monitoring: 监控错误回答、升级率、投诉、客户损害、重复联系和人工覆盖率。

9. Artifact Templates

以下模板用于作品集、项目启动和审计准备。模板中的示例是字段要求和表达方式, 正式项目应按机构制度、GRC 工具、模型风险流程和数据治理标准落地。

9.1 Control Catalog Template

Field填写要求示例
Control ID唯一编号, 可跨文档引用AICL-RAG-003
Control Name控制名称要动宾清楚Approved RAG source and citation control
Domain控制域RAG
Risk Statement写清风险事件和影响未批准或过期政策被检索, 导致客户或员工收到错误合规解释
Control Objective希望达到的控制状态生产 RAG 仅使用已批准、有效、可追溯的知识来源
Control Activity实际动作、系统规则或流程source registry 审批后进入 index; 每次 index build 记录 source version; 输出必须带 source id
Control Typepreventive、detective、corrective、directivepreventive + detective
Test Method如何验证设计和运行有效source sample test、citation audit、index build review
Evidence可检查材料source registry、index build log、citation audit report
Owner控制 owner 和 evidence ownerKnowledge Owner / Platform Owner
Frequency执行或复核频率每次 source/index 变更, 每周抽样
Failure Condition何时阻断或升级wrong citation 高风险样本超过阈值; source effective status 不是 active

9.2 Evidence Graph Table Template

Claim IDRisk IDRequirement IDControl IDControl ActivityTest IDEvidence IDEvidence QualityOwnerCadenceGate Impact
AML-C2AML-R7PRD-REQ-14AICL-RAG-003Material facts require source idEVAL-GRD-02EV-CIT-2026Q3-01sample size, version, reviewer, date recordedEvalOps Ownerweekly samplerelease blocker if critical failure occurs

Evidence Quality 建议包含:

  • coverage: 覆盖哪些场景、用户、数据、版本。
  • freshness: 证据生成日期和适用版本。
  • independence: 是否由二线、三线或独立 reviewer 复核。
  • reproducibility: 是否能重放输入、检索、输出和人工动作。
  • retention: 保留期限和访问控制。

9.3 Assurance Case Memo Template

# Assurance Case Memo: System Name / Release Version

## Scope
- Use case:
- Users:
- Business process:
- AI role:
- Excluded actions:
- Model / vendor / version:
- Data and knowledge sources:
- Release stage:

## Top-Level Claims
| Claim ID | Claim | Owner | Review Date |
|---|---|---|---|

## Claim-Argument-Evidence
| Claim | Argument | Evidence | Residual Risk | Decision |
|---|---|---|---|---|

## Control Coverage
| Risk | Control Objective | Control Activity | Test | Evidence |
|---|---|---|---|---|

## Release Gate Decision
- Decision:
- Conditions:
- Blockers closed:
- Accepted residual risks:
- Stop rules:
- Next assurance review:

## Monitoring and Change Triggers
| Trigger | Required Action | Owner |
|---|---|---|

写作标准:

  • Scope 要明确边界, 不用“企业 AI 平台整体可信”这类过宽主张。
  • Claim 要可验证, 不写“系统安全可靠”这种无法审查的句子。
  • Argument 要说明为什么证据足够, 不只是把 evidence list 粘贴进文档。
  • Decision 要说明条件、时效和复核触发点。

9.4 Regulator Q&A Map Template

Examiner QuestionFactual AnswerClaimControl IDEvidenceOwnerResidual Risk / Follow-Up
这个 AI 是否会做最终客户影响决定?AI 只生成建议和草稿, 最终决定由授权人员在核心系统完成。C-DEC-001AICL-HITL-004workflow map、approval log、sample reviewBusiness Ops Ownerautomation bias 通过培训、override monitoring 和 QA 抽样管理
如何证明知识库没有使用过期政策?生产 index 只接收 approved source registry 中 active 状态的政策版本。C-RAG-002AICL-RAG-003source registry、index build log、freshness dashboardKnowledge Owner政策紧急更新触发 out-of-cycle index rebuild
模型供应商更新会不会绕过内部审批?高风险系统要求 vendor update notice, 重大变更触发 regression eval 和 staged rollout。C-VND-003AICL-VND-006vendor terms、change log、regression reportVendor Owner紧急供应商变更进入 risk acceptance review

10. Interview Answers

10.1 30 秒版本

AI control library 不能只是 checklist。我的做法是把控制库设计成 evidence graph: 从 business requirement 和 AI risk 出发, 映射到 control objective、control activity、test、evidence、owner 和 review cadence。上线时用 assurance case 的 claim-argument-evidence 结构说明为什么当前版本可以 pilot、release 或 scale; 上线后用 monitoring 和 incident loop 持续证明 claim 没有漂移。这样面对监管或内审时, 每个回答都能追到具体控制和证据。

10.2 2 分钟版本

我会把 AI 控制体系拆成三层。第一层是 control library, 定义 governance、data、model、RAG、agent/tool、security/privacy、human oversight、monitoring、incident、vendor 和 adoption 等控制域。每个控制项都写清 risk statement、control objective、control activity、test method、evidence、owner、frequency 和 failure condition。

第二层是 assurance case。对于具体 use case, 比如 AML Investigation Agent, 我不会泛泛说“有人工复核”或“模型已测试”, 而是写成 claim-argument-evidence: Agent 不自动关闭告警, 因为工具权限没有 disposition write API, workflow 需要 analyst approval, 并且 negative test 和 case log sample 支撑这个主张。

第三层是 evidence graph。它把 claim、risk、control objective、control activity、test、evidence、owner 和 cadence 连接起来。这样 PRD 中的 AI 边界、ADR 中的架构选择、eval contract 中的测试阈值、control matrix 中的控制活动、release gate 中的 go/no-go 决策和 audit binder 中的材料是一条链。监管问询时, 团队不是临时找材料, 而是直接从问题追到 claim、control 和 evidence。

10.3 CRO 版本

我会把这个问题表述为“管理层如何知道 AI residual risk 在风险偏好内”。控制库负责定义最低控制期望; assurance case 负责说明在某个 use case、版本和范围内哪些 claim 被证据支持; evidence graph 负责证明控制设计和运行结果。CRO 需要看到的不是模型准确率单点指标, 而是 material AI inventory、risk tier、control coverage、critical failure trend、policy exceptions、incidents、accepted residual risks、owner accountability 和 stop rules。这样 AI 风险可以进入常规风险治理节奏, 而不是作为技术项目单独运行。

10.4 Chief Architect 版本

我会从架构可追溯性回答。AI 系统的 control library 必须嵌入架构边界: 数据边界、权限边界、模型边界、RAG source 边界、tool execution 边界、日志边界和恢复边界。每个 ADR 都要说明它影响哪些 control objective; 每次 prompt、model、index、tool 或 policy source 变更都要触发受影响 eval 和 evidence 的刷新。Chief Architect 关注的是系统在持续变化下仍能证明控制有效, 所以 evidence graph 应该成为 architecture governance 的一部分, 支持 release gate、change impact analysis、incident review 和监管材料生成。