AI 扩展计划 / Playbooks

AI Control Library / Assurance Evidence Graph Playbook

这些来源作为控制库和证据图谱的设计锚点。实战中不要把它们机械转成问卷, 而要转成 control objective、control activity、test method、evidence、owner、cadence 和 gate decision。

514 行AI_CONTROL_LIBRARY_ASSURANCE_EVIDENCE_GRAPH_PLAYBOOK.md

AI Control Library / Assurance Evidence Graph Playbook

定位: 面向 AI PM / AI BA / Solutions Architect / Enterprise Architect / Risk / Compliance / Internal Audit 的 AI 控制库与证据图谱实战手册。

目标: 把 AI control objective、control activity、test evidence、assurance case、claim-argument-evidence、control-to-requirement traceability、release gate、monitoring 和监管问询材料连接成一套可运营、可审计、可复核的 evidence graph。

核心观点: AI 控制库不是一张 checklist, 而是一套能证明“哪些 AI 风险在什么边界内被哪些控制降低到可接受水平”的证据系统。

使用方式: 每个高影响 AI use case 在 pilot、release、scale 三个阶段维护一张 control-to-evidence graph, 并把关键节点同步到 PRD、ADR、eval contract、control matrix、release gate 和 audit binder。

重要说明: 本文是学习、作品集和治理设计材料, 不是法律意见、审计意见、模型验证结论或监管解释。正式项目必须由 Legal、Compliance、Risk、Model Risk、Internal Audit、Security、Privacy、Data Owner 和业务管理层按适用司法辖区确认。

1. Source Anchors

Anchor	Official Link	在本文中的用法
NIST AI RMF	https://www.nist.gov/itl/ai-risk-management-framework	用 Govern / Map / Measure / Manage 组织 AI 风险、控制、评估和持续监控
NIST SP 800-53 Rev. 5	https://csrc.nist.gov/publications/detail/sp/800-53/rev-5/final	借鉴控制库的结构化语言: control family、control objective、control enhancement、assessment procedure、evidence
NIST Cybersecurity Framework 2.0	https://www.nist.gov/cyberframework	用 Govern / Identify / Protect / Detect / Respond / Recover 连接 AI security、privacy、incident 和 resilience 控制
ISO/IEC 42001	https://www.iso.org/standard/81230.html	用 AI management system 视角组织范围、责任、风险机会、运行控制、绩效评价、持续改进和管理评审

使用纪律:

Source anchor 提供控制语言和治理结构, 不直接给出某个机构的合规结论。
AI control library 必须按 use case、风险等级、业务流程、模型形态、数据敏感性和自动化程度裁剪。
每个高风险 claim 必须能追到 evidence, 每份关键 evidence 必须能追回 control objective 和 release decision。
对监管、内审和模型风险问询, 不用“我们遵循某框架”作为回答终点, 而要展示证据链。

2. One-Sentence Positioning

AI Control Library defines what must be controlled; Assurance Case explains why the controls are sufficient; Evidence Graph proves the controls operated with traceable artifacts.

中文表达:

AI 控制库定义“必须控制什么”, assurance case 说明“为什么这些控制足以支撑上线主张”, evidence graph 证明“控制在特定系统、版本、数据、流程和时间窗口内真实运行过”。

最小闭环:

Business requirement
-> AI risk
-> control objective
-> control activity
-> test method
-> evidence
-> claim-argument-evidence
-> release gate
-> production monitoring
-> regulator-ready evidence graph

三者分工:

对象	回答的问题	典型产物
Control library	对某类 AI 风险, 组织要求哪些控制目标和控制活动?	control catalog、risk-control matrix、control standard
Assurance case	在某个 use case 和版本边界内, 为什么可以认为系统满足上线主张?	claim-argument-evidence memo、residual risk statement、sign-off
Evidence graph	哪些证据支持哪些 claim、control、test、owner 和 review cadence?	evidence graph table、traceability graph、audit binder index

3. 为什么 AI 控制不能只靠 checklist

Checklist 的价值是提醒团队别遗漏常见事项, 但它不能独立证明 AI 系统可上线、可运营、可接受监管和审计挑战。AI 控制的核心难点不是“有没有控制项”, 而是“控制项是否覆盖具体风险, 是否被测试, 是否有证据, 是否仍然有效”。

3.1 Checklist 的典型失效方式

失效方式	表面看起来	实际问题
无上下文	“已完成人工复核控制”	不知道复核哪个输出、哪个角色、覆盖比例、是否能覆盖自动化偏见
无证据充分性	“已完成模型评估”	不知道测试集是否覆盖真实失败模式、阈值如何设定、失败样本如何处置
无版本边界	“RAG 已测试通过”	prompt、retriever、index、policy source、embedding model 变更后证据失效
无运行证明	“上线时通过安全评审”	生产中 prompt injection、权限漂移、日志泄露、供应商变更没有持续监控
无责任链	“风险可接受”	不知道谁接受、接受到什么时候、触发什么条件需要重新评审
无问询路径	“材料都在共享盘”	监管问起某个 claim 时, 团队无法在有限时间内拿出同一口径的证据链

3.2 AI 控制需要图谱化的原因

AI 系统的风险来自多个层面同时变化:

业务流程会变: 客户群、操作人员、审批节点、政策解释发生调整。
数据会变: 数据源、质量、权限、标签、知识库版本、保留规则发生变化。
模型会变: vendor model、内部模型、prompt、system instruction、tool schema、guardrail 发生变化。
使用方式会变: 用户从“参考 AI”逐渐变成“默认采纳 AI”。
外部要求会变: 监管关注、审计范围、供应商条款、安全威胁和行业事件持续变化。

因此 AI 控制必须从静态 checklist 升级为 evidence graph:

Requirement traceability: 业务和监管要求追到控制
Risk traceability: 风险追到控制目标和控制活动
Evidence traceability: 控制追到测试、证据、owner 和复核节奏
Change traceability: 变更追到受影响的 claim、control、test 和 evidence
Question traceability: 监管问询追到标准回答和证据索引

3.3 好控制表达与弱控制表达

弱表达	问题	强表达
“系统有 human-in-the-loop。”	没有说明人工复核的强度和证据	“所有 AML high-risk alert 的 AI narrative 在进入 case record 前必须由 L2 analyst 审批; 日志记录 AI draft、human edit diff、approval user、timestamp 和最终 disposition。”
“RAG 会引用来源。”	没有证明来源正确或当前有效	“生产回答必须引用 approved policy repository 中 effective status 为 active 的 source id; citation audit 每周抽样 100 条, high-risk wrong citation 为 release blocker。”
“模型经过测试。”	不知道测试覆盖什么风险	“Eval contract 覆盖 common、edge、missing-data、policy-conflict、adversarial 和 historical incident cases; critical unauthorized-action failure 必须为 0。”
“供应商已评估。”	无法连接到具体 AI 风险	“Vendor due diligence 覆盖 data use terms、model update notice、subprocessor、incident notification、exit plan 和 no-training configuration, 并映射到第三方 AI 控制目标。”

4. Control Library Taxonomy

AI control library 应该按控制域组织, 但每个控制项都必须能落到 use case。下面的 taxonomy 适合金融零售 AI 项目, 尤其是 customer-facing AI、AML / KYC / fraud agent、credit policy RAG、投诉处理助手和运营 Copilot。

Domain	Control Objective	Control Activity	Test Evidence	Gate Signal
Governance	所有 AI use case 被登记、分级、审批和问责	建立 AI inventory、risk tiering、RACI、stage gate、exception register	AI inventory record、risk tier worksheet、committee minutes、owner attestation	无 owner、无 risk tier、无审批记录则不能进入 pilot
Data	数据使用可授权、可追溯、可最小化、可按权限隔离	维护 data lineage、data classification、PII handling、quality checks、retention rule	data flow diagram、data quality report、privacy review、access log sample	未批准敏感数据或权限不清则不能接入生产
Model	模型用途、限制、表现、变更和监控清楚	维护 model record、model card、benchmark、risk-tiered evaluation、version control	model card、eval report、model selection memo、change log	高风险失败未关闭则不能 release
RAG	知识来源受控, 检索结果可引用、可复核、可更新	source approval、index versioning、citation requirement、freshness check、retrieval evaluation	source inventory、index build record、citation audit、retrieval eval report	wrong citation 或 stale source 超阈值则 no-go
Agent / Tool	工具调用受 allowlist、权限、审批和审计约束	tool registry、scope restriction、dry-run、human approval、execution log	tool permission matrix、test run log、approval workflow sample	能执行客户影响动作但无人工审批则 no-go
Security / Privacy	Prompt、日志、模型调用、向量库和工具链不扩大安全与隐私风险	threat modeling、RBAC、DLP、prompt injection defense、log minimization、encryption	threat model、red-team report、access review、DLP finding closure	critical security finding 未关闭则不能生产
Human Oversight	人工复核是真实可操作的控制, 不是形式签字	define reviewer role、override ability、review queue、training、quality sampling	SOP、training record、override log、review sample	用户不能理解或推翻 AI 输出则不能高影响上线
Monitoring	上线后持续证明质量、安全、成本、漂移和采用情况	production metrics、KRI/KPI dashboard、alert threshold、sampling review、claim drift check	monitoring dashboard、alert history、sample review report	监控盲区覆盖高风险 claim 则限制发布范围
Incident	AI incident 和 near miss 可发现、升级、隔离、复盘和整改	severity taxonomy、stop rule、rollback、RCA、customer impact assessment	incident runbook、drill record、postmortem、control retest	无 stop authority 或 rollback 机制则不能 release
Vendor	第三方 AI 服务、模型、数据处理和变更受控	TPRM review、contract terms、model update notice、SLA、exit plan、subprocessor review	vendor due diligence、DPA、SLA、exit test evidence	高风险 vendor 缺合同关键条款则不能接入敏感场景
Adoption	用户采用、信任校准和业务价值被运营, 防止 over-trust 与 under-trust	onboarding、usage analytics、trust calibration、feedback loop、change management	training completion、usage dashboard、feedback themes、benefit tracking	价值无法衡量或自动化偏见上升则暂停扩展

4.1 控制 ID 命名建议

控制 ID 不追求复杂, 但要支持检索、映射和版本管理:

AICL-GOV-001  AI use case inventory and ownership
AICL-DATA-002 Data lineage and authorization
AICL-RAG-003  Approved source and citation control
AICL-AGT-004  Tool allowlist and human approval
AICL-MON-005  Production quality and safety monitoring

每个控制项至少包含:

字段	说明
Control ID	唯一编号, 支持版本和引用
Domain	控制域, 如 data、RAG、agent/tool
Risk Statement	控制要降低的 AI 风险
Control Objective	希望达成的控制状态
Control Activity	实际执行的动作、系统规则或流程门禁
Test Method	设计有效性和运行有效性的测试方法
Evidence	可检查材料, 包括日志、报告、审批、抽样结果
Owner	控制 owner 和 evidence owner
Frequency	触发式、每次发布、每周、每月、季度、年度
Failure Condition	什么情况导致 release blocker、incident 或整改

5. Evidence Graph

Evidence graph 的目标是让一个监管、内审或架构评审问题可以从高层 claim 追到具体证据, 也可以从某份证据反向追到它支撑了哪些控制和上线决策。

5.1 标准链路

Claim
-> Risk
-> Control Objective
-> Control Activity
-> Test
-> Evidence
-> Owner
-> Review Cadence

Node	解释	示例
Claim	可审查的可信性主张	“AML Agent 不会自动关闭告警或提交 SAR。”
Risk	该 claim 管理的风险	AI 越权执行监管敏感动作
Control Objective	控制希望达成的状态	所有 case disposition 和 SAR submission 保留人工审批
Control Activity	实际控制动作	移除 disposition API 写权限, 工具调用仅允许 read / draft, SAR 提交按钮只对 human role 开放
Test	验证控制是否设计并运行有效	RBAC 测试、API negative test、日志抽样、workflow walkthrough
Evidence	测试和控制运行的证据	permission matrix、negative test report、case log sample、release sign-off
Owner	谁对控制和证据负责	AML Ops Owner、Platform Owner、Security Owner
Review Cadence	证据刷新和复核节奏	每次 release、每月 access review、季度 assurance review

5.2 Edge 类型

Edge	含义	典型问题
supports	evidence 支持 test 或 claim	这份报告支持哪个主张?
mitigates	control objective 降低 risk	这个风险由哪些控制降低?
implements	control activity 实现 control objective	控制目标在系统中如何落地?
verifies	test 验证 control activity	控制有没有被测试?
owns	owner 对 control 或 evidence 负责	证据过期时找谁?
refreshes	cadence 定义复核节奏	多久重新证明一次?
blocks	failed test 阻断 release gate	哪些失败会 no-go?
traces_to	requirement 映射到 risk/control/evidence	监管要求或 PRD requirement 如何落到控制?

5.3 Regulator-Ready Evidence Graph 的质量标准

一张监管就绪的 evidence graph 至少满足:

每个 material claim 至少有一个 risk、一个 control objective、一个 test 和一份 evidence。
每个 release blocker 有明确 failure condition、owner、decision record 和 remediation evidence。
每份 high-value evidence 有版本、生成日期、复核人、样本范围、保留规则和访问权限。
每个高风险变更能识别受影响的 claim、control、eval case、monitoring signal 和 regulator Q&A。
每个监管问询都能定位到 factual answer、control owner、evidence path、residual risk 和管理层口径。

5.4 图谱查询示例

查询	业务意义
显示所有支持 `AI does not make final credit decision` 的 evidence	支撑客户权益和自动化决策边界说明
找出所有 `RAG wrong citation` 风险对应的 control 和 failed tests	识别 release gate 中的质量阻断点
列出过去 90 天内证据过期的 high-risk claims	做季度 assurance review
查找某次 prompt 变更影响哪些 eval contract 和 monitoring signals	做变更影响分析
输出 AML Agent 对监管问询的 claim-argument-evidence map	准备检查室材料

6. Release Assurance Case

Release assurance case 不是上线审批表的附件, 而是 gate decision 的理由。它用 claim-argument-evidence 结构说明: 在当前阶段、范围、用户、数据、模型和控制条件下, 系统是否可以进入下一阶段。

6.1 CAE 结构

元素	作用	金融零售 AI 示例
Claim	明确、可挑战的上线主张	“Customer Service AI 在 limited release 中只回答已批准 FAQ 和账户服务政策, 不承诺费用减免或信贷决定。”
Argument	说明为什么证据足以支持 claim	“RAG source 仅来自 approved policy repository; forbidden action classifier 和 response policy 阻断承诺性动作; 人工抽检覆盖高风险问题。”
Evidence	支撑 argument 的材料	source inventory、retrieval eval、policy violation eval、red-team report、sample QA、release gate minutes

6.2 Pilot / Release / Scale 证据深度

Stage	目标	证据深度	Gate Decision
Pilot	证明 use case 有价值, 且在窄范围内不会制造不可接受风险	use case scope、risk tier、limited data lineage、baseline eval、human review SOP、manual fallback、pilot monitoring	approve pilot / restrict scope / stop
Release	证明生产边界、控制设计、评测、监控、事件响应和责任链完整	full PRD traceability、ADR、eval contract、control matrix、security/privacy review、release eval report、incident runbook、audit log sample	release / limited release / no-go
Scale	证明控制在更大用户、更多流程、更多流量和持续变更下仍有效	trend monitoring、control operating effectiveness test、adoption and trust calibration、vendor review、drift review、incident history、quarterly assurance memo	scale / hold / redesign / retire

6.3 Release Gate 的硬阻断条件

以下情况不应通过生产 release:

AI 可执行客户影响或监管敏感动作, 但无 tool allowlist、权限隔离和人工审批。
高风险输出没有 eval contract, 或 eval 没有覆盖真实失败模式。
RAG 无 approved source inventory、freshness control、citation audit 或权限过滤。
日志无法重建关键输出的 input reference、retrieved source、model version、prompt version、user action。
供应商数据使用、模型更新通知、事件通知、subprocessor 或退出方案不清。
监控无法发现 critical failure, 或无 stop authority 与 rollback path。
关键 residual risk 没有 owner、expiry、review trigger 和明确接受记录。

6.4 Assurance Case 评审口径

评审时不要只问“证据是否存在”, 要问:

问题	判断重点
Claim 是否过宽?	是否限定 use case、用户、数据、模型版本、时间窗口和地区
Argument 是否跳跃?	是否能解释为什么这些控制足够, 而不是只列材料
Evidence 是否匹配?	证据是否直接证明 claim, 还是只证明团队做过相关工作
Evidence 是否新鲜?	变更后是否重新测试, 证据是否仍适用
Residual risk 是否可接受?	谁接受、接受多久、触发什么条件重审

7. Product / Architecture Integration

AI control library 和 evidence graph 不能只放在 GRC 工具里。它必须嵌入产品、架构、评测、发布和运营资产, 否则控制会变成事后整理。

7.1 从 PRD 到 Audit Binder 的连接

PRD
-> Risk and requirement traceability
-> ADR
-> Eval contract
-> Control matrix
-> Release gate
-> Monitoring plan
-> Audit binder
-> Regulator Q&A map

Artifact	连接方式	关键字段
PRD	定义业务目标、用户、流程、AI 作用边界、不可接受行为	AI role、decision boundary、user journey、failure mode、acceptance metric
ADR	记录架构选择及其控制后果	model/vendor choice、RAG pattern、tool permission、logging、fallback、tradeoff
Eval Contract	把需求和风险转成可测标准	scenario、rubric、threshold、critical failure、sample source、reviewer role
Control Matrix	把风险、控制目标、控制活动、测试和证据连起来	control ID、risk、activity、test、evidence、owner、frequency
Release Gate	汇总是否允许进入 pilot、release、scale	pass/fail、conditions、blockers、exceptions、approval、expiry
Monitoring Plan	上线后证明 claim 仍成立	metric、threshold、alert owner、sampling cadence、incident trigger
Audit Binder	按问询路径组织证据	evidence index、version、owner、review record、retention
Regulator Q&A Map	把常见问题映射到 factual answer 和 evidence	question、answer、claim、control、evidence、owner

7.2 产品门禁中的控制点

Product Decision	必须连接的控制
AI 是否面向客户	disclosure、content safety、policy boundary、complaint handling、customer impact monitoring
AI 是否生成建议	grounding、explanation、human review、confidence / uncertainty display、override tracking
AI 是否执行动作	tool allowlist、approval workflow、segregation of duties、transaction log、rollback
AI 是否使用客户数据	data authorization、PII minimization、privacy review、retention、vendor data terms
AI 是否接入 RAG	source approval、index versioning、entitlement filtering、citation audit、stale source handling
AI 是否影响合规流程	policy mapping、case record integrity、reviewer accountability、audit trail、regulatory response pack

7.3 架构门禁中的控制点

Architecture Area	架构师要证明什么	证据
System boundary	AI 在哪里读、写、生成、调用工具、记录日志	C4 diagram、sequence diagram、data flow
Data boundary	哪些数据进入 prompt、RAG、logs、monitoring 和 vendor service	data lineage、field inventory、masking policy
Trust boundary	用户输入、retrieved content、tool output 和 model output 的信任等级不同	threat model、prompt injection test、content trust policy
Permission boundary	AI 不扩大用户原有权限	RBAC mapping、entitlement filter test、access log
Change boundary	prompt、model、index、tool、policy source 变更都有回归路径	change log、regression eval、approval ticket
Recovery boundary	出错时可以停用、降级、回滚、人工接管	rollback plan、manual fallback test、incident drill

7.4 Control-to-Requirement Traceability

需求不能停在 “AI should be accurate and safe”。更好的表达:

Requirement:
AML Agent must draft investigation summaries grounded in approved case evidence.

Risk:
Unsupported or misleading summary causes analyst error and weak regulatory evidence.

Control Objective:
Every material factual claim in the summary is traceable to approved case evidence.

Control Activity:
The system attaches source IDs to material facts, blocks unsupported conclusions, and requires analyst approval before saving to case record.

Test:
Grounding eval, citation audit, analyst review sample, negative test for unsupported facts.

Evidence:
Eval report, citation audit log, case record sample, approval workflow log.

8. Financial Retail Case: AML Investigation Agent Evidence Graph

8.1 场景边界

维度	设定
Use case	AML Investigation Agent 辅助 analyst 阅读告警、交易、KYC 档案、历史 case notes 和 AML policy
AI role	retrieve、summarize、draft、red-flag checklist、evidence citation
AI 不做	不自动关闭 alert, 不自动提交 SAR, 不更改客户风险评级, 不绕过主管审批
用户	AML L1 analyst、L2 reviewer、QA reviewer
数据	case management、transaction monitoring、KYC profile、approved AML policy repository
风险级别	高影响, 因涉及 AML 合规义务、监管检查证据和客户影响

8.2 Top-Level Assurance Claims

Claim ID	Claim
AML-C1	Agent 只生成草稿和证据组织, 不执行最终 AML disposition 或 SAR submission。
AML-C2	Agent 的 material factual statements 可追溯到 approved case evidence 或 approved AML policy。
AML-C3	Agent 不扩大 analyst 对客户数据、历史案件或政策资料的访问权限。
AML-C4	High-risk alert 的 AI 输出必须经过授权人员复核后才能进入 case record。
AML-C5	生产运行中可监控 unsupported claim、wrong citation、override、latency、cost、incident 和 drift。

8.3 Evidence Graph Table

Claim	Risk	Control Objective	Control Activity	Test	Evidence	Owner	Cadence
AML-C1	AI 越权关闭告警或提交 SAR	监管敏感动作只由授权人员执行	Tool allowlist 仅允许 read、retrieve、draft; disposition API 无 AI 写权限	API negative test、RBAC walkthrough、workflow sample	tool registry、permission matrix、negative test report、case action log sample	Platform Owner / AML Ops	每次 release 和季度 access review
AML-C2	无依据 narrative 误导 analyst	所有关键事实可追溯到 case evidence	输出包含 source id; unsupported conclusion 被阻断或标记 evidence missing	grounding eval、citation audit、expert review sample	eval report、citation audit、review sample、failed case analysis	EvalOps / AML QA	每次 release, 上线后每周抽样
AML-C3	AI 检索到用户无权查看的数据	AI 继承 analyst 权限, 不扩大可见范围	RAG retrieval 使用 entitlement filter; logs 不显示非授权字段	access control test、cross-case leakage test、log masking test	entitlement test result、retrieval trace sample、log masking evidence	Security / Data Owner	每次 index 变更和月度复核
AML-C4	人工复核流于形式	高风险输出必须由合格 reviewer 审批	UI 强制 review queue; 保存 case record 前记录 reviewer action 和 edit diff	workflow walkthrough、sample review、training validation	SOP、training record、approval log、edit diff sample	AML Ops / L2 Reviewer Lead	每月 QA 抽样和每次流程变更
AML-C5	上线后质量或安全漂移未发现	关键质量、安全、采用和事故指标持续监控	dashboard 跟踪 wrong citation、unsupported claim、override、incident、cost、latency	monitoring alert test、dashboard review、incident drill	monitoring dashboard、alert history、incident drill record、quarterly assurance memo	RiskOps / Platform Owner	每周运营 review, 季度 assurance review

8.4 监管或内审问询响应

Question	Factual Answer	Evidence Path
AI 是否会替代 analyst 做 AML 判断?	不会。Agent 只能汇总、检索和生成草稿; disposition 和 SAR submission 仍由授权人员在 case management system 中完成。	AML-C1、tool registry、permission matrix、case action log sample
如何证明 AI narrative 没有编造事实?	每个 material factual statement 需要 source id; release eval 和每周 citation audit 检查 unsupported claim 和 wrong citation。	AML-C2、grounding eval、citation audit、expert review sample
AI 是否扩大了客户数据访问范围?	不扩大。检索层继承 analyst entitlement, 并通过 cross-case leakage test 和 access log 抽样验证。	AML-C3、entitlement filter test、retrieval trace、access review
如果 AI 错误影响案件记录怎么办?	触发 AI incident runbook, 冻结相关版本, 做影响范围分析、case correction、control retest 和复盘。	AML-C5、incident runbook、postmortem、control retest

8.5 Customer-Facing Variant

如果场景改成 customer-facing AI, 证据图谱要额外强化:

disclosure 和客户理解: 客户是否知道 AI 参与服务, 何时转人工。
policy boundary: AI 不承诺费用减免、授信批准、监管解释或法律结论。
complaint and correction: 客户如何申诉、纠错和获得人工复核。
vulnerable customer handling: 对弱势客户、语言障碍、特殊需求客户设置更高人工转接门槛。
channel monitoring: 监控错误回答、升级率、投诉、客户损害、重复联系和人工覆盖率。

9. Artifact Templates

以下模板用于作品集、项目启动和审计准备。模板中的示例是字段要求和表达方式, 正式项目应按机构制度、GRC 工具、模型风险流程和数据治理标准落地。

9.1 Control Catalog Template

Field	填写要求	示例
Control ID	唯一编号, 可跨文档引用	AICL-RAG-003
Control Name	控制名称要动宾清楚	Approved RAG source and citation control
Domain	控制域	RAG
Risk Statement	写清风险事件和影响	未批准或过期政策被检索, 导致客户或员工收到错误合规解释
Control Objective	希望达到的控制状态	生产 RAG 仅使用已批准、有效、可追溯的知识来源
Control Activity	实际动作、系统规则或流程	source registry 审批后进入 index; 每次 index build 记录 source version; 输出必须带 source id
Control Type	preventive、detective、corrective、directive	preventive + detective
Test Method	如何验证设计和运行有效	source sample test、citation audit、index build review
Evidence	可检查材料	source registry、index build log、citation audit report
Owner	控制 owner 和 evidence owner	Knowledge Owner / Platform Owner
Frequency	执行或复核频率	每次 source/index 变更, 每周抽样
Failure Condition	何时阻断或升级	wrong citation 高风险样本超过阈值; source effective status 不是 active

9.2 Evidence Graph Table Template

Claim ID	Risk ID	Requirement ID	Control ID	Control Activity	Test ID	Evidence ID	Evidence Quality	Owner	Cadence	Gate Impact
AML-C2	AML-R7	PRD-REQ-14	AICL-RAG-003	Material facts require source id	EVAL-GRD-02	EV-CIT-2026Q3-01	sample size, version, reviewer, date recorded	EvalOps Owner	weekly sample	release blocker if critical failure occurs

Evidence Quality 建议包含:

coverage: 覆盖哪些场景、用户、数据、版本。
freshness: 证据生成日期和适用版本。
independence: 是否由二线、三线或独立 reviewer 复核。
reproducibility: 是否能重放输入、检索、输出和人工动作。
retention: 保留期限和访问控制。

9.3 Assurance Case Memo Template

# Assurance Case Memo: System Name / Release Version

## Scope
- Use case:
- Users:
- Business process:
- AI role:
- Excluded actions:
- Model / vendor / version:
- Data and knowledge sources:
- Release stage:

## Top-Level Claims
| Claim ID | Claim | Owner | Review Date |
|---|---|---|---|

## Claim-Argument-Evidence
| Claim | Argument | Evidence | Residual Risk | Decision |
|---|---|---|---|---|

## Control Coverage
| Risk | Control Objective | Control Activity | Test | Evidence |
|---|---|---|---|---|

## Release Gate Decision
- Decision:
- Conditions:
- Blockers closed:
- Accepted residual risks:
- Stop rules:
- Next assurance review:

## Monitoring and Change Triggers
| Trigger | Required Action | Owner |
|---|---|---|

写作标准:

Scope 要明确边界, 不用“企业 AI 平台整体可信”这类过宽主张。
Claim 要可验证, 不写“系统安全可靠”这种无法审查的句子。
Argument 要说明为什么证据足够, 不只是把 evidence list 粘贴进文档。
Decision 要说明条件、时效和复核触发点。

9.4 Regulator Q&A Map Template

Examiner Question	Factual Answer	Claim	Control ID	Evidence	Owner	Residual Risk / Follow-Up
这个 AI 是否会做最终客户影响决定?	AI 只生成建议和草稿, 最终决定由授权人员在核心系统完成。	C-DEC-001	AICL-HITL-004	workflow map、approval log、sample review	Business Ops Owner	automation bias 通过培训、override monitoring 和 QA 抽样管理
如何证明知识库没有使用过期政策?	生产 index 只接收 approved source registry 中 active 状态的政策版本。	C-RAG-002	AICL-RAG-003	source registry、index build log、freshness dashboard	Knowledge Owner	政策紧急更新触发 out-of-cycle index rebuild
模型供应商更新会不会绕过内部审批?	高风险系统要求 vendor update notice, 重大变更触发 regression eval 和 staged rollout。	C-VND-003	AICL-VND-006	vendor terms、change log、regression report	Vendor Owner	紧急供应商变更进入 risk acceptance review

10. Interview Answers

10.1 30 秒版本

AI control library 不能只是 checklist。我的做法是把控制库设计成 evidence graph: 从 business requirement 和 AI risk 出发, 映射到 control objective、control activity、test、evidence、owner 和 review cadence。上线时用 assurance case 的 claim-argument-evidence 结构说明为什么当前版本可以 pilot、release 或 scale; 上线后用 monitoring 和 incident loop 持续证明 claim 没有漂移。这样面对监管或内审时, 每个回答都能追到具体控制和证据。

10.2 2 分钟版本

我会把 AI 控制体系拆成三层。第一层是 control library, 定义 governance、data、model、RAG、agent/tool、security/privacy、human oversight、monitoring、incident、vendor 和 adoption 等控制域。每个控制项都写清 risk statement、control objective、control activity、test method、evidence、owner、frequency 和 failure condition。

第二层是 assurance case。对于具体 use case, 比如 AML Investigation Agent, 我不会泛泛说“有人工复核”或“模型已测试”, 而是写成 claim-argument-evidence: Agent 不自动关闭告警, 因为工具权限没有 disposition write API, workflow 需要 analyst approval, 并且 negative test 和 case log sample 支撑这个主张。

第三层是 evidence graph。它把 claim、risk、control objective、control activity、test、evidence、owner 和 cadence 连接起来。这样 PRD 中的 AI 边界、ADR 中的架构选择、eval contract 中的测试阈值、control matrix 中的控制活动、release gate 中的 go/no-go 决策和 audit binder 中的材料是一条链。监管问询时, 团队不是临时找材料, 而是直接从问题追到 claim、control 和 evidence。

10.3 CRO 版本

我会把这个问题表述为“管理层如何知道 AI residual risk 在风险偏好内”。控制库负责定义最低控制期望; assurance case 负责说明在某个 use case、版本和范围内哪些 claim 被证据支持; evidence graph 负责证明控制设计和运行结果。CRO 需要看到的不是模型准确率单点指标, 而是 material AI inventory、risk tier、control coverage、critical failure trend、policy exceptions、incidents、accepted residual risks、owner accountability 和 stop rules。这样 AI 风险可以进入常规风险治理节奏, 而不是作为技术项目单独运行。

10.4 Chief Architect 版本

我会从架构可追溯性回答。AI 系统的 control library 必须嵌入架构边界: 数据边界、权限边界、模型边界、RAG source 边界、tool execution 边界、日志边界和恢复边界。每个 ADR 都要说明它影响哪些 control objective; 每次 prompt、model、index、tool 或 policy source 变更都要触发受影响 eval 和 evidence 的刷新。Chief Architect 关注的是系统在持续变化下仍能证明控制有效, 所以 evidence graph 应该成为 architecture governance 的一部分, 支持 release gate、change impact analysis、incident review 和监管材料生成。