AI Risk Appetite / Policy Product Management Playbook
这些来源作为术语和治理锚点。本文只把它们转译成产品管理语言, 不把任何框架当作单独充分的合规结论。
AI Risk Appetite / Policy Product Management Playbook
定位: 面向 AI Product Lead / Strategy PM / AI BA / AI Architect / Risk Partner 的产品管理手册。重点不是讲风险管理基础, 而是把 board / executive risk appetite 转成 AI 产品约束、risk-tiered controls、policy-as-product 生命周期、运行时 guardrails、监控指标、例外处理、证据包和产品路线图。
重要说明: 本文不是法律、合规、审计或监管意见。正式项目必须由 legal / compliance / risk / model risk / privacy / security 结合司法辖区、机构类型、客户类型、业务用途、内部政策和监管关系确认。本文的目标是训练金融零售 AI 产品管理能力和面试表达。
1. Source Anchors
这些来源作为术语和治理锚点。本文只把它们转译成产品管理语言, 不把任何框架当作单独充分的合规结论。
| Anchor | Official link | 本 playbook 使用方式 |
|---|---|---|
| NIST AI Risk Management Framework | https://www.nist.gov/itl/ai-risk-management-framework | 用 Govern / Map / Measure / Manage 组织 AI 风险识别、度量、管理和治理证据。NIST 页面显示 AI RMF 1.0 正在修订, 正式项目需按访问日期复核。 |
| ISO/IEC 42001:2023 | https://www.iso.org/standard/81230.html | 用 AI management system 语言把 policy、objective、risk treatment、operation、performance evaluation 和 continual improvement 连接成可运营体系。 |
| COSO Enterprise Risk Management | https://www.coso.org/guidance-on-erm | 用 ERM 与 strategy / performance 的关系理解 risk appetite: 风险偏好不是合规文件, 而是战略取舍、绩效边界和管理层决策语言。 |
2. One-Sentence Positioning
AI Risk Appetite / Policy Product Management 是把董事会和高管层的风险偏好转译成 AI 产品可以执行的约束系统: 哪些场景能做、做到什么自动化程度、用什么数据和工具、需要什么人工监督、达到哪些指标才能上线、什么情况下暂停、例外如何审批、证据如何留存、路线图如何按风险容量排序。
一句英文表达:
Risk appetite becomes product reality only when it is translated into guardrails, tiers, controls, metrics, exceptions, monitoring, and roadmap decisions.
中文表达:
风险偏好只有进入产品边界、分层门禁、运行时控制、指标阈值、例外机制、监控留证和路线图取舍, 才真正影响 AI 产品。
3. Risk Appetite 如何转成 AI 产品约束
3.1 从董事会语言到产品语言
董事会和高管层通常不会说“这个 prompt 能不能调用账户冻结工具”。他们会说:
- 我们愿意为效率提升承担多大的客户体验风险。
- 我们在信贷、财富、AML、欺诈、投诉等场景的自动化边界在哪里。
- 我们对客户权益、监管信任、声誉、模型错误、数据泄露和操作风险的容忍度是多少。
- 我们希望 AI 支持增长, 但不能突破公平性、透明度、人工复核和可审计要求。
- 我们愿意在哪些低风险场景快速试验, 哪些场景必须先有控制框架再扩展。
AI PM 的工作是把这些高层表达转成产品可执行对象:
| Risk appetite language | Product constraint | 具体产品化表达 |
|---|---|---|
| 对客户权益影响零容忍 | Automation boundary | AI 不直接做最终拒贷、适当性判断、账户关闭、可疑活动结论或客户赔付拒绝; 只能建议、摘要、准备材料或触发人工复核。 |
| 对敏感数据外泄低容忍 | Data boundary | PII、账户、收入、医疗、未成年人、身份文件等数据进入数据分级; 外部模型、日志、RAG index、训练集和导出能力都有 allowlist。 |
| 对监管解释不可接受黑箱 | Explainability constraint | 高风险输出必须绑定政策条款、数据来源、reason code、模型/规则版本、人工批准记录和客户可理解解释。 |
| 对操作效率有明确目标 | SLO / value metric | AI 方案必须在人工复核保留的前提下降低处理时长、减少返工、提升 first-contact resolution 或增加检测覆盖。 |
| 对模型幻觉低容忍 | Quality gate | 客户可见答案、政策解释和财富/信贷类建议必须经过 groundedness、citation accuracy、refusal accuracy 和 red-team 门禁。 |
| 对自主 agent 行为谨慎 | Tool permission | 默认 read-only; 写操作、资金动作、账户状态变更、外部通知、case closure 需要工具网关、审批和幂等控制。 |
| 对创新有风险容量 | Tiered experimentation | 低风险内部 copilot 可快速试点; 客户影响或受监管场景走更高门禁; critical 场景先做 shadow mode 或 human-in-the-loop。 |
3.2 Risk Appetite Translation Loop
推荐把 risk appetite 转译做成一个固定产品管理循环:
Board / executive appetite
-> business domain appetite statement
-> AI use case tiering
-> product guardrails
-> control catalog
-> release gates
-> runtime enforcement
-> monitoring and KRIs
-> exceptions and residual risk acceptance
-> evidence binder
-> roadmap trade-offs
这个循环的关键不是一次性写文档, 而是形成可迭代机制:
| Loop step | Product management question | 产出 |
|---|---|---|
| Appetite statement | 组织愿意为哪些业务结果承担哪些 AI 风险, 不愿意承担哪些风险 | AI risk appetite statement |
| Domain translation | 在信贷、财富、客服、AML、欺诈、运营中边界是否不同 | Domain appetite addendum |
| Use case tiering | 这个 use case 的客户、监管、资金、数据和自动化影响是什么 | Risk tier decision |
| Product guardrails | 产品界面、workflow、API、tool、数据和披露如何限制行为 | Guardrail spec |
| Control catalog | 每个 tier 默认需要哪些控制, 哪些控制可被替代或增强 | Control matrix |
| Release gate | 上线前必须通过哪些 eval、security、privacy、risk 和 ops 检查 | Go-live checklist |
| Runtime enforcement | 控制在运行时由谁执行: 产品、policy engine、tool gateway、workflow 还是人工 | PDP / PEP design |
| Monitoring | 哪些指标说明风险偏好被接近、突破或失效 | KRI / SLO dashboard |
| Exception | 什么时候允许突破默认规则, 谁批准, 多久复核 | Exception memo |
| Evidence | 如何向 risk、audit、regulator、executive 证明控制真实运行 | Evidence binder |
| Roadmap | 风险容量不足时先做什么、延后什么、停止什么 | Risk-adjusted roadmap |
3.3 AI PM 的关键转译能力
对已具备 CBAP 背景的人, 重点不是再学需求基础, 而是把需求对象升级为“策略产品对象”:
| 传统需求对象 | AI policy product 对象 | 转译重点 |
|---|---|---|
| Business requirement | Risk appetite constraint | 需求不是只表达想做什么, 还要表达不能做什么、何时停、谁能批准例外。 |
| Business rule | Versioned policy control | 规则要有 owner、版本、测试、发布、回滚、监控和证据。 |
| Process step | Control point | 流程节点要说明是 advice、decision、approval、execution 还是 evidence capture。 |
| Acceptance criteria | Release gate | 验收标准要包括质量、风险、安全、隐私、操作可用性和可审计性。 |
| Exception path | Risk exception product flow | 例外不是邮件审批, 而是可追踪的产品流程和 residual risk 记录。 |
| Report | Risk appetite dashboard | 报告不是展示 KPI, 而是显示 appetite usage、breach、near miss、stop rule 和 roadmap 决策。 |
4. Risk-Tiered Product Management
4.1 分层原则
AI risk tier 不是按模型能力高低划分, 而是按业务后果划分。一个小模型如果决定信贷或账户处置, 风险可能高于一个大模型做内部文案草稿。
建议用六个维度定级:
| Dimension | 关键问题 |
|---|---|
| Customer impact | 是否影响客户权益、价格、授信、交易、账户状态、投诉、赔付、适当性或客户可见解释 |
| Automation level | AI 是 search / summarize / recommend / decide / execute 哪一级 |
| Data sensitivity | 是否使用 PII、账户、交易、收入、身份文件、特殊类别数据、员工数据或第三方数据 |
| Regulatory relevance | 是否触发信贷、公平借贷、AML/BSA、KYC、财富建议、隐私、投诉、消费者保护、记录留存等要求 |
| Reversibility | 错误是否可快速纠正, 是否造成资金、信用、监管记录、声誉或客户信任损害 |
| Scale and velocity | 影响是单个员工、单个队列、全渠道客户还是批量自动化 |
4.2 Risk Tier Matrix
| Tier | 典型 AI 产品形态 | 默认控件 | 上线门禁 | 证据要求 |
|---|---|---|---|---|
| Low | 内部知识检索、文案草稿、会议摘要、非客户决策辅助 | 数据分类、基础日志、用户提示、approved tool list、轻量 eval | Product owner approval; security / data allowlist; sample QA | Use case card、数据边界、prompt / model version、抽样结果、用户反馈 |
| Medium | 员工 copilot、客服建议草稿、运营分类建议、政策问答辅助 | RAG citation、人工确认、policy refusal、role-based access、质量监控、变更记录 | Product + Risk checkpoint; eval threshold; ops readiness; monitoring dashboard | Risk tier rationale、eval report、control mapping、human review policy、incident path |
| High | 客户可见 AI、信贷/财富/投诉/欺诈/AML 决策支持、可影响客户行动的建议 | HITL、reason code、tool gateway、policy engine、red-team、independent challenge、模型/数据/工具版本控制 | Cross-functional release gate; model risk / compliance / privacy review; pilot and rollback plan | Full evidence binder、validation summary、policy-to-product matrix、monitoring plan、exception log、management attestation |
| Critical | 可能造成重大客户损害、监管承诺、资金或账户动作、自动化 adverse action、AML/欺诈结论、规模化 agent 执行 | 默认禁止自主执行; shadow mode; dual control; executive approval; kill switch; production watch; strict change freeze | Executive risk acceptance; board-level visibility when material; staged rollout; stop rules tested | Executive risk memo、residual risk acceptance、control test evidence、stop-rule drill、audit-ready trace、post-launch review |
4.3 Tier 不是标签, 是产品工作量预算
同一个功能从 Low 到 Critical, 产品工作量会明显变化:
| Product work | Low | Medium | High | Critical |
|---|---|---|---|---|
| Scope | 单一内部任务 | 明确 workflow 辅助 | 端到端控制点 | 业务/风险共同定义允许范围 |
| Discovery | 用户访谈 + 样例 | 工作流和失败模式 | 客户影响和监管后果 | 高管风险场景和压力测试 |
| Requirements | 功能验收 | 质量 + 人工确认 | 控制 + 证据 + rollback | 禁止边界 + residual risk |
| Design | 普通 UX | 引用、拒答、确认 | 披露、申诉、人工复核 | 强制人工、双控、暂停机制 |
| Architecture | 模型接入 | RAG / workflow logging | policy engine / tool gateway | deterministic controls before AI |
| Testing | 抽样 QA | eval set | independent challenge + red-team | scenario drill + executive go/no-go |
| Launch | 小范围试点 | 运营试点 | 分阶段上线 | shadow mode / limited production |
| Monitoring | usage / feedback | quality / override | KRI / breach / incident | real-time alerts / stop rules |
4.4 Risk Tier Decision Record
每个 AI use case 应保存一条 risk tier decision record:
| Field | 内容 |
|---|---|
| Use case name | 清晰命名, 如 Branch Banker Wealth Guidance Copilot |
| Business owner | 对业务结果负责的人 |
| Product owner | 对产品范围、路线图和交付证据负责的人 |
| Risk owner | 对风险分类、控制期望和 residual risk 接受路径负责的人 |
| System boundary | 模型、RAG、工具、workflow、人、渠道和外部依赖 |
| Customer impact | 影响客户权益、决策、资金、体验或解释的方式 |
| Automation level | search / summarize / recommend / decide / execute |
| Data sensitivity | 使用、存储、检索、外发、日志化的数据类型 |
| Regulatory relevance | 相关监管域和内部政策域 |
| Tier rationale | 为什么是 Low / Medium / High / Critical |
| Required controls | 该 tier 的默认控制和增强控制 |
| Release gate | 上线前必须满足的条件 |
| Review cadence | 日常监控、季度复核、重大变更触发复核 |
5. Policy Product Lifecycle
5.1 生命周期主线
AI policy 不能只放在 PDF、Wiki 或 prompt 中。它要被产品化为可测试、可版本化、可运行、可监控、可例外、可审计的控制资产。
policy intent
-> rule / control
-> product requirement
-> runtime guardrail
-> monitoring
-> exception
-> review
-> roadmap adjustment
5.2 Policy Intent -> Rule / Control
| Policy intent | Rule / control | 产品问题 |
|---|---|---|
| AI 不应提供未经授权的个性化投资建议 | Advice boundary classifier + disclosure + licensed specialist handoff | 如何识别 advice intent, 如何拒答, 如何升级, 如何记录 |
| AI 不应使用未批准知识源解释信贷政策 | RAG source allowlist + effective-date filter + citation requirement | 哪些文档可检索, 版本如何生效, 引用缺失时怎么处理 |
| AI 不应自主执行高风险账户操作 | Tool permission + HITL + dual control | 哪些 tool 是 read-only, 哪些写操作需要审批 |
| AI 输出必须可复盘 | Trace logging + evidence retention | 需要记录哪些输入、版本、规则、输出和人工动作 |
| AI 不能超过模型验证范围使用 | Use-case binding + route control | 如何阻止同一个 assistant 被复制到新业务场景 |
5.3 Rule / Control -> Product Requirement
风险控制要写进产品需求, 而不是上线前补一页合规说明:
| Requirement type | 示例 |
|---|---|
| Functional | 当客户询问“我应该买哪只基金”时, 系统识别为 personalized advice intent, 返回边界说明并引导至持牌顾问流程。 |
| Non-functional | 高风险客户可见回答的 trace retention 不低于内部记录留存要求, 并能按 case id / customer id / model version 检索。 |
| UX | 客服 agent 看到 AI 建议时必须有 accept / edit / reject / escalate 动作, 不允许一键自动发送高风险答复。 |
| Data | RAG 只检索已批准、有效期内、权限匹配的政策文档; 过期文档不进入候选集。 |
| Tooling | Agent 对 CRM 的写入必须通过 tool gateway, 并带有 user identity、case id、reason、approval token。 |
| Evidence | 每次 high-tier release 生成 release evidence pack, 包括 eval、red-team、control mapping、risk sign-off 和 rollback plan。 |
5.4 Product Requirement -> Runtime Guardrail
运行时 guardrail 要避免只靠 prompt:
| Guardrail | 推荐落点 | 说明 |
|---|---|---|
| Identity and entitlement | IAM / ReBAC / access service | 决定用户能看哪些客户、账户、文档和工具。 |
| Data filtering | Retriever / feature store / data gateway | 在数据进入模型前做权限、有效期、敏感性和地域过滤。 |
| Policy decision | PDP / rules engine / DMN / OPA / Cedar | 对能否回答、能否调用工具、是否需要审批做确定性判断。 |
| Prompt instruction | Model orchestration | 表达任务、风格、输出格式和安全边界, 但不作为唯一控制。 |
| Tool enforcement | Tool gateway / PEP | 对副作用动作做 allow / deny / approval / rate limit / idempotency。 |
| Human oversight | Workflow / case management | 让人工确认、修改、升级、驳回、批准和留证成为产品流程。 |
| Disclosure | Channel UI / message composer | 对客户或员工显示 AI 使用、限制、引用和下一步路径。 |
| Monitoring | Observability / RiskOps dashboard | 持续观察质量、越界、覆盖、人工覆盖率、异常和阈值突破。 |
5.5 Monitoring -> Exception -> Review
Policy lifecycle 的成熟度体现在例外和复核:
| Signal | 可能动作 |
|---|---|
| Breach threshold 被触发 | 暂停功能、降级到人工、限制渠道、关闭工具、升级 incident |
| Near miss 增多 | 增加抽样、收紧阈值、更新 eval set、调整 prompt / RAG / policy |
| 业务价值低于预期 | 缩小范围、改变 workflow insertion point、停止低价值能力 |
| 误拦截过高 | 调整 policy classifier、优化 UX、增加专家复核样本 |
| 人工 override 过高 | 分析模型质量、政策不清、培训不足或流程设计问题 |
| 新监管/内部政策变化 | 触发 policy review、control mapping、release gate 更新 |
| 模型或 vendor 版本变化 | 执行 regression eval、impact assessment、approval 或 rollback |
6. Product Guardrails
6.1 Guardrail Catalog
| Guardrail | 产品定义 | 典型控件 | 证据 |
|---|---|---|---|
| Advice boundary | AI 能提供一般信息、教育、流程说明, 还是可以给个性化建议 | Intent classifier、refusal template、specialist handoff、approved language | Advice boundary test、refusal accuracy、handoff log |
| Automation boundary | AI 是辅助、建议、决策还是执行 | Workflow state control、HITL、dual approval、autonomy cap | Automation level record、approval trace、override log |
| Data boundary | 哪些数据可进入 prompt、RAG、模型调用、日志、训练和导出 | Data classification、DLP、retrieval filter、vendor data restriction | Data inventory、access decision log、DLP alerts |
| Tool permission | AI agent 可以读、写、提交、通知、冻结、关闭或转账到什么程度 | Tool allowlist、PDP/PEP、rate limit、idempotency、approval token | Tool call trace、deny log、approval evidence |
| Human oversight | 哪些步骤必须人工确认、哪些需要专家、主管或 second line | Queue routing、approval workflow、sampling review、dual control | Review record、edit distance、approval SLA |
| Disclosure | 员工或客户是否知道 AI 参与、AI 的限制和下一步路径 | UI label、customer copy、citation、confidence display、handoff message | Disclosure copy version、channel screenshots、A/B outcome |
| Appeal / recourse | 客户或员工如何质疑、申诉、纠错或要求人工处理 | Escalation button、case reason、appeal queue、complaint linkage | Appeal log、resolution time、root cause |
| Explainability | 输出如何绑定事实、政策、规则和 reason code | Citation、rule id、reason service、decision trace | Explanation sample、reason mapping、audit trace |
| Change control | prompt、policy、model、tool、RAG index 如何变更 | Registry、approval workflow、regression eval、rollback plan | Change log、eval delta、release approval |
| Kill switch | 风险突破时如何快速暂停或降级 | Feature flag、route-to-human、tool disable、traffic cap | Drill record、incident timeline、recovery evidence |
6.2 Advice Boundary
金融零售 AI 最容易出问题的边界之一是“信息解释”和“个性化建议”的混淆。
| Allowed pattern | Restricted pattern | Product guardrail |
|---|---|---|
| 解释产品条款、费用、流程和一般风险 | 推荐具体投资、保险、贷款额度、债务处理方案 | Intent detection + approved educational content + licensed advisor handoff |
| 根据客户输入总结问题供人工处理 | 直接告诉客户“你应该申请/购买/赎回/拒绝” | Draft-only mode + human approval |
| 提供一般预算、金融教育和术语解释 | 对客户个人资产、收入、风险偏好做个性化建议 | Advice boundary banner + refusal + handoff |
| 帮员工查找政策条款 | 替员工做最终 suitability 或 adverse action 判断 | Citation required + decision remains with authorized role |
PM 要把 advice boundary 写进:
- Intent taxonomy: 哪些客户话术进入 advice intent。
- Response policy: 允许回答、拒答、转人工、提供教育材料的规则。
- UX states: answer、cannot answer、needs specialist、needs licensed advisor。
- Monitoring: 越界回答率、转人工率、误拒答率、客户投诉率。
- Evidence: 测试集、红队样本、approved copy、review record。
6.3 Automation Boundary
AI 自动化边界建议使用五级:
| Level | 名称 | 说明 | 金融零售默认建议 |
|---|---|---|---|
| L0 | No AI | 不使用 AI | 法规或内部政策禁止的最终判断 |
| L1 | Retrieve / summarize | 检索、摘要、整理证据 | 低中风险知识辅助 |
| L2 | Recommend / draft | 给员工建议或草稿 | 客服、运营、投诉、AML case prep |
| L3 | Decide with human confirmation | AI 做初判, 人工确认后生效 | 部分运营分流或低金额可逆动作 |
| L4 | Autonomous execute | AI 自主执行 | 只适合低风险、可逆、可监控、授权明确的动作 |
高风险金融零售场景默认不应从 L1 直接跳到 L4。PM 应在 roadmap 中清楚写出:
- 当前允许的最高自动化等级。
- 进入下一等级需要的质量、控制、运营和证据条件。
- 哪些边界永远不进入自主执行。
- 哪些动作只能在 shadow mode 中评估, 不影响客户。
6.4 Data Boundary
数据边界不是一句“遵守隐私政策”。需要把数据生命周期产品化:
| Boundary point | PM 要问的问题 | 控制 |
|---|---|---|
| Collection | AI 功能是否真的需要该数据字段 | Data minimization、purpose binding |
| Retrieval | RAG 是否只拿到用户有权访问且有效的文档 | Entitlement filter、effective date、source allowlist |
| Prompt | 哪些 PII / account data 可以进入模型上下文 | Redaction、masking、field-level policy |
| Vendor | 外部模型是否允许处理该数据, 是否保留或训练 | Vendor allowlist、contractual configuration、gateway policy |
| Logging | 日志是否记录敏感信息, 谁能查看 | Secure trace store、retention、access control |
| Evaluation | eval set 是否含真实客户数据 | Synthetic / anonymized data、controlled access |
| Export | 员工能否导出 AI 输出或引用内容 | DLP、watermark、download controls |
| Training | 线上反馈是否可用于微调或训练 | Consent / approval path、data lineage |
6.5 Tool Permission
Agent 产品的风险通常从“回答错误”升级为“行动错误”。工具权限要按副作用分层:
| Tool class | 示例 | 默认权限 |
|---|---|---|
| Read public / approved knowledge | 产品 FAQ、公开利率说明、内部政策库 | Low / Medium 可允许, 需 citation 和 source filter |
| Read customer data | 账户余额、交易、KYC、投诉记录 | 需要身份、角色、purpose、case relationship |
| Draft internal update | CRM note 草稿、case summary、email draft | 员工确认后写入 |
| Write non-financial state | 更新 task status、添加标签、创建工单 | Medium 以上需要 approval 或 sampled review |
| Customer communication | 发送短信、邮件、chat reply | 客户影响场景需要人工确认和 approved language |
| Financial / account action | 冻结、解冻、退款、调额、关闭账户、转账 | Critical; 默认禁止自主执行, 双控和强审计 |
| Regulatory / risk conclusion | SAR recommendation、fraud determination、adverse action reason | AI 只能准备证据和草稿, 最终由授权人员确认 |
6.6 Human Oversight
Human oversight 不是“旁边有个人”。它必须被设计成有权、有信息、有时间、有责任的产品流程:
| Oversight failure | 产品修正 |
|---|---|
| 人工只看到 AI 答案, 看不到证据 | 展示引用、规则、关键输入、置信区间和可疑点 |
| 一线人员被 KPI 推动盲目接受 AI | 设计 reject / edit / escalate, 并监控 blind acceptance |
| 审批人没有权限改变结果 | 审批人必须能修改、拒绝、暂停和升级 |
| 复核样本过少 | 按 tier、风险信号、队列、用户和模型版本做抽样 |
| 人工复核没有留证 | 记录 reviewer、动作、理由、时间、输入和版本 |
6.7 Disclosure and Appeal
客户可见 AI 场景需要把披露和申诉变成产品能力:
| Capability | 产品要求 |
|---|---|
| AI disclosure | 客户知道自己正在与 AI 或 AI-assisted 流程互动, 文案清楚但不制造恐慌。 |
| Limitation statement | 对建议边界、信息来源、非最终决策、人工帮助路径做清晰说明。 |
| Human handoff | 客户能要求人工处理, 且 handoff 带上下文, 不让客户重复叙述。 |
| Appeal / correction | 客户能质疑错误信息、补充材料、要求复查或纠正记录。 |
| Complaint linkage | 申诉、投诉、错误反馈进入同一套 case / root cause / risk monitoring。 |
7. Metrics
7.1 指标分层
AI risk appetite 指标要同时覆盖业务价值、风险容量、质量、运营、控制和客户结果。不要只看模型准确率。
Risk Appetite Indicators
-> KRIs
-> SLOs
-> Breach thresholds
-> Stop rules
-> Roadmap decisions
| Metric layer | 作用 | 示例 |
|---|---|---|
| Risk Appetite Indicator | 显示组织正在消耗多少风险容量 | 高风险 AI 覆盖客户数、自动化动作占比、客户可见 AI 占比、例外数量 |
| KRI | 显示风险是否升高 | 越界建议率、policy violation、hallucination、工具拒绝、投诉、near miss |
| SLO | 显示服务和控制是否稳定 | grounded answer rate、citation accuracy、human review SLA、trace completeness、rollback time |
| Breach threshold | 明确何时视为突破风险偏好 | 某类越界回答超过阈值、critical tool unauthorized attempt、trace 缺失 |
| Stop rule | 明确何时暂停、降级或关闭 | 触发 kill switch、route-to-human、traffic cap、tool disable |
7.2 Risk Appetite Indicators
| Indicator | 产品含义 | 决策用途 |
|---|---|---|
| High-tier AI exposure | High / Critical 功能覆盖的客户、交易、case 或员工数量 | 判断是否需要升级 governance、审计和高管报告 |
| Autonomous action ratio | AI 自主执行动作占全部动作比例 | 判断自动化是否超出批准边界 |
| Sensitive data touchpoints | 使用敏感数据的 prompt、RAG、tool、日志和 eval 数量 | 判断数据边界和隐私控制是否足够 |
| Exception load | 活跃例外数量、延期次数、超期例外 | 判断默认政策是否不合理或团队在绕开控制 |
| Residual risk accepted | 已批准 residual risk 的数量和严重度 | 判断风险容量是否被消耗 |
| Customer-facing AI complaints | 客户投诉、申诉、纠错与 AI 相关比例 | 判断客户信任和披露是否有效 |
| Model / policy change velocity | prompt、model、index、tool、policy 变更频率 | 判断变更门禁和 regression eval 是否匹配速度 |
7.3 KRIs
| KRI | 适用场景 | 解释 |
|---|---|---|
| Advice boundary breach rate | 财富、信贷、保险、债务建议、客户服务 | AI 输出越过一般信息边界进入个性化建议的比例 |
| Unsupported answer rate | RAG、政策问答、客服 | 回答缺少有效引用或引用不支持结论的比例 |
| Wrong refusal / missed refusal | 客户交互、员工 copilot | 应该回答却拒答, 或应该拒答却回答 |
| Tool policy deny rate | Agent / workflow automation | 工具调用被 policy engine 拒绝的比例和原因 |
| Unauthorized tool attempt | Agent / data access | AI 或用户尝试调用未授权工具或资源 |
| Human override rate | 决策支持 | 人工修改、驳回或升级 AI 建议的比例 |
| Blind acceptance rate | 员工 copilot | 员工未编辑直接接受 AI 输出的比例, 需要结合质量和场景判断 |
| Complaint / appeal rate | 客户可见 AI | 客户对 AI 相关回答、决策或流程申诉的比例 |
| Trace completeness | 高风险场景 | 能否复盘输入、输出、版本、规则、审批和工具调用 |
| Drift / policy staleness | RAG / policy-as-product | 知识源过期、政策版本混用或模型行为变化 |
7.4 SLO
| SLO | 示例目标表达 | 说明 |
|---|---|---|
| Citation accuracy SLO | 高风险政策问答样本中, 引用支持结论的比例达到内部 release threshold | 阈值由风险和业务共同定义, 不在本文给绝对数值。 |
| Human review SLA | High-tier AI 建议在规定工作时间内完成复核 | 避免 AI 带来队列积压或假自动化。 |
| Trace completeness SLO | High / Critical 场景的 trace 字段完整率达到 release gate | 缺 trace 等于无法审计, 不能只看回答质量。 |
| Policy decision latency SLO | PDP / PEP 延迟满足渠道体验要求 | 控制不能慢到让一线绕开。 |
| Rollback SLO | 高风险变更可在规定时间内回滚到批准版本 | 路线图要包含回滚演练。 |
| Escalation reliability SLO | 需要人工介入的 case 能正确进入队列并保留上下文 | 人工监督必须可运营。 |
7.5 Breach Thresholds and Stop Rules
| Breach type | Stop rule | 产品动作 |
|---|---|---|
| Critical unauthorized tool execution | Immediate stop | 关闭相关工具、冻结 agent 写权限、启动 incident、通知 risk / security |
| 客户可见 advice breach 超阈值 | Route-to-human | 暂停客户自助回答, 改为人工或 licensed specialist handoff |
| Trace completeness 低于门禁 | Release block | 阻止上线或回滚版本, 直到日志和证据恢复 |
| RAG 引用错误集中出现 | Knowledge freeze | 冻结 index 更新, 回滚知识库版本, 执行根因分析 |
| Human override 异常升高 | Traffic cap | 限制流量、增加抽样、重新训练员工或调整 AI 输出 |
| 投诉或申诉集中在特定队列 | Product review | 暂停扩展, 做 journey / copy / policy / training 修正 |
| Model vendor 行为变化 | Regression gate | 回到上一批准模型版本或进入 shadow evaluation |
8. Financial Retail Case
8.1 信贷: Credit Policy Copilot
| Product decision | Risk appetite translation |
|---|---|
| Positioning | AI 帮信贷人员查政策、整理材料、生成问题清单和解释草稿, 不做最终授信、拒绝或 adverse action。 |
| Tier | High; 如果进入自动拒绝、调额或客户可见拒绝原因, 升为 Critical。 |
| Guardrails | 只检索有效期内政策; reason code 来自规则/决策服务; AI 草稿必须人工确认; 客户可见解释使用 approved language。 |
| Metrics | Unsupported policy answer、reason mismatch、manual override、adverse action complaint、trace completeness。 |
| Evidence binder | 风险定级、policy source allowlist、eval set、信贷专家 review、fairness challenge、release approval、post-launch review。 |
| Roadmap implication | 先做 L1/L2 policy copilot, 再做 shadow recommendation, 只有证据充分时才扩大到 low-risk prefill。 |
8.2 财富建议: Wealth Guidance Assistant
| Product decision | Risk appetite translation |
|---|---|
| Positioning | AI 提供教育、产品信息、会议准备和顾问草稿; 不直接给客户个性化买卖建议。 |
| Tier | High for advisor-facing; Critical if customer-facing personalized advice or execution is contemplated。 |
| Guardrails | Advice intent classifier、licensed advisor handoff、disclosure、suitability workflow separation、approved educational content。 |
| Metrics | Advice boundary breach、handoff success、客户误解/投诉、顾问 edit rate、citation accuracy。 |
| Evidence binder | Advice boundary policy、test suite、approved copy、advisor workflow record、training material、monitoring dashboard。 |
| Roadmap implication | 路线图从 advisor productivity 开始, 不是从 autonomous robo-advice 开始; 客户自助能力先限定为教育和流程说明。 |
8.3 客服: Customer Service Copilot
| Product decision | Risk appetite translation |
|---|---|
| Positioning | AI 帮客服总结客户问题、检索政策、起草回复、推荐下一步; 高风险回复必须人工确认。 |
| Tier | Medium for internal draft; High for customer-visible auto-reply or complaint handling; Critical for account actions。 |
| Guardrails | Sensitive intent routing、complaint escalation、approved language、manual send、PII redaction、case trace。 |
| Metrics | First-contact resolution、wrong answer、complaint escalation miss、manual edit distance、customer appeal、AI-related CSAT movement。 |
| Evidence binder | Conversation samples、policy citation QA、human review log、complaint linkage、control mapping、rollback plan。 |
| Roadmap implication | 先提升 agent assist 和 case summarization, 再扩展到低风险自助问答; 涉及费用、争议、关闭账户时保持人工。 |
8.4 AML: Case Investigation Assistant
| Product decision | Risk appetite translation |
|---|---|
| Positioning | AI 帮 AML 分析师整理交易、提取实体关系、总结证据、起草 narrative; 不做最终 suspicious activity conclusion。 |
| Tier | High; 如果 AI 自动做 SAR / no-SAR 结论或提交监管报告, 属 Critical 且默认不允许自主执行。 |
| Guardrails | Analyst-in-control、source trace、case evidence linkage、禁止自动提交、tool read restrictions、audit logging。 |
| Metrics | Analyst override、missed escalation、unsupported narrative、case aging、quality review findings、trace completeness。 |
| Evidence binder | Typology mapping、case sample eval、analyst QA、model / prompt / tool version、review notes、issue remediation。 |
| Roadmap implication | AI 优先做 evidence preparation 和 workload triage; SAR 决策权、质量复核和提交权限保留给授权人员。 |
8.5 横向落地模式
金融零售 AI 风险偏好落地可以用同一张横向图:
Domain risk appetite
-> approved AI use cases
-> automation boundary
-> data and tool boundary
-> human oversight design
-> release gate
-> monitoring dashboard
-> exception and issue management
-> roadmap funding and sequencing
| Domain | 推荐先做 | 谨慎推进 | 默认高管关注 |
|---|---|---|---|
| Credit | 政策检索、材料完整性、员工草稿 | 自动 eligibility / reason code | 自动拒贷、调额、adverse action |
| Wealth | 顾问准备、教育内容、会议总结 | 客户自助教育问答 | 个性化买卖建议和自动交易 |
| Customer service | 员工 copilot、摘要、低风险 FAQ | 自动回复费用、争议、投诉 | 自动关闭账户、拒绝赔付、投诉裁定 |
| AML / Fraud | case summarization、证据关联、优先级建议 | 自动分流和低风险 closure | SAR / no-SAR、账户冻结、欺诈最终结论 |
9. Artifact Templates
9.1 AI Risk Appetite Statement
# AI Risk Appetite Statement - [Domain / Product]
## Strategic Intent
- Business outcome: [要达成的业务结果, 如降低客服处理时长、提高 AML case coverage、提升信贷政策一致性]
- AI role: [retrieve / summarize / recommend / decide / execute]
- Approved channels: [employee desktop / branch / call center / mobile app / batch operation]
## Appetite Boundaries
- Customer impact appetite: [可接受的客户影响范围和明确禁止的影响]
- Automation appetite: [当前允许的最高自动化等级]
- Data appetite: [允许使用、禁止使用、需要额外审批的数据类型]
- Tool appetite: [允许 read-only、draft、write、external communication、financial action 的边界]
- Advice / decision appetite: [允许一般信息、员工建议、客户建议、最终决策的边界]
## Required Guardrails
- Human oversight: [谁复核、何时复核、能否修改或拒绝]
- Disclosure: [员工或客户看到的 AI 使用和限制说明]
- Monitoring: [RAI / KRI / SLO]
- Stop rules: [触发暂停、降级、回滚、关工具的条件]
- Evidence: [上线前和上线后证据包清单]
## Residual Risk and Review
- Residual risk accepted by: [角色, 不是个人姓名]
- Review cadence: [月度 / 季度 / 重大变更触发]
- Expiry / renewal: [例外或风险接受的复核日期]
- Roadmap implication: [哪些能力可以做、哪些延后、哪些不做]
9.2 Policy-to-Product Matrix
| Policy intent | Product requirement | Runtime control | Metric | Evidence |
|---|---|---|---|---|
| AI 不提供个性化投资建议 | 识别 advice intent 并转 licensed advisor | Intent classifier + refusal + handoff | Advice breach rate、handoff success | Test cases、approved copy、handoff log |
| 高风险回答必须有有效来源 | 客户/员工看到政策引用和生效日期 | RAG source allowlist + citation checker | Citation accuracy、unsupported answer | Eval report、retrieval trace |
| Agent 不自主执行账户动作 | 写操作需 approval token | Tool gateway + PEP + dual control | Unauthorized attempt、approval SLA | Tool trace、approval record |
| 敏感数据不进入未批准模型 | 模型调用前做数据分类和 redaction | Model gateway + DLP | DLP alert、blocked request | Gateway log、data inventory |
| 变更必须可回滚 | prompt/model/index/tool 有版本和 regression eval | Registry + release gate + feature flag | Rollback time、eval delta | Change log、release approval |
9.3 Exception Memo
# AI Policy Exception Memo - [Use Case / Control]
## Exception Summary
- Requested exception: [要偏离的默认政策或控制]
- Product / use case: [功能名称和业务域]
- Risk tier: [Low / Medium / High / Critical]
- Business reason: [为什么默认控制无法满足业务目标]
- Duration: [固定期限或触发条件, 不写无限期]
## Risk Analysis
- Appetite boundary affected: [customer impact / automation / data / tool / advice / evidence]
- Potential harm: [客户、运营、监管、声誉、财务、数据]
- Compensating controls: [替代控制, 如更高人工抽样、流量限制、只读模式、额外披露]
- Residual risk: [剩余风险如何被 owner 接受和监控]
## Approval and Conditions
- Approver roles: [business owner / risk owner / data owner / security / executive]
- Conditions: [流量上限、适用队列、额外监控、到期复核]
- Stop rules: [触发立即终止例外的条件]
- Evidence required: [运行日志、抽样复核、KRI、incident report]
## Review
- Review date: [明确日期]
- Renewal criteria: [续期必须满足的证据]
- Exit path: [如何回到标准控制或永久停止能力]
9.4 Risk Review Agenda
# AI Product Risk Review Agenda - [Date]
## 1. Appetite Usage
- High / Critical use cases live or in pilot
- Customer / employee / case exposure
- Active exceptions and residual risk accepted
## 2. New or Changed Use Cases
- New use case tiering decisions
- Domain appetite conflicts
- Required controls and release gates
## 3. Control Performance
- KRIs crossing warning threshold
- SLO misses
- Human override and blind acceptance trends
- Tool deny / unauthorized attempt trends
## 4. Incidents, Near Misses, and Complaints
- Incident timeline and root cause
- Customer complaints or appeals linked to AI
- Remediation owner and due date
## 5. Policy and Change Review
- Prompt / model / RAG / policy / tool changes
- Regression eval results
- Evidence binder completeness
## 6. Roadmap Decisions
- Features approved to scale
- Features capped, redesigned, delayed, or stopped
- Platform controls needed before next tier expansion
9.5 Evidence Binder Structure
| Section | 内容 |
|---|---|
| Executive summary | Use case、risk tier、business outcome、risk appetite alignment、go/no-go decision |
| System boundary | 模型、prompt、RAG、data、tools、workflow、人、渠道、vendor |
| Risk tiering | 定级依据、客户影响、自动化等级、数据敏感性、监管相关性 |
| Policy mapping | Policy intent、control、requirement、runtime guardrail、owner |
| Evaluation | Golden set、red-team、edge cases、citation、refusal、tool tests、human review |
| Security / privacy | Data flow、access、DLP、vendor restriction、logging、retention |
| Release evidence | Approval、change log、rollback plan、training、ops readiness |
| Monitoring | KRI、SLO、threshold、dashboard、alert routing |
| Exceptions | Active / expired exception、approver、conditions、residual risk |
| Post-launch review | Adoption、value、risk signals、incident、roadmap decision |
10. Product Roadmap Connection
Risk appetite 不是只决定“能不能上线”, 还决定 roadmap 如何排序。
10.1 Risk-Adjusted Roadmap
| Roadmap question | Risk appetite answer |
|---|---|
| 先做哪个 use case | 优先选择高价值、低不可逆损害、数据边界清晰、人工监督可运营的场景 |
| 什么时候扩大渠道 | 当质量、控制、投诉、人工复核和 trace evidence 持续稳定 |
| 什么时候增加自动化 | 当 L1/L2 有足够证据证明错误模式可控, 且 L3 的 human confirmation 可运营 |
| 什么时候接入工具 | 当 tool permission、approval token、idempotency、rollback、audit trace 都可用 |
| 什么时候暂停路线图 | 当风险容量被 breach、near miss 增多、证据不完整或例外过多 |
| 什么时候建设平台能力 | 当多个团队重复需要 eval、policy engine、tool gateway、RAG governance、evidence binder |
10.2 Roadmap Patterns
| Pattern | 适用场景 | 风险偏好逻辑 |
|---|---|---|
| Internal-first | 财富、信贷、AML、投诉 | 先让员工使用 AI, 观察 override 和质量, 再考虑客户可见能力 |
| Read-only-first | Agent / workflow automation | 先只读和草稿, 再写入内部系统, 最后才考虑客户或资金动作 |
| Shadow-before-impact | 高风险决策支持 | AI 在后台给建议但不影响结果, 收集对比证据 |
| Human-in-the-loop-by-design | 客户权益和监管相关 | 把人工复核设计成主流程, 不是临时补救 |
| Control-platform-before-scale | 多团队扩展 | 先建设 model gateway、policy engine、eval、observability、evidence binder |
| Stop-to-learn | 早期事故或指标异常 | 暂停扩展, 把 failure taxonomy、policy、UX 和 training 修好 |
10.3 Product Manager 的 Roadmap 语言
好的 AI PM 不说:
我们下一季度把客服 AI 全自动化。
更成熟的说法是:
下一季度我们把客服 AI 从 internal draft 扩展到 low-risk customer self-service FAQ。
前置条件是 citation accuracy、wrong-refusal、complaint linkage、trace completeness 和 human handoff SLO 连续稳定。
费用争议、投诉、账户关闭和赔付拒绝仍保持人工确认。
如果 advice boundary breach 或 trace completeness 突破阈值, 自动降级到 agent assist。
11. Interview Answers
11.1 30 秒版本
AI risk appetite 不能停留在董事会文件里。作为 AI PM, 我会把它转成四层产品机制: 第一是 use case risk tier, 判断客户影响、自动化程度、数据敏感性、监管相关性和可逆性; 第二是 product guardrails, 包括 advice boundary、automation boundary、data boundary、tool permission、human oversight、disclosure 和 appeal; 第三是 release gate 和 runtime control, 例如 policy engine、tool gateway、RAG source allowlist、HITL 和 kill switch; 第四是 metrics 和 evidence binder, 用 KRIs、SLO、breach thresholds、stop rules 和审计证据持续证明风险在偏好范围内。
11.2 2 分钟版本
我会把 AI risk appetite 看成 policy product management 问题, 不是纯治理文件问题。
第一步是把 board / executive appetite 翻译成产品边界: 在信贷、财富、客服、AML 这些金融零售场景里, 哪些 AI 可以检索、总结、建议, 哪些可以执行, 哪些必须永远保留人工最终判断。比如财富场景里, AI 可以做教育和顾问准备, 但不能直接给客户个性化买卖建议; AML 场景里, AI 可以整理证据和起草 narrative, 但不做最终 suspicious activity conclusion。
第二步是做 risk-tiered product management。Low-tier 内部工具可以轻量 eval 和基础日志; Medium-tier 员工 copilot 要有引用、人工确认和监控; High-tier 客户影响或受监管决策支持要有 HITL、red-team、policy engine、tool gateway、独立挑战和 evidence binder; Critical 场景默认不允许自主执行, 需要 shadow mode、双控、kill switch 和高管风险接受。
第三步是把 policy lifecycle 产品化。Policy intent 要变成 rule/control, 再变成 runtime guardrail, 进入监控、例外、复核和路线图。比如“AI 不应提供个性化投资建议”要落成 intent classifier、拒答话术、持牌顾问转接、越界率监控和 approved copy evidence。
最后我会用指标管理风险偏好: risk appetite indicators 看风险容量消耗, KRIs 看越界和趋势, SLO 看控制是否稳定, breach thresholds 和 stop rules 决定何时暂停、降级或回滚。这样 AI 产品既能创新, 又能把风险边界做成可执行、可监控、可审计的产品能力。
11.3 Chief Risk Officer 版本
我会把这个问题放在 residual risk 和 control effectiveness 上。我的做法是先把 AI use case inventory 按 customer impact、automation level、data sensitivity、regulatory relevance、reversibility 和 scale 定级, 再给每个 tier 绑定最低控制集。High 和 Critical 场景必须有明确 business owner、risk owner、release gate、monitoring dashboard、exception process 和 evidence binder。CRO 需要看的不是模型 demo, 而是风险偏好是否被消耗、哪些例外仍然有效、哪些 KRIs 接近 breach、哪些 stop rules 被触发、管理层接受了什么 residual risk。这样 risk appetite 不只是声明, 而是进入上线、运行、暂停和路线图取舍。
11.4 Chief Product Officer 版本
我会把 risk appetite 当成产品战略约束, 不是上线障碍。它帮助产品团队决定先做什么、不做什么、什么条件下扩展。比如客服 AI 不是一开始追求全自动, 而是按 internal draft、low-risk self-service、customer-visible answer、restricted workflow action 分阶段推进。每一阶段都定义 value metric、quality gate、human oversight、complaint signal 和 stop rule。这样路线图既能体现增长和效率, 又不会在信贷、财富、投诉、AML 等高风险场景把组织推到不可接受的风险位置。
11.5 Chief Architect 版本
我会把 risk appetite 落到架构控制面。关键是不要把政策藏在 prompt 里, 而是把 model gateway、RAG entitlement filter、policy decision point、tool gateway、workflow approval、observability 和 evidence store 设计成共享平台能力。Prompt 负责任务说明, 但授权、数据过滤、工具执行、审批和审计必须由确定性系统执行。对 High / Critical tier, 架构上要支持版本化、回归测试、traceability、kill switch、rollback、tenant / role / purpose-based access 和 policy bundle release。这样产品团队可以在 guardrails 内快速迭代, 风险团队也能看到控制真实运行。
12. Practice Drill
用以下练习训练 policy product management 表达:
| Drill | 练习问题 | 期望输出 |
|---|---|---|
| Credit | 设计一个信贷政策 AI copilot 的 risk appetite statement | 自动化边界、reason code 来源、人工确认、trace evidence |
| Wealth | 判断客户自助财富问答是否可以上线 | Advice boundary、持牌顾问转接、disclosure、越界监控 |
| Customer service | 把客服 AI 从员工草稿扩展到客户自助 FAQ | Tier 变化、release gate、投诉/申诉、route-to-human |
| AML | 设计 AML case summarization assistant | Analyst-in-control、证据引用、禁止最终结论、审计证据 |
| Agent | 让 AI 调用 CRM 和账户工具 | Tool permission、PDP/PEP、approval token、kill switch |
13. Summary
AI Risk Appetite / Policy Product Management 的核心能力是把高层风险偏好转成产品事实:
- Risk appetite 决定产品边界, 不是只写在治理文件里。
- Risk tier 决定控制强度、上线门禁、证据要求和路线图速度。
- Policy 要被产品化为可版本、可测试、可执行、可监控、可例外、可复核的控制资产。
- Guardrails 要覆盖 advice、automation、data、tool、human oversight、disclosure 和 appeal。
- Metrics 要连接 risk appetite indicators、KRIs、SLO、breach thresholds 和 stop rules。
- Evidence binder 是 AI 产品能被 risk、audit、executive 和监管沟通理解的共同语言。
- Roadmap 要按 risk capacity 排序: 先做可控价值, 再扩展自动化, 对 critical boundary 保持克制。
一句话复盘:
The best AI product managers turn risk appetite into shippable guardrails, measurable controls, reviewable evidence, and roadmap discipline.