返回 Papers
AI 扩展计划 / Playbooks

AI Risk Appetite / Policy Product Management Playbook

这些来源作为术语和治理锚点。本文只把它们转译成产品管理语言, 不把任何框架当作单独充分的合规结论。

737AI_RISK_APPETITE_POLICY_PRODUCT_MANAGEMENT_PLAYBOOK.md

AI Risk Appetite / Policy Product Management Playbook

定位: 面向 AI Product Lead / Strategy PM / AI BA / AI Architect / Risk Partner 的产品管理手册。重点不是讲风险管理基础, 而是把 board / executive risk appetite 转成 AI 产品约束、risk-tiered controls、policy-as-product 生命周期、运行时 guardrails、监控指标、例外处理、证据包和产品路线图。

重要说明: 本文不是法律、合规、审计或监管意见。正式项目必须由 legal / compliance / risk / model risk / privacy / security 结合司法辖区、机构类型、客户类型、业务用途、内部政策和监管关系确认。本文的目标是训练金融零售 AI 产品管理能力和面试表达。


1. Source Anchors

这些来源作为术语和治理锚点。本文只把它们转译成产品管理语言, 不把任何框架当作单独充分的合规结论。

AnchorOfficial link本 playbook 使用方式
NIST AI Risk Management Frameworkhttps://www.nist.gov/itl/ai-risk-management-framework用 Govern / Map / Measure / Manage 组织 AI 风险识别、度量、管理和治理证据。NIST 页面显示 AI RMF 1.0 正在修订, 正式项目需按访问日期复核。
ISO/IEC 42001:2023https://www.iso.org/standard/81230.html用 AI management system 语言把 policy、objective、risk treatment、operation、performance evaluation 和 continual improvement 连接成可运营体系。
COSO Enterprise Risk Managementhttps://www.coso.org/guidance-on-erm用 ERM 与 strategy / performance 的关系理解 risk appetite: 风险偏好不是合规文件, 而是战略取舍、绩效边界和管理层决策语言。

2. One-Sentence Positioning

AI Risk Appetite / Policy Product Management 是把董事会和高管层的风险偏好转译成 AI 产品可以执行的约束系统: 哪些场景能做、做到什么自动化程度、用什么数据和工具、需要什么人工监督、达到哪些指标才能上线、什么情况下暂停、例外如何审批、证据如何留存、路线图如何按风险容量排序。

一句英文表达:

Risk appetite becomes product reality only when it is translated into guardrails, tiers, controls, metrics, exceptions, monitoring, and roadmap decisions.

中文表达:

风险偏好只有进入产品边界、分层门禁、运行时控制、指标阈值、例外机制、监控留证和路线图取舍, 才真正影响 AI 产品。

3. Risk Appetite 如何转成 AI 产品约束

3.1 从董事会语言到产品语言

董事会和高管层通常不会说“这个 prompt 能不能调用账户冻结工具”。他们会说:

  • 我们愿意为效率提升承担多大的客户体验风险。
  • 我们在信贷、财富、AML、欺诈、投诉等场景的自动化边界在哪里。
  • 我们对客户权益、监管信任、声誉、模型错误、数据泄露和操作风险的容忍度是多少。
  • 我们希望 AI 支持增长, 但不能突破公平性、透明度、人工复核和可审计要求。
  • 我们愿意在哪些低风险场景快速试验, 哪些场景必须先有控制框架再扩展。

AI PM 的工作是把这些高层表达转成产品可执行对象:

Risk appetite languageProduct constraint具体产品化表达
对客户权益影响零容忍Automation boundaryAI 不直接做最终拒贷、适当性判断、账户关闭、可疑活动结论或客户赔付拒绝; 只能建议、摘要、准备材料或触发人工复核。
对敏感数据外泄低容忍Data boundaryPII、账户、收入、医疗、未成年人、身份文件等数据进入数据分级; 外部模型、日志、RAG index、训练集和导出能力都有 allowlist。
对监管解释不可接受黑箱Explainability constraint高风险输出必须绑定政策条款、数据来源、reason code、模型/规则版本、人工批准记录和客户可理解解释。
对操作效率有明确目标SLO / value metricAI 方案必须在人工复核保留的前提下降低处理时长、减少返工、提升 first-contact resolution 或增加检测覆盖。
对模型幻觉低容忍Quality gate客户可见答案、政策解释和财富/信贷类建议必须经过 groundedness、citation accuracy、refusal accuracy 和 red-team 门禁。
对自主 agent 行为谨慎Tool permission默认 read-only; 写操作、资金动作、账户状态变更、外部通知、case closure 需要工具网关、审批和幂等控制。
对创新有风险容量Tiered experimentation低风险内部 copilot 可快速试点; 客户影响或受监管场景走更高门禁; critical 场景先做 shadow mode 或 human-in-the-loop。

3.2 Risk Appetite Translation Loop

推荐把 risk appetite 转译做成一个固定产品管理循环:

Board / executive appetite
-> business domain appetite statement
-> AI use case tiering
-> product guardrails
-> control catalog
-> release gates
-> runtime enforcement
-> monitoring and KRIs
-> exceptions and residual risk acceptance
-> evidence binder
-> roadmap trade-offs

这个循环的关键不是一次性写文档, 而是形成可迭代机制:

Loop stepProduct management question产出
Appetite statement组织愿意为哪些业务结果承担哪些 AI 风险, 不愿意承担哪些风险AI risk appetite statement
Domain translation在信贷、财富、客服、AML、欺诈、运营中边界是否不同Domain appetite addendum
Use case tiering这个 use case 的客户、监管、资金、数据和自动化影响是什么Risk tier decision
Product guardrails产品界面、workflow、API、tool、数据和披露如何限制行为Guardrail spec
Control catalog每个 tier 默认需要哪些控制, 哪些控制可被替代或增强Control matrix
Release gate上线前必须通过哪些 eval、security、privacy、risk 和 ops 检查Go-live checklist
Runtime enforcement控制在运行时由谁执行: 产品、policy engine、tool gateway、workflow 还是人工PDP / PEP design
Monitoring哪些指标说明风险偏好被接近、突破或失效KRI / SLO dashboard
Exception什么时候允许突破默认规则, 谁批准, 多久复核Exception memo
Evidence如何向 risk、audit、regulator、executive 证明控制真实运行Evidence binder
Roadmap风险容量不足时先做什么、延后什么、停止什么Risk-adjusted roadmap

3.3 AI PM 的关键转译能力

对已具备 CBAP 背景的人, 重点不是再学需求基础, 而是把需求对象升级为“策略产品对象”:

传统需求对象AI policy product 对象转译重点
Business requirementRisk appetite constraint需求不是只表达想做什么, 还要表达不能做什么、何时停、谁能批准例外。
Business ruleVersioned policy control规则要有 owner、版本、测试、发布、回滚、监控和证据。
Process stepControl point流程节点要说明是 advice、decision、approval、execution 还是 evidence capture。
Acceptance criteriaRelease gate验收标准要包括质量、风险、安全、隐私、操作可用性和可审计性。
Exception pathRisk exception product flow例外不是邮件审批, 而是可追踪的产品流程和 residual risk 记录。
ReportRisk appetite dashboard报告不是展示 KPI, 而是显示 appetite usage、breach、near miss、stop rule 和 roadmap 决策。

4. Risk-Tiered Product Management

4.1 分层原则

AI risk tier 不是按模型能力高低划分, 而是按业务后果划分。一个小模型如果决定信贷或账户处置, 风险可能高于一个大模型做内部文案草稿。

建议用六个维度定级:

Dimension关键问题
Customer impact是否影响客户权益、价格、授信、交易、账户状态、投诉、赔付、适当性或客户可见解释
Automation levelAI 是 search / summarize / recommend / decide / execute 哪一级
Data sensitivity是否使用 PII、账户、交易、收入、身份文件、特殊类别数据、员工数据或第三方数据
Regulatory relevance是否触发信贷、公平借贷、AML/BSA、KYC、财富建议、隐私、投诉、消费者保护、记录留存等要求
Reversibility错误是否可快速纠正, 是否造成资金、信用、监管记录、声誉或客户信任损害
Scale and velocity影响是单个员工、单个队列、全渠道客户还是批量自动化

4.2 Risk Tier Matrix

Tier典型 AI 产品形态默认控件上线门禁证据要求
Low内部知识检索、文案草稿、会议摘要、非客户决策辅助数据分类、基础日志、用户提示、approved tool list、轻量 evalProduct owner approval; security / data allowlist; sample QAUse case card、数据边界、prompt / model version、抽样结果、用户反馈
Medium员工 copilot、客服建议草稿、运营分类建议、政策问答辅助RAG citation、人工确认、policy refusal、role-based access、质量监控、变更记录Product + Risk checkpoint; eval threshold; ops readiness; monitoring dashboardRisk tier rationale、eval report、control mapping、human review policy、incident path
High客户可见 AI、信贷/财富/投诉/欺诈/AML 决策支持、可影响客户行动的建议HITL、reason code、tool gateway、policy engine、red-team、independent challenge、模型/数据/工具版本控制Cross-functional release gate; model risk / compliance / privacy review; pilot and rollback planFull evidence binder、validation summary、policy-to-product matrix、monitoring plan、exception log、management attestation
Critical可能造成重大客户损害、监管承诺、资金或账户动作、自动化 adverse action、AML/欺诈结论、规模化 agent 执行默认禁止自主执行; shadow mode; dual control; executive approval; kill switch; production watch; strict change freezeExecutive risk acceptance; board-level visibility when material; staged rollout; stop rules testedExecutive risk memo、residual risk acceptance、control test evidence、stop-rule drill、audit-ready trace、post-launch review

4.3 Tier 不是标签, 是产品工作量预算

同一个功能从 Low 到 Critical, 产品工作量会明显变化:

Product workLowMediumHighCritical
Scope单一内部任务明确 workflow 辅助端到端控制点业务/风险共同定义允许范围
Discovery用户访谈 + 样例工作流和失败模式客户影响和监管后果高管风险场景和压力测试
Requirements功能验收质量 + 人工确认控制 + 证据 + rollback禁止边界 + residual risk
Design普通 UX引用、拒答、确认披露、申诉、人工复核强制人工、双控、暂停机制
Architecture模型接入RAG / workflow loggingpolicy engine / tool gatewaydeterministic controls before AI
Testing抽样 QAeval setindependent challenge + red-teamscenario drill + executive go/no-go
Launch小范围试点运营试点分阶段上线shadow mode / limited production
Monitoringusage / feedbackquality / overrideKRI / breach / incidentreal-time alerts / stop rules

4.4 Risk Tier Decision Record

每个 AI use case 应保存一条 risk tier decision record:

Field内容
Use case name清晰命名, 如 Branch Banker Wealth Guidance Copilot
Business owner对业务结果负责的人
Product owner对产品范围、路线图和交付证据负责的人
Risk owner对风险分类、控制期望和 residual risk 接受路径负责的人
System boundary模型、RAG、工具、workflow、人、渠道和外部依赖
Customer impact影响客户权益、决策、资金、体验或解释的方式
Automation levelsearch / summarize / recommend / decide / execute
Data sensitivity使用、存储、检索、外发、日志化的数据类型
Regulatory relevance相关监管域和内部政策域
Tier rationale为什么是 Low / Medium / High / Critical
Required controls该 tier 的默认控制和增强控制
Release gate上线前必须满足的条件
Review cadence日常监控、季度复核、重大变更触发复核

5. Policy Product Lifecycle

5.1 生命周期主线

AI policy 不能只放在 PDF、Wiki 或 prompt 中。它要被产品化为可测试、可版本化、可运行、可监控、可例外、可审计的控制资产。

policy intent
-> rule / control
-> product requirement
-> runtime guardrail
-> monitoring
-> exception
-> review
-> roadmap adjustment

5.2 Policy Intent -> Rule / Control

Policy intentRule / control产品问题
AI 不应提供未经授权的个性化投资建议Advice boundary classifier + disclosure + licensed specialist handoff如何识别 advice intent, 如何拒答, 如何升级, 如何记录
AI 不应使用未批准知识源解释信贷政策RAG source allowlist + effective-date filter + citation requirement哪些文档可检索, 版本如何生效, 引用缺失时怎么处理
AI 不应自主执行高风险账户操作Tool permission + HITL + dual control哪些 tool 是 read-only, 哪些写操作需要审批
AI 输出必须可复盘Trace logging + evidence retention需要记录哪些输入、版本、规则、输出和人工动作
AI 不能超过模型验证范围使用Use-case binding + route control如何阻止同一个 assistant 被复制到新业务场景

5.3 Rule / Control -> Product Requirement

风险控制要写进产品需求, 而不是上线前补一页合规说明:

Requirement type示例
Functional当客户询问“我应该买哪只基金”时, 系统识别为 personalized advice intent, 返回边界说明并引导至持牌顾问流程。
Non-functional高风险客户可见回答的 trace retention 不低于内部记录留存要求, 并能按 case id / customer id / model version 检索。
UX客服 agent 看到 AI 建议时必须有 accept / edit / reject / escalate 动作, 不允许一键自动发送高风险答复。
DataRAG 只检索已批准、有效期内、权限匹配的政策文档; 过期文档不进入候选集。
ToolingAgent 对 CRM 的写入必须通过 tool gateway, 并带有 user identity、case id、reason、approval token。
Evidence每次 high-tier release 生成 release evidence pack, 包括 eval、red-team、control mapping、risk sign-off 和 rollback plan。

5.4 Product Requirement -> Runtime Guardrail

运行时 guardrail 要避免只靠 prompt:

Guardrail推荐落点说明
Identity and entitlementIAM / ReBAC / access service决定用户能看哪些客户、账户、文档和工具。
Data filteringRetriever / feature store / data gateway在数据进入模型前做权限、有效期、敏感性和地域过滤。
Policy decisionPDP / rules engine / DMN / OPA / Cedar对能否回答、能否调用工具、是否需要审批做确定性判断。
Prompt instructionModel orchestration表达任务、风格、输出格式和安全边界, 但不作为唯一控制。
Tool enforcementTool gateway / PEP对副作用动作做 allow / deny / approval / rate limit / idempotency。
Human oversightWorkflow / case management让人工确认、修改、升级、驳回、批准和留证成为产品流程。
DisclosureChannel UI / message composer对客户或员工显示 AI 使用、限制、引用和下一步路径。
MonitoringObservability / RiskOps dashboard持续观察质量、越界、覆盖、人工覆盖率、异常和阈值突破。

5.5 Monitoring -> Exception -> Review

Policy lifecycle 的成熟度体现在例外和复核:

Signal可能动作
Breach threshold 被触发暂停功能、降级到人工、限制渠道、关闭工具、升级 incident
Near miss 增多增加抽样、收紧阈值、更新 eval set、调整 prompt / RAG / policy
业务价值低于预期缩小范围、改变 workflow insertion point、停止低价值能力
误拦截过高调整 policy classifier、优化 UX、增加专家复核样本
人工 override 过高分析模型质量、政策不清、培训不足或流程设计问题
新监管/内部政策变化触发 policy review、control mapping、release gate 更新
模型或 vendor 版本变化执行 regression eval、impact assessment、approval 或 rollback

6. Product Guardrails

6.1 Guardrail Catalog

Guardrail产品定义典型控件证据
Advice boundaryAI 能提供一般信息、教育、流程说明, 还是可以给个性化建议Intent classifier、refusal template、specialist handoff、approved languageAdvice boundary test、refusal accuracy、handoff log
Automation boundaryAI 是辅助、建议、决策还是执行Workflow state control、HITL、dual approval、autonomy capAutomation level record、approval trace、override log
Data boundary哪些数据可进入 prompt、RAG、模型调用、日志、训练和导出Data classification、DLP、retrieval filter、vendor data restrictionData inventory、access decision log、DLP alerts
Tool permissionAI agent 可以读、写、提交、通知、冻结、关闭或转账到什么程度Tool allowlist、PDP/PEP、rate limit、idempotency、approval tokenTool call trace、deny log、approval evidence
Human oversight哪些步骤必须人工确认、哪些需要专家、主管或 second lineQueue routing、approval workflow、sampling review、dual controlReview record、edit distance、approval SLA
Disclosure员工或客户是否知道 AI 参与、AI 的限制和下一步路径UI label、customer copy、citation、confidence display、handoff messageDisclosure copy version、channel screenshots、A/B outcome
Appeal / recourse客户或员工如何质疑、申诉、纠错或要求人工处理Escalation button、case reason、appeal queue、complaint linkageAppeal log、resolution time、root cause
Explainability输出如何绑定事实、政策、规则和 reason codeCitation、rule id、reason service、decision traceExplanation sample、reason mapping、audit trace
Change controlprompt、policy、model、tool、RAG index 如何变更Registry、approval workflow、regression eval、rollback planChange log、eval delta、release approval
Kill switch风险突破时如何快速暂停或降级Feature flag、route-to-human、tool disable、traffic capDrill record、incident timeline、recovery evidence

6.2 Advice Boundary

金融零售 AI 最容易出问题的边界之一是“信息解释”和“个性化建议”的混淆。

Allowed patternRestricted patternProduct guardrail
解释产品条款、费用、流程和一般风险推荐具体投资、保险、贷款额度、债务处理方案Intent detection + approved educational content + licensed advisor handoff
根据客户输入总结问题供人工处理直接告诉客户“你应该申请/购买/赎回/拒绝”Draft-only mode + human approval
提供一般预算、金融教育和术语解释对客户个人资产、收入、风险偏好做个性化建议Advice boundary banner + refusal + handoff
帮员工查找政策条款替员工做最终 suitability 或 adverse action 判断Citation required + decision remains with authorized role

PM 要把 advice boundary 写进:

  • Intent taxonomy: 哪些客户话术进入 advice intent。
  • Response policy: 允许回答、拒答、转人工、提供教育材料的规则。
  • UX states: answer、cannot answer、needs specialist、needs licensed advisor。
  • Monitoring: 越界回答率、转人工率、误拒答率、客户投诉率。
  • Evidence: 测试集、红队样本、approved copy、review record。

6.3 Automation Boundary

AI 自动化边界建议使用五级:

Level名称说明金融零售默认建议
L0No AI不使用 AI法规或内部政策禁止的最终判断
L1Retrieve / summarize检索、摘要、整理证据低中风险知识辅助
L2Recommend / draft给员工建议或草稿客服、运营、投诉、AML case prep
L3Decide with human confirmationAI 做初判, 人工确认后生效部分运营分流或低金额可逆动作
L4Autonomous executeAI 自主执行只适合低风险、可逆、可监控、授权明确的动作

高风险金融零售场景默认不应从 L1 直接跳到 L4。PM 应在 roadmap 中清楚写出:

  • 当前允许的最高自动化等级。
  • 进入下一等级需要的质量、控制、运营和证据条件。
  • 哪些边界永远不进入自主执行。
  • 哪些动作只能在 shadow mode 中评估, 不影响客户。

6.4 Data Boundary

数据边界不是一句“遵守隐私政策”。需要把数据生命周期产品化:

Boundary pointPM 要问的问题控制
CollectionAI 功能是否真的需要该数据字段Data minimization、purpose binding
RetrievalRAG 是否只拿到用户有权访问且有效的文档Entitlement filter、effective date、source allowlist
Prompt哪些 PII / account data 可以进入模型上下文Redaction、masking、field-level policy
Vendor外部模型是否允许处理该数据, 是否保留或训练Vendor allowlist、contractual configuration、gateway policy
Logging日志是否记录敏感信息, 谁能查看Secure trace store、retention、access control
Evaluationeval set 是否含真实客户数据Synthetic / anonymized data、controlled access
Export员工能否导出 AI 输出或引用内容DLP、watermark、download controls
Training线上反馈是否可用于微调或训练Consent / approval path、data lineage

6.5 Tool Permission

Agent 产品的风险通常从“回答错误”升级为“行动错误”。工具权限要按副作用分层:

Tool class示例默认权限
Read public / approved knowledge产品 FAQ、公开利率说明、内部政策库Low / Medium 可允许, 需 citation 和 source filter
Read customer data账户余额、交易、KYC、投诉记录需要身份、角色、purpose、case relationship
Draft internal updateCRM note 草稿、case summary、email draft员工确认后写入
Write non-financial state更新 task status、添加标签、创建工单Medium 以上需要 approval 或 sampled review
Customer communication发送短信、邮件、chat reply客户影响场景需要人工确认和 approved language
Financial / account action冻结、解冻、退款、调额、关闭账户、转账Critical; 默认禁止自主执行, 双控和强审计
Regulatory / risk conclusionSAR recommendation、fraud determination、adverse action reasonAI 只能准备证据和草稿, 最终由授权人员确认

6.6 Human Oversight

Human oversight 不是“旁边有个人”。它必须被设计成有权、有信息、有时间、有责任的产品流程:

Oversight failure产品修正
人工只看到 AI 答案, 看不到证据展示引用、规则、关键输入、置信区间和可疑点
一线人员被 KPI 推动盲目接受 AI设计 reject / edit / escalate, 并监控 blind acceptance
审批人没有权限改变结果审批人必须能修改、拒绝、暂停和升级
复核样本过少按 tier、风险信号、队列、用户和模型版本做抽样
人工复核没有留证记录 reviewer、动作、理由、时间、输入和版本

6.7 Disclosure and Appeal

客户可见 AI 场景需要把披露和申诉变成产品能力:

Capability产品要求
AI disclosure客户知道自己正在与 AI 或 AI-assisted 流程互动, 文案清楚但不制造恐慌。
Limitation statement对建议边界、信息来源、非最终决策、人工帮助路径做清晰说明。
Human handoff客户能要求人工处理, 且 handoff 带上下文, 不让客户重复叙述。
Appeal / correction客户能质疑错误信息、补充材料、要求复查或纠正记录。
Complaint linkage申诉、投诉、错误反馈进入同一套 case / root cause / risk monitoring。

7. Metrics

7.1 指标分层

AI risk appetite 指标要同时覆盖业务价值、风险容量、质量、运营、控制和客户结果。不要只看模型准确率。

Risk Appetite Indicators
-> KRIs
-> SLOs
-> Breach thresholds
-> Stop rules
-> Roadmap decisions
Metric layer作用示例
Risk Appetite Indicator显示组织正在消耗多少风险容量高风险 AI 覆盖客户数、自动化动作占比、客户可见 AI 占比、例外数量
KRI显示风险是否升高越界建议率、policy violation、hallucination、工具拒绝、投诉、near miss
SLO显示服务和控制是否稳定grounded answer rate、citation accuracy、human review SLA、trace completeness、rollback time
Breach threshold明确何时视为突破风险偏好某类越界回答超过阈值、critical tool unauthorized attempt、trace 缺失
Stop rule明确何时暂停、降级或关闭触发 kill switch、route-to-human、traffic cap、tool disable

7.2 Risk Appetite Indicators

Indicator产品含义决策用途
High-tier AI exposureHigh / Critical 功能覆盖的客户、交易、case 或员工数量判断是否需要升级 governance、审计和高管报告
Autonomous action ratioAI 自主执行动作占全部动作比例判断自动化是否超出批准边界
Sensitive data touchpoints使用敏感数据的 prompt、RAG、tool、日志和 eval 数量判断数据边界和隐私控制是否足够
Exception load活跃例外数量、延期次数、超期例外判断默认政策是否不合理或团队在绕开控制
Residual risk accepted已批准 residual risk 的数量和严重度判断风险容量是否被消耗
Customer-facing AI complaints客户投诉、申诉、纠错与 AI 相关比例判断客户信任和披露是否有效
Model / policy change velocityprompt、model、index、tool、policy 变更频率判断变更门禁和 regression eval 是否匹配速度

7.3 KRIs

KRI适用场景解释
Advice boundary breach rate财富、信贷、保险、债务建议、客户服务AI 输出越过一般信息边界进入个性化建议的比例
Unsupported answer rateRAG、政策问答、客服回答缺少有效引用或引用不支持结论的比例
Wrong refusal / missed refusal客户交互、员工 copilot应该回答却拒答, 或应该拒答却回答
Tool policy deny rateAgent / workflow automation工具调用被 policy engine 拒绝的比例和原因
Unauthorized tool attemptAgent / data accessAI 或用户尝试调用未授权工具或资源
Human override rate决策支持人工修改、驳回或升级 AI 建议的比例
Blind acceptance rate员工 copilot员工未编辑直接接受 AI 输出的比例, 需要结合质量和场景判断
Complaint / appeal rate客户可见 AI客户对 AI 相关回答、决策或流程申诉的比例
Trace completeness高风险场景能否复盘输入、输出、版本、规则、审批和工具调用
Drift / policy stalenessRAG / policy-as-product知识源过期、政策版本混用或模型行为变化

7.4 SLO

SLO示例目标表达说明
Citation accuracy SLO高风险政策问答样本中, 引用支持结论的比例达到内部 release threshold阈值由风险和业务共同定义, 不在本文给绝对数值。
Human review SLAHigh-tier AI 建议在规定工作时间内完成复核避免 AI 带来队列积压或假自动化。
Trace completeness SLOHigh / Critical 场景的 trace 字段完整率达到 release gate缺 trace 等于无法审计, 不能只看回答质量。
Policy decision latency SLOPDP / PEP 延迟满足渠道体验要求控制不能慢到让一线绕开。
Rollback SLO高风险变更可在规定时间内回滚到批准版本路线图要包含回滚演练。
Escalation reliability SLO需要人工介入的 case 能正确进入队列并保留上下文人工监督必须可运营。

7.5 Breach Thresholds and Stop Rules

Breach typeStop rule产品动作
Critical unauthorized tool executionImmediate stop关闭相关工具、冻结 agent 写权限、启动 incident、通知 risk / security
客户可见 advice breach 超阈值Route-to-human暂停客户自助回答, 改为人工或 licensed specialist handoff
Trace completeness 低于门禁Release block阻止上线或回滚版本, 直到日志和证据恢复
RAG 引用错误集中出现Knowledge freeze冻结 index 更新, 回滚知识库版本, 执行根因分析
Human override 异常升高Traffic cap限制流量、增加抽样、重新训练员工或调整 AI 输出
投诉或申诉集中在特定队列Product review暂停扩展, 做 journey / copy / policy / training 修正
Model vendor 行为变化Regression gate回到上一批准模型版本或进入 shadow evaluation

8. Financial Retail Case

8.1 信贷: Credit Policy Copilot

Product decisionRisk appetite translation
PositioningAI 帮信贷人员查政策、整理材料、生成问题清单和解释草稿, 不做最终授信、拒绝或 adverse action。
TierHigh; 如果进入自动拒绝、调额或客户可见拒绝原因, 升为 Critical。
Guardrails只检索有效期内政策; reason code 来自规则/决策服务; AI 草稿必须人工确认; 客户可见解释使用 approved language。
MetricsUnsupported policy answer、reason mismatch、manual override、adverse action complaint、trace completeness。
Evidence binder风险定级、policy source allowlist、eval set、信贷专家 review、fairness challenge、release approval、post-launch review。
Roadmap implication先做 L1/L2 policy copilot, 再做 shadow recommendation, 只有证据充分时才扩大到 low-risk prefill。

8.2 财富建议: Wealth Guidance Assistant

Product decisionRisk appetite translation
PositioningAI 提供教育、产品信息、会议准备和顾问草稿; 不直接给客户个性化买卖建议。
TierHigh for advisor-facing; Critical if customer-facing personalized advice or execution is contemplated。
GuardrailsAdvice intent classifier、licensed advisor handoff、disclosure、suitability workflow separation、approved educational content。
MetricsAdvice boundary breach、handoff success、客户误解/投诉、顾问 edit rate、citation accuracy。
Evidence binderAdvice boundary policy、test suite、approved copy、advisor workflow record、training material、monitoring dashboard。
Roadmap implication路线图从 advisor productivity 开始, 不是从 autonomous robo-advice 开始; 客户自助能力先限定为教育和流程说明。

8.3 客服: Customer Service Copilot

Product decisionRisk appetite translation
PositioningAI 帮客服总结客户问题、检索政策、起草回复、推荐下一步; 高风险回复必须人工确认。
TierMedium for internal draft; High for customer-visible auto-reply or complaint handling; Critical for account actions。
GuardrailsSensitive intent routing、complaint escalation、approved language、manual send、PII redaction、case trace。
MetricsFirst-contact resolution、wrong answer、complaint escalation miss、manual edit distance、customer appeal、AI-related CSAT movement。
Evidence binderConversation samples、policy citation QA、human review log、complaint linkage、control mapping、rollback plan。
Roadmap implication先提升 agent assist 和 case summarization, 再扩展到低风险自助问答; 涉及费用、争议、关闭账户时保持人工。

8.4 AML: Case Investigation Assistant

Product decisionRisk appetite translation
PositioningAI 帮 AML 分析师整理交易、提取实体关系、总结证据、起草 narrative; 不做最终 suspicious activity conclusion。
TierHigh; 如果 AI 自动做 SAR / no-SAR 结论或提交监管报告, 属 Critical 且默认不允许自主执行。
GuardrailsAnalyst-in-control、source trace、case evidence linkage、禁止自动提交、tool read restrictions、audit logging。
MetricsAnalyst override、missed escalation、unsupported narrative、case aging、quality review findings、trace completeness。
Evidence binderTypology mapping、case sample eval、analyst QA、model / prompt / tool version、review notes、issue remediation。
Roadmap implicationAI 优先做 evidence preparation 和 workload triage; SAR 决策权、质量复核和提交权限保留给授权人员。

8.5 横向落地模式

金融零售 AI 风险偏好落地可以用同一张横向图:

Domain risk appetite
-> approved AI use cases
-> automation boundary
-> data and tool boundary
-> human oversight design
-> release gate
-> monitoring dashboard
-> exception and issue management
-> roadmap funding and sequencing
Domain推荐先做谨慎推进默认高管关注
Credit政策检索、材料完整性、员工草稿自动 eligibility / reason code自动拒贷、调额、adverse action
Wealth顾问准备、教育内容、会议总结客户自助教育问答个性化买卖建议和自动交易
Customer service员工 copilot、摘要、低风险 FAQ自动回复费用、争议、投诉自动关闭账户、拒绝赔付、投诉裁定
AML / Fraudcase summarization、证据关联、优先级建议自动分流和低风险 closureSAR / no-SAR、账户冻结、欺诈最终结论

9. Artifact Templates

9.1 AI Risk Appetite Statement

# AI Risk Appetite Statement - [Domain / Product]

## Strategic Intent
- Business outcome: [要达成的业务结果, 如降低客服处理时长、提高 AML case coverage、提升信贷政策一致性]
- AI role: [retrieve / summarize / recommend / decide / execute]
- Approved channels: [employee desktop / branch / call center / mobile app / batch operation]

## Appetite Boundaries
- Customer impact appetite: [可接受的客户影响范围和明确禁止的影响]
- Automation appetite: [当前允许的最高自动化等级]
- Data appetite: [允许使用、禁止使用、需要额外审批的数据类型]
- Tool appetite: [允许 read-only、draft、write、external communication、financial action 的边界]
- Advice / decision appetite: [允许一般信息、员工建议、客户建议、最终决策的边界]

## Required Guardrails
- Human oversight: [谁复核、何时复核、能否修改或拒绝]
- Disclosure: [员工或客户看到的 AI 使用和限制说明]
- Monitoring: [RAI / KRI / SLO]
- Stop rules: [触发暂停、降级、回滚、关工具的条件]
- Evidence: [上线前和上线后证据包清单]

## Residual Risk and Review
- Residual risk accepted by: [角色, 不是个人姓名]
- Review cadence: [月度 / 季度 / 重大变更触发]
- Expiry / renewal: [例外或风险接受的复核日期]
- Roadmap implication: [哪些能力可以做、哪些延后、哪些不做]

9.2 Policy-to-Product Matrix

Policy intentProduct requirementRuntime controlMetricEvidence
AI 不提供个性化投资建议识别 advice intent 并转 licensed advisorIntent classifier + refusal + handoffAdvice breach rate、handoff successTest cases、approved copy、handoff log
高风险回答必须有有效来源客户/员工看到政策引用和生效日期RAG source allowlist + citation checkerCitation accuracy、unsupported answerEval report、retrieval trace
Agent 不自主执行账户动作写操作需 approval tokenTool gateway + PEP + dual controlUnauthorized attempt、approval SLATool trace、approval record
敏感数据不进入未批准模型模型调用前做数据分类和 redactionModel gateway + DLPDLP alert、blocked requestGateway log、data inventory
变更必须可回滚prompt/model/index/tool 有版本和 regression evalRegistry + release gate + feature flagRollback time、eval deltaChange log、release approval

9.3 Exception Memo

# AI Policy Exception Memo - [Use Case / Control]

## Exception Summary
- Requested exception: [要偏离的默认政策或控制]
- Product / use case: [功能名称和业务域]
- Risk tier: [Low / Medium / High / Critical]
- Business reason: [为什么默认控制无法满足业务目标]
- Duration: [固定期限或触发条件, 不写无限期]

## Risk Analysis
- Appetite boundary affected: [customer impact / automation / data / tool / advice / evidence]
- Potential harm: [客户、运营、监管、声誉、财务、数据]
- Compensating controls: [替代控制, 如更高人工抽样、流量限制、只读模式、额外披露]
- Residual risk: [剩余风险如何被 owner 接受和监控]

## Approval and Conditions
- Approver roles: [business owner / risk owner / data owner / security / executive]
- Conditions: [流量上限、适用队列、额外监控、到期复核]
- Stop rules: [触发立即终止例外的条件]
- Evidence required: [运行日志、抽样复核、KRI、incident report]

## Review
- Review date: [明确日期]
- Renewal criteria: [续期必须满足的证据]
- Exit path: [如何回到标准控制或永久停止能力]

9.4 Risk Review Agenda

# AI Product Risk Review Agenda - [Date]

## 1. Appetite Usage
- High / Critical use cases live or in pilot
- Customer / employee / case exposure
- Active exceptions and residual risk accepted

## 2. New or Changed Use Cases
- New use case tiering decisions
- Domain appetite conflicts
- Required controls and release gates

## 3. Control Performance
- KRIs crossing warning threshold
- SLO misses
- Human override and blind acceptance trends
- Tool deny / unauthorized attempt trends

## 4. Incidents, Near Misses, and Complaints
- Incident timeline and root cause
- Customer complaints or appeals linked to AI
- Remediation owner and due date

## 5. Policy and Change Review
- Prompt / model / RAG / policy / tool changes
- Regression eval results
- Evidence binder completeness

## 6. Roadmap Decisions
- Features approved to scale
- Features capped, redesigned, delayed, or stopped
- Platform controls needed before next tier expansion

9.5 Evidence Binder Structure

Section内容
Executive summaryUse case、risk tier、business outcome、risk appetite alignment、go/no-go decision
System boundary模型、prompt、RAG、data、tools、workflow、人、渠道、vendor
Risk tiering定级依据、客户影响、自动化等级、数据敏感性、监管相关性
Policy mappingPolicy intent、control、requirement、runtime guardrail、owner
EvaluationGolden set、red-team、edge cases、citation、refusal、tool tests、human review
Security / privacyData flow、access、DLP、vendor restriction、logging、retention
Release evidenceApproval、change log、rollback plan、training、ops readiness
MonitoringKRI、SLO、threshold、dashboard、alert routing
ExceptionsActive / expired exception、approver、conditions、residual risk
Post-launch reviewAdoption、value、risk signals、incident、roadmap decision

10. Product Roadmap Connection

Risk appetite 不是只决定“能不能上线”, 还决定 roadmap 如何排序。

10.1 Risk-Adjusted Roadmap

Roadmap questionRisk appetite answer
先做哪个 use case优先选择高价值、低不可逆损害、数据边界清晰、人工监督可运营的场景
什么时候扩大渠道当质量、控制、投诉、人工复核和 trace evidence 持续稳定
什么时候增加自动化当 L1/L2 有足够证据证明错误模式可控, 且 L3 的 human confirmation 可运营
什么时候接入工具当 tool permission、approval token、idempotency、rollback、audit trace 都可用
什么时候暂停路线图当风险容量被 breach、near miss 增多、证据不完整或例外过多
什么时候建设平台能力当多个团队重复需要 eval、policy engine、tool gateway、RAG governance、evidence binder

10.2 Roadmap Patterns

Pattern适用场景风险偏好逻辑
Internal-first财富、信贷、AML、投诉先让员工使用 AI, 观察 override 和质量, 再考虑客户可见能力
Read-only-firstAgent / workflow automation先只读和草稿, 再写入内部系统, 最后才考虑客户或资金动作
Shadow-before-impact高风险决策支持AI 在后台给建议但不影响结果, 收集对比证据
Human-in-the-loop-by-design客户权益和监管相关把人工复核设计成主流程, 不是临时补救
Control-platform-before-scale多团队扩展先建设 model gateway、policy engine、eval、observability、evidence binder
Stop-to-learn早期事故或指标异常暂停扩展, 把 failure taxonomy、policy、UX 和 training 修好

10.3 Product Manager 的 Roadmap 语言

好的 AI PM 不说:

我们下一季度把客服 AI 全自动化。

更成熟的说法是:

下一季度我们把客服 AI 从 internal draft 扩展到 low-risk customer self-service FAQ。
前置条件是 citation accuracy、wrong-refusal、complaint linkage、trace completeness 和 human handoff SLO 连续稳定。
费用争议、投诉、账户关闭和赔付拒绝仍保持人工确认。
如果 advice boundary breach 或 trace completeness 突破阈值, 自动降级到 agent assist。

11. Interview Answers

11.1 30 秒版本

AI risk appetite 不能停留在董事会文件里。作为 AI PM, 我会把它转成四层产品机制: 第一是 use case risk tier, 判断客户影响、自动化程度、数据敏感性、监管相关性和可逆性; 第二是 product guardrails, 包括 advice boundary、automation boundary、data boundary、tool permission、human oversight、disclosure 和 appeal; 第三是 release gate 和 runtime control, 例如 policy engine、tool gateway、RAG source allowlist、HITL 和 kill switch; 第四是 metrics 和 evidence binder, 用 KRIs、SLO、breach thresholds、stop rules 和审计证据持续证明风险在偏好范围内。

11.2 2 分钟版本

我会把 AI risk appetite 看成 policy product management 问题, 不是纯治理文件问题。

第一步是把 board / executive appetite 翻译成产品边界: 在信贷、财富、客服、AML 这些金融零售场景里, 哪些 AI 可以检索、总结、建议, 哪些可以执行, 哪些必须永远保留人工最终判断。比如财富场景里, AI 可以做教育和顾问准备, 但不能直接给客户个性化买卖建议; AML 场景里, AI 可以整理证据和起草 narrative, 但不做最终 suspicious activity conclusion。

第二步是做 risk-tiered product management。Low-tier 内部工具可以轻量 eval 和基础日志; Medium-tier 员工 copilot 要有引用、人工确认和监控; High-tier 客户影响或受监管决策支持要有 HITL、red-team、policy engine、tool gateway、独立挑战和 evidence binder; Critical 场景默认不允许自主执行, 需要 shadow mode、双控、kill switch 和高管风险接受。

第三步是把 policy lifecycle 产品化。Policy intent 要变成 rule/control, 再变成 runtime guardrail, 进入监控、例外、复核和路线图。比如“AI 不应提供个性化投资建议”要落成 intent classifier、拒答话术、持牌顾问转接、越界率监控和 approved copy evidence。

最后我会用指标管理风险偏好: risk appetite indicators 看风险容量消耗, KRIs 看越界和趋势, SLO 看控制是否稳定, breach thresholds 和 stop rules 决定何时暂停、降级或回滚。这样 AI 产品既能创新, 又能把风险边界做成可执行、可监控、可审计的产品能力。

11.3 Chief Risk Officer 版本

我会把这个问题放在 residual risk 和 control effectiveness 上。我的做法是先把 AI use case inventory 按 customer impact、automation level、data sensitivity、regulatory relevance、reversibility 和 scale 定级, 再给每个 tier 绑定最低控制集。High 和 Critical 场景必须有明确 business owner、risk owner、release gate、monitoring dashboard、exception process 和 evidence binder。CRO 需要看的不是模型 demo, 而是风险偏好是否被消耗、哪些例外仍然有效、哪些 KRIs 接近 breach、哪些 stop rules 被触发、管理层接受了什么 residual risk。这样 risk appetite 不只是声明, 而是进入上线、运行、暂停和路线图取舍。

11.4 Chief Product Officer 版本

我会把 risk appetite 当成产品战略约束, 不是上线障碍。它帮助产品团队决定先做什么、不做什么、什么条件下扩展。比如客服 AI 不是一开始追求全自动, 而是按 internal draft、low-risk self-service、customer-visible answer、restricted workflow action 分阶段推进。每一阶段都定义 value metric、quality gate、human oversight、complaint signal 和 stop rule。这样路线图既能体现增长和效率, 又不会在信贷、财富、投诉、AML 等高风险场景把组织推到不可接受的风险位置。

11.5 Chief Architect 版本

我会把 risk appetite 落到架构控制面。关键是不要把政策藏在 prompt 里, 而是把 model gateway、RAG entitlement filter、policy decision point、tool gateway、workflow approval、observability 和 evidence store 设计成共享平台能力。Prompt 负责任务说明, 但授权、数据过滤、工具执行、审批和审计必须由确定性系统执行。对 High / Critical tier, 架构上要支持版本化、回归测试、traceability、kill switch、rollback、tenant / role / purpose-based access 和 policy bundle release。这样产品团队可以在 guardrails 内快速迭代, 风险团队也能看到控制真实运行。


12. Practice Drill

用以下练习训练 policy product management 表达:

Drill练习问题期望输出
Credit设计一个信贷政策 AI copilot 的 risk appetite statement自动化边界、reason code 来源、人工确认、trace evidence
Wealth判断客户自助财富问答是否可以上线Advice boundary、持牌顾问转接、disclosure、越界监控
Customer service把客服 AI 从员工草稿扩展到客户自助 FAQTier 变化、release gate、投诉/申诉、route-to-human
AML设计 AML case summarization assistantAnalyst-in-control、证据引用、禁止最终结论、审计证据
Agent让 AI 调用 CRM 和账户工具Tool permission、PDP/PEP、approval token、kill switch

13. Summary

AI Risk Appetite / Policy Product Management 的核心能力是把高层风险偏好转成产品事实:

  • Risk appetite 决定产品边界, 不是只写在治理文件里。
  • Risk tier 决定控制强度、上线门禁、证据要求和路线图速度。
  • Policy 要被产品化为可版本、可测试、可执行、可监控、可例外、可复核的控制资产。
  • Guardrails 要覆盖 advice、automation、data、tool、human oversight、disclosure 和 appeal。
  • Metrics 要连接 risk appetite indicators、KRIs、SLO、breach thresholds 和 stop rules。
  • Evidence binder 是 AI 产品能被 risk、audit、executive 和监管沟通理解的共同语言。
  • Roadmap 要按 risk capacity 排序: 先做可控价值, 再扩展自动化, 对 critical boundary 保持克制。

一句话复盘:

The best AI product managers turn risk appetite into shippable guardrails, measurable controls, reviewable evidence, and roadmap discipline.