AI Customer Harm / Recourse / Remediation Playbook
重要说明:本文是学习、作品集和内部治理训练材料,不构成法律意见、合规结论、审计意见、模型验证报告、监管解释或赔偿建议。正式项目必须由 Legal、Compliance、Risk、Model Risk、Fair Lending、Privacy、Security、Accessibility、Operations、Business Owner、Technology Owner 和管理层结合机构类型、司法
AI Customer Harm / Recourse / Remediation Playbook
定位:面向 CBAP+、AI Product Manager、AI Product Architect、Customer Experience Risk Lead、Solutions Architect、Model Risk、Compliance、Operations、Digital Banking、Lending、Payments、Wealth、AML/KYC 团队的高级实战手册。本文关注的不是普通客服话术,而是金融零售 AI 系统造成或放大的客户伤害如何被识别、分类、监控、补救、恢复和证明已经恢复。目标是把 customer harm 从“客户投诉后个案处理”升级为可治理、可度量、可追溯、可审计、可复盘的产品与架构能力。
重要说明:本文是学习、作品集和内部治理训练材料,不构成法律意见、合规结论、审计意见、模型验证报告、监管解释或赔偿建议。正式项目必须由 Legal、Compliance、Risk、Model Risk、Fair Lending、Privacy、Security、Accessibility、Operations、Business Owner、Technology Owner 和管理层结合机构类型、司法辖区、产品范围、客户群体、合同义务和内部政策确认。访问日期按 2026-06-30 记录。
Source Anchors
以下官方来源作为本文的设计锚点。本文把这些来源转成产品需求、流程控制、运行监控、客户救济、证据包和管理层决策语言,不把任何来源简化为单一检查表。
| Anchor | Official link | 本 playbook 的使用方式 |
|---|---|---|
| NIST AI Risk Management Framework | https://www.nist.gov/itl/ai-risk-management-framework | 用 Govern / Map / Measure / Manage 组织 AI customer harm 的治理、场景映射、指标测量、处置闭环和持续改进。NIST 页面显示 AI RMF 1.0 正在修订,正式项目应跟踪版本变化。 |
| NIST AI RMF Generative AI Profile | https://www.nist.gov/itl/ai-risk-management-framework/generative-artificial-intelligence-profile 和 https://www.nist.gov/publications/artificial-intelligence-risk-management-framework-generative-artificial-intelligence | 用户给出的 NIST GenAI Profile 路径在 2026-06-30 访问时返回 404;当前可访问的 NIST 官方 publication 页面用于 GenAI 风险锚点。本文用它处理 hallucination、信息完整性、over-reliance、content provenance、third-party dependency、abuse、incident response 和 evidence。 |
| EU AI Act: Regulation (EU) 2024/1689 | https://eur-lex.europa.eu/eli/reg/2024/1689/oj | 用于理解 AI 系统风险分层、透明度、高风险系统、post-market monitoring、serious incident、deployer / provider responsibility、记录和客户影响治理。正式适用性由 Legal / Compliance 判断。 |
| CFPB Consumer Complaint Database | https://www.consumerfinance.gov/data-research/consumer-complaints/ | 用作 consumer harm signal 的外部参照:投诉主题、公司响应、趋势、产品类别和客户叙述可以反向校准内部 complaint taxonomy、root cause 分类和 remediation proof。 |
| FTC Business Blog: Keep your AI claims in check | https://www.ftc.gov/business-guidance/blog/2023/02/keep-your-ai-claims-check | 用于 AI 产品声明、营销承诺、效果证明和 customer communication 的边界:不要把 AI 能力说成无证据承诺,不要用“AI”掩盖真实限制、错误概率或专业服务边界。 |
Source-to-artifact mapping:
| Source lens | 需要落到的 artifact | 面试表达 |
|---|---|---|
| NIST AI RMF | AI harm risk register、harm KRI dashboard、control library、release gate、incident review | “我用 Govern / Map / Measure / Manage 管理客户伤害,而不是只看模型准确率。” |
| NIST GenAI Profile | RAG harm taxonomy、hallucination impact matrix、content provenance evidence、prompt / retrieval change log | “生成式 AI 的风险不是回答错一句话,而是错信息进入客户旅程后是否造成权益、资金、隐私或解释损害。” |
| EU AI Act | AI inventory、risk tier、post-market monitoring plan、serious incident escalation、deployer evidence | “我会把客户影响、自动化程度、人类监督和生产监控作为 AI 系统适用性事实基础。” |
| CFPB complaints | Complaint taxonomy、recourse trigger、trend monitoring、external complaint reconciliation | “投诉不是客服噪音,而是 harm detection 的生产信号。” |
| FTC AI claims guidance | AI claims review、customer notice、marketing substantiation file、communication control | “如果产品说 AI 能解决、判断或建议,就要能证明能力边界和恢复路径。” |
1. 核心心智模型:AI Customer Harm 不是只有模型错误
金融零售 AI 的 customer harm 不能只定义为 model error。一个模型输出错误但没有进入客户决策,可能只是质量问题;一个看似“部分正确”的输出如果让客户错过争议期限、被错误拒绝、被迫重复提交材料、泄露隐私或无法获得人工帮助,就是客户伤害。
本文使用一个更适合产品、架构和运营团队的公式:
AI Customer Harm =
Wrong action
+ Customer impact
+ Weak recovery path
解释:
- Wrong action:AI 系统、AI 辅助员工、自动化策略、RAG 答案、评分模型、建议引擎或工作流采取了错误、误导、不完整、不公平、过度自信、过度延迟或无权限的动作。
- Customer impact:客户受到资金、访问、权益、解释、隐私、时间、情绪、合规、声誉或运营负担影响。
- Weak recovery path:客户不知道如何申诉,人工入口不可达,审核材料缺失,纠正太慢,补偿不足,解释不清,问题重复发生,组织无法证明已经恢复。
因此,高级 AI PM / Architect 不能只问:
模型准不准?
而要问:
AI 的输出进入了哪个客户旅程?
它改变了什么动作、承诺、排序、拒绝、建议、通知或服务路径?
客户最坏会损失什么?
客户如何发现、质疑、暂停、升级、纠正和获得补偿?
我们如何证明影响范围已经识别、客户已经恢复、根因已经修复、同类伤害没有继续发生?
1.1 三层伤害栈
| 层级 | 问题 | 典型失败 |
|---|---|---|
| AI behavior layer | 模型、prompt、检索、规则、阈值、agent tool use 是否产生错误行为 | 幻觉、错误解释、错误分类、过度拒绝、错误路由、过期知识、prompt injection、工具调用失败 |
| Customer journey layer | 错误行为进入哪个客户触点和流程 | 客户被拒绝、错过期限、收到错误建议、无法联系人工、被重复要求提交材料 |
| Recovery layer | 伤害发生后客户和组织如何恢复 | 无申诉入口、case owner 不清、日志不完整、没有补偿机制、无法批量找出受影响客户 |
高级判断的关键:很多组织只修第一层,把 prompt 改了、模型换了、阈值调了,却没有处理第二层和第三层。客户伤害管理必须同时修正 AI behavior、customer journey 和 recovery path。
1.2 Customer harm 与 incident 的区别
| 维度 | 普通 AI incident | AI customer harm |
|---|---|---|
| 判断中心 | 系统是否异常 | 客户是否受到实际或合理可预见的影响 |
| 触发来源 | 监控报警、模型漂移、服务故障、安全事件 | 投诉、申诉、拒绝、损失、延迟、隐私暴露、监管问询、群体差异 |
| 处置目标 | 恢复系统稳定 | 恢复客户状态、权益、资金、解释、信任和证据 |
| 成功标准 | 服务可用、错误率下降 | 客户 made whole、原因可解释、影响范围完整、同类伤害停止 |
| 证据要求 | 技术日志、变更记录、报警记录 | 再叠加客户通知、个案审核、补偿记录、申诉结果、群体公平性和复发监控 |
1.3 Recourse 是产品能力,不是售后动作
Recourse 指客户能够质疑、申诉、纠正、获得人工审核、恢复权益、获得补偿或获得清晰解释的制度化路径。成熟的 recourse 不依赖某个客服是否有经验,而是被嵌入:
- Journey design:客户在关键节点能看到申诉、人工、解释和暂停入口。
- Decision architecture:每个 AI-assisted decision 都能关联理由、证据、版本和责任人。
- Case management:客户申诉进入统一 case,不在聊天记录、邮件和工单之间丢失。
- Operational policy:不同 harm severity 有明确 SLA、审批和补偿权限。
- Evidence capture:客户恢复所需的事实、日志、通知、审核和纠正动作自动沉淀。
- Monitoring:补救后继续看 repeat harm、segment disparity 和 recurring root cause。
2. 设计原则:从“支持客户”升级为“恢复客户”
| 原则 | 实战含义 | 反模式 |
|---|---|---|
| Impact-first | 先按客户影响分级,再按模型错误类型分析 | 只按技术严重程度排队,忽略客户权益和资金影响 |
| Recoverability by design | 高影响 AI 动作必须默认可质疑、可暂停、可撤销或可人工复核 | 上线后才想如何申诉和赔偿 |
| No dead-end automation | AI 不得把客户困在无法完成任务、无法找人、无法申诉的自助循环 | Chatbot 反复回答同一句,隐藏人工入口 |
| Explain what matters | 解释要服务于客户行动和权利,不是展示技术细节 | 给出一堆特征权重,但客户仍不知道如何纠正 |
| Evidence at source | 证据在流程运行时生成,不靠事故后拼截图 | 事后手动整理聊天记录、日志和审批邮件 |
| Segment-aware recovery | 监控不同客户群、语言、渠道、地区、产品和脆弱客户的伤害差异 | 平均指标达标但弱势群体持续受害 |
| Proportionate compensation | 补偿与损失、延迟、错误拒绝、客户负担和监管风险相匹配 | 只道歉不纠正资金或权益 |
| Closed-loop learning | 每个 harm case 都要进入 root cause、eval、知识库、流程和控制改进 | 个案处理完即关闭,没有系统性学习 |
2.1 AI PM 的关键转向
传统客服项目常以 deflection rate、AHT、cost-to-serve、CSAT 衡量成功。AI customer harm 管理要求把目标改成:
- 客户是否获得正确行动,而不仅是得到快速回答。
- 错误是否被快速发现,而不仅是投诉数量下降。
- 人工入口是否在高风险场景可达,而不是被自助化吞掉。
- 补救是否恢复客户状态,而不是只关闭工单。
- 证据是否能经受审计,而不是只满足内部复盘。
3. Harm Taxonomy:客户伤害分类法
分类法必须服务于三件事:生产识别、处置优先级和证据证明。下面分类可作为金融零售 AI harm taxonomy 的基础版本。
| Harm category | 定义 | 金融零售例子 | 关键监控信号 | 初始处置 |
|---|---|---|---|---|
| Financial loss | AI 直接或间接造成客户资金损失、费用增加、利息损失、错过退款或错误交易 | 支付争议 AI 错误拒绝 provisional credit;RAG 错误告知费用减免条件;财富助手误导客户卖出产品 | 退款失败、费用争议、赔偿请求、appeal upheld、负余额、chargeback reversal | 暂停相关自动拒绝,人工复核,计算损失,纠正账户,补偿费用和利息 |
| Access denial | AI 造成账户、服务、信用、支付、申诉、人工支持或产品访问被不当拒绝 | AML false positive 支持流程把客户锁在资料补交流程;信贷预审 AI 错误拒绝继续申请 | 登录失败、账户限制、拒绝率突增、abandoned journey、人工升级失败、KYC loop | 恢复访问或提供临时通道,人工验证,解除错误限制,记录拒绝原因 |
| Wrong explanation | AI 给出错误、不完整、过度泛化或不可行动的解释,影响客户理解和纠正能力 | 贷款拒绝解释把原因说成“信用评分不足”,实际主因是收入验证缺失;客服 RAG 错引政策 | explanation dispute、客户重复追问、员工覆盖输出、adverse action review fail | 重新生成正式解释,人工校验,纠正客户记录,更新 reason code pipeline |
| Privacy exposure | AI 泄露、暴露、混合、过度收集或不当使用客户个人信息、账户信息或敏感信息 | RAG 答案返回其他客户信息;聊天总结进入错误客户档案;prompt 日志保存未脱敏数据 | DLP alert、客户报告、QA finding、异常检索、跨账户引用、访问日志异常 | 立即隔离数据,通知隐私/安全团队,评估通知义务,删除错误记录,限制检索范围 |
| Discrimination | AI 对受保护属性或代理变量导致不公平拒绝、价格、服务质量、解释或负担差异 | 某语言客户更难到达人工;某邮编贷款解释更模糊;某年龄段财富建议被过度保守 | segment disparity、fair lending review、投诉集中、appeal upheld disparity | 启动公平性分析,冻结高风险规则,人工复核受影响群体,修正特征/阈值/流程 |
| Delay | AI 造成客户请求、争议、投诉、贷款、KYC、AML 或服务恢复延迟 | AI 分类错误把支付争议排到低优先级;文档提取错误导致贷款材料重复等待 | SLA breach、queue aging、duplicate contacts、timeout、journey abandonment | 调整队列优先级,人工清理积压,通知客户新时限,补偿可量化延迟损失 |
| Emotional distress | AI 以冷漠、威胁、错误、反复拒绝或不当语气放大客户压力,尤其在欺诈、丧亲、困难援助场景 | 客户报告欺诈后被 AI 反复要求“再确认交易”;困难援助 chatbot 使用催收式语气 | negative sentiment spike、supervisor escalation、complaint narrative、vulnerable customer flag | 人工 warm handoff,道歉,简化证明材料,主管复核,更新 tone / policy constraints |
| Regulatory complaint | AI 错误引发 CFPB、州监管、金融申诉、仲裁、内审、媒体或外部投诉 | 客户因 chatbot 阻断争议权利向 CFPB 投诉;错误 adverse action explanation 被监管问询 | regulator inquiry、external complaint、legal hold、complaint keyword、executive escalation | 法务合规牵头,冻结证据,完整重建时间线,统一口径,开展同类客户影响评估 |
| Operational burden | AI 把错误成本转嫁给客户或一线员工,要求重复提交、重复解释、重复验证或跨渠道追赶 | 客户上传收入材料后 AI 仍要求重复上传;客服每次都要手动纠错 AI 摘要 | repeat contact、duplicate document upload、manual override、employee correction rate | 减少重复要求,自动复用已验证材料,修正工作流,给一线清晰处置权限 |
3.1 Taxonomy 使用纪律
一个 harm case 可以有多个 category,但必须有一个 primary harm category,用于 SLA、owner 和 executive reporting。分类时不要只看客户最先表达的情绪,而要还原客户旅程中的可验证影响。
推荐字段:
| 字段 | 说明 | 示例 |
|---|---|---|
| primary_harm_category | 主伤害类型 | Financial loss |
| secondary_harm_categories | 次级伤害类型 | Delay, Emotional distress |
| ai_contribution_type | AI 如何参与 | Automated decision, AI-assisted employee, RAG response, model score, workflow routing |
| customer_impact | 对客户造成的实际影响 | 错误拒绝 500 美元争议退款,客户被收取滞纳金 |
| recoverability_status | 是否可恢复 | Fully recoverable, partially recoverable, difficult to restore |
| evidence_status | 证据是否足够 | Complete, partial, inconsistent, missing critical logs |
4. Harm Severity Matrix:按客户影响和恢复难度分级
严重度不是技术团队单方面定义。应由客户影响、影响范围、可恢复性、时间敏感度、脆弱客户、监管暴露和复发风险共同决定。
| Severity | 客户影响 | 影响范围 | 恢复难度 | 处置时限 | 决策层级 |
|---|---|---|---|---|---|
| H0 - Near miss | AI 错误被内部控制拦截,客户未受影响 | 单点或小范围 | 易恢复 | 记录并进入趋势监控 | Product / Ops owner |
| H1 - Low impact | 客户轻微不便、一次性误导、无资金或权益损失 | 个案 | 易恢复 | 1-3 个工作日内处理 | Operations lead |
| H2 - Material inconvenience | 客户被延误、重复提交、错误解释、短期访问受阻或小额费用影响 | 个案或局部群体 | 可恢复但需要人工介入 | 24-48 小时内 triage | Product + Ops + Risk |
| H3 - Significant harm | 资金损失、错误拒绝、隐私暴露、明显群体差异、正式投诉或高价值客户权益受损 | 多客户或高敏个案 | 需要补偿、纠正记录或监管证据 | 当日升级,按小时跟踪 | Incident lead + Legal/Compliance |
| H4 - Critical / systemic | 系统性错误、受保护群体差异、重大隐私暴露、严重资金损失、监管重大问询、媒体风险 | 批量或跨产品 | 恢复复杂,可能需要批量 remediation | 立即启动 crisis protocol | Executive risk committee |
4.1 升级触发器
即使单个客户损失不大,出现以下任一信号也应提高严重度:
- 同一 AI 版本、prompt、retriever、规则或阈值关联多个相似 harm。
- 客户属于 vulnerable customer、老年客户、有限英语能力客户、困难援助、欺诈受害者或受监管保护场景。
- 影响信贷、支付争议、投诉、催收、财富建议、账户冻结或正式通知。
- 客户可能错过法定、合同或机构政策规定的期限。
- 证据链存在缺口,无法复现 AI 输出或人工采纳过程。
- 外部投诉、监管问询、律师函或媒体信号出现。
5. Harm Signal Architecture:从投诉噪音到生产监控
AI harm detection 不能只靠客户明确说“AI 伤害了我”。多数客户不会知道 AI 在何处参与,他们只会说“你们拒绝了我”“一直没人处理”“解释不对”“系统让我重复上传”“客服回答前后矛盾”。因此信号架构必须把明确信号和弱信号统一起来。
Customer / Employee / System signals
-> Signal ingestion
-> Harm normalization
-> AI contribution matching
-> Severity scoring
-> Case creation or incident escalation
-> Recourse workflow
-> Remediation evidence pack
-> KRI dashboard and recurrence monitoring
5.1 必须纳入的信号源
| Signal source | 说明 | 需要捕获的字段 | Harm 价值 |
|---|---|---|---|
| Complaints | 内部投诉、外部投诉、CFPB/监管投诉、社交媒体升级 | product、journey、complaint text、channel、customer segment、AI touchpoint、resolution | 客户伤害最直接的叙述来源 |
| Appeals | 信贷、争议、KYC、费用、账户限制、财富适当性等申诉 | original decision、appeal reason、appeal outcome、upheld flag、reviewer | appeal upheld 是 AI 决策质量和恢复有效性的强信号 |
| Overrides | 员工覆盖 AI 推荐、评分、摘要、分类、话术或 next-best-action | AI output、human action、override reason、employee role、policy citation | 员工长期覆盖同类输出说明 AI 正在制造运营负担 |
| Escalations | 客户或员工升级到主管、二线、合规、法务、执行投诉团队 | escalation reason、prior contacts、handoff time、resolution path | 识别 no-dead-end automation 和高情绪压力场景 |
| Abandoned journeys | 客户在争议、贷款、KYC、投诉、聊天、上传材料中途放弃 | journey step、last AI response、error code、time spent、repeat attempt | 客户未投诉但已经放弃,是隐藏伤害的关键来源 |
| Regulator inquiries | CFPB、州监管、证券/保险监管、内审、外审问询 | inquiry type、affected product、date range、requested evidence、legal hold | 触发证据冻结、口径一致和批量影响评估 |
| Incident tags | 技术事故、数据事故、模型事故、知识库事故、供应商事故标签 | incident id、service、model version、time window、customer cohort | 把技术事故连接到客户影响 |
| QA findings | Contact center QA、model QA、RAG QA、policy QA、fairness QA | sample id、finding type、severity、policy violated、customer impact | 发现低频高影响错误和训练机会 |
| Model telemetry | confidence、uncertainty、retrieval score、tool error、fallback rate、drift、latency | model_id、version、prompt_id、retrieved_docs、score、threshold、output_hash | 把 AI 行为与客户 case 关联,支撑 root cause |
5.2 Harm Event Ledger
成熟组织需要一个 harm event ledger,不一定是独立系统,但必须有统一数据模型。它连接 AI inventory、case management、model telemetry、customer journey、complaints 和 evidence binder。
| 字段组 | 字段 | 设计要点 |
|---|---|---|
| Identity | harm_event_id、case_id、customer_id_token、product、channel、journey_step | 客户标识应 tokenized,满足隐私和最小化访问要求 |
| AI context | ai_system_id、model_id、model_version、prompt_version、retriever_version、policy_rule_id、tool_call_id | 能复现当时 AI 参与方式 |
| Decision/action | original_output、action_taken、human_adopted_flag、override_flag、decision_timestamp | 记录 AI 输出和最终动作的差异 |
| Impact | harm_category、severity、financial_amount、access_impact、privacy_scope、delay_hours、segment_flags | 支撑 severity 和 KRI |
| Recourse | customer_notified_at、review_owner、pause_action、correction_action、compensation_action、restoration_at、explanation_sent_at | 支撑恢复证明 |
| Evidence | transcript_ref、log_ref、data_snapshot_ref、policy_ref、approval_ref、communication_ref、audit_hash | 证据不一定都放在 ledger,但要有引用 |
| Closure | root_cause、control_fix、cohort_reviewed、repeat_monitoring_window、closure_approver、closure_date | 关闭不是工单关闭,而是恢复和复发监控启动 |
5.3 Signal Normalization
同一个伤害会以不同语言出现。标准化层应把自然语言、工单分类和系统事件映射到 harm taxonomy。
| 客户/员工原话 | 标准 harm signal | 可能的 AI contribution |
|---|---|---|
| “你们机器人一直说不能退,但主管说可以。” | Wrong explanation + Financial loss | RAG policy retrieval error |
| “我已经上传三次收入证明了。” | Operational burden + Delay | Document AI extraction failure or workflow state mismatch |
| “系统说我不符合条件,但没有说明怎么改。” | Access denial + Wrong explanation | Eligibility model + insufficient reason code |
| “我没有办法联系真人。” | Access denial + Emotional distress | Chatbot containment policy |
| “我账户被冻结后没人告诉我缺什么材料。” | Access denial + Delay | AML case triage and customer notice failure |
5.4 Architecture Controls
| Control | 目的 | 实现方式 |
|---|---|---|
| AI touchpoint tagging | 知道哪些客户旅程有 AI 参与 | 在 event schema 中加入 ai_system_id、ai_assisted_flag、automation_level |
| Complaint-to-AI matching | 把投诉映射到 AI 版本和流程 | case 时间窗、customer journey id、decision id、model telemetry join |
| Appeal outcome feedback | 把申诉结果回流模型和规则治理 | appeal upheld 进入 eval set、risk review、threshold review |
| Override reason taxonomy | 区分员工纠错、政策例外、客户偏好和 AI 错误 | 强制选择 structured reason,允许补充文本 |
| Abandonment sentinel | 发现客户无声离开 | 高风险 journey 中连续失败、长时间停留、重复进入、上传失败触发 case |
| Regulator-ready evidence freeze | 外部问询时锁定证据 | legal hold、版本快照、日志保留策略、证据访问审计 |
6. Recourse Architecture:Detect, Notify, Pause, Review, Correct, Compensate, Restore, Explain, Monitor
Recourse architecture 是一条端到端恢复链。任何一个环节缺失,客户可能仍然受害,组织也无法证明已经修复。
Detect
-> Notify
-> Pause
-> Review
-> Correct
-> Compensate
-> Restore
-> Explain
-> Monitor recurrence
6.1 Recourse Workflow
| Step | 目标 | 系统动作 | 人工动作 | 证据 |
|---|---|---|---|---|
| Detect | 发现潜在伤害 | 从 complaints、appeals、overrides、telemetry、QA、abandonment 生成 harm event | Triage owner 确认分类和严重度 | signal record、case id、AI context |
| Notify | 告知客户或内部 owner | 生成客户通知、内部 alert、regulatory hold notice | 判断通知内容、渠道、时点和法律要求 | notification copy、send log、approval |
| Pause | 防止伤害扩大 | 暂停自动拒绝、RAG 答案、agent tool、规则或 cohort rollout | Product/Risk 决定 pause scope | feature flag log、change approval |
| Review | 人工复核事实和客户影响 | 拉取 decision packet、transcript、policy、model logs | Reviewer 按政策和客户事实复核 | review checklist、reviewer notes |
| Correct | 更正错误记录、动作或输出 | 更新账户、工单、决策、知识库、reason code、模型配置 | 确认纠正符合业务和合规要求 | correction log、before/after snapshot |
| Compensate | 补偿可量化损失和合理负担 | 计算费用、利息、退款、服务补偿 | 批准补偿金额和例外 | compensation calculation、approval |
| Restore | 恢复客户状态、访问、权益和服务路径 | 解除错误限制、恢复额度、重启流程、优先处理 | 确认客户可以实际使用服务 | restoration timestamp、customer confirmation |
| Explain | 给出可理解、可行动、不过度承诺的解释 | 使用 approved communication template | 人工校验高风险解释和正式通知 | message version、policy citation |
| Monitor recurrence | 证明同类伤害没有继续发生 | KRI dashboard、cohort scan、post-fix eval | Risk/Product 周期复核并关闭 | monitoring report、closure approval |
6.2 Recourse Decision Tree
| 判断问题 | Yes 时动作 | No 时动作 |
|---|---|---|
| 客户是否可能受到资金、权益、访问、隐私或监管影响 | 升级 H2+,创建 harm event 和 recourse case | 记录为低风险质量问题并进入趋势监控 |
| AI 是否参与了输出、排序、拒绝、路由、解释、摘要或员工建议 | 关联 AI system id 和版本 | 按非 AI 客户事件处理,但保留人工确认 |
| 是否仍在继续影响其他客户 | 暂停相关自动化或 cohort rollout | 进入个案恢复和 root cause |
| 是否存在可量化损失 | 计算退款、费用、利息、补偿或权益恢复 | 评估非金钱恢复:解释、道歉、优先处理、记录纠正 |
| 是否涉及脆弱客户、受保护群体、监管投诉或外部问询 | Legal/Compliance/Risk 进入审批链 | Product/Ops 按标准 SLA 处理 |
| 是否能复现 AI 输出和最终动作 | 进入根因和恢复证明 | 启动 evidence gap review,提升控制风险等级 |
6.3 RACI
| Activity | AI PM | Solutions Architect | Ops / CX | Model Risk | Legal / Compliance | Data / Security | Executive Owner |
|---|---|---|---|---|---|---|---|
| Harm taxonomy owner | A | C | R | C | C | C | I |
| Signal architecture | A | R | R | C | C | C | I |
| Severity triage | A | C | R | C | C | I | I |
| Pause / rollback | A | R | C | C | C | C | I / A for H4 |
| Customer review | C | I | R | C | C | I | I |
| Compensation policy | C | I | R | I | A | I | A for high amount |
| Evidence pack | A | R | R | C | C | C | I |
| Executive memo | R | C | C | C | C | I | A |
RACI 解释:R = Responsible,A = Accountable,C = Consulted,I = Informed。不同机构可按三道防线、模型风险政策和业务授权调整。
7. Proving Recovery:如何证明客户已经恢复
“处理完工单”不等于 “customer recovered”。恢复证明必须能回答四个问题:
- 影响范围是否完整识别:哪些客户、哪些交易、哪些渠道、哪些 AI 版本、哪个时间窗。
- 客户状态是否恢复:资金、访问、解释、权益、记录、服务路径是否已经纠正。
- 根因是否修复:模型、prompt、知识库、规则、流程、权限、培训或供应商问题是否已经改正。
- 同类伤害是否停止:修复后监控窗口内 repeat harm、appeal upheld、complaint、override、segment disparity 是否下降到可接受范围。
7.1 Remediation Evidence Pack
| Evidence section | 内容 | 质量要求 |
|---|---|---|
| Event summary | 发生了什么、何时发现、影响哪个产品和流程、严重度 | 一页内可被高管理解,事实和推断分开 |
| AI system context | AI system id、model/prompt/retriever/rule version、automation level、human oversight | 能连接 AI inventory 和 release record |
| Customer impact cohort | 受影响客户清单、筛选逻辑、排除逻辑、抽样验证 | SQL/规则/脚本有版本和审核记录 |
| Timeline | 发生、发现、升级、暂停、通知、复核、纠正、补偿、恢复、关闭时间 | 时间戳来自系统日志或审批记录 |
| Root cause analysis | 技术根因、流程根因、控制缺口、组织责任 | 不把原因停留在“模型错误” |
| Decision packet samples | 原始输出、最终动作、人工采纳/覆盖、政策依据、客户材料 | 保护隐私,使用受控访问 |
| Customer communications | 通知、解释、道歉、正式信函、补偿说明、申诉权利 | 用批准版本,记录发送和客户回应 |
| Financial correction | 退款、费用逆转、利息、补偿、税务或账务影响 | 计算逻辑可复核 |
| Restoration proof | 账户访问、额度、服务状态、投诉状态、KYC/AML 状态、材料状态 | 有 before/after 证据 |
| Control fix | feature flag、rule change、prompt change、knowledge update、model rollback、policy update、training | 关联变更审批和验证结果 |
| Post-fix monitoring | 监控窗口、KRI、复发情况、segment disparity、appeal outcome | 证明同类伤害没有持续发生 |
| Closure approval | Product、Ops、Risk、Compliance、Legal、Executive 的关闭意见 | 高严重度需要明确风险接受或关闭批准 |
7.2 Made Whole 判断
客户恢复不仅是“赔了钱”。不同 harm 需要不同恢复标准。
| Harm | Made whole 标准 |
|---|---|
| Financial loss | 错误费用、利息、罚金、退款、补偿和相关账户记录已纠正;客户不因错误承担后续负面影响 |
| Access denial | 客户可重新访问账户、服务、申诉、人工支持或产品流程;错误限制或拒绝记录已修正 |
| Wrong explanation | 客户收到准确、具体、可行动的解释;正式通知如涉及监管要求需重新审查 |
| Privacy exposure | 暴露范围、通知义务、数据删除/隔离、访问限制和后续监控已完成 |
| Discrimination | 受影响群体被识别并复核;不公平差异被修正;必要时批量纠正和补偿 |
| Delay | 客户请求被优先处理;因延迟产生的损失、费用或错过机会被评估和处理 |
| Emotional distress | 客户获得人工支持、道歉和简化流程;高敏场景由受训人员处理 |
| Regulatory complaint | 外部投诉得到一致、证据充分的回应;内部控制缺口进入整改 |
| Operational burden | 重复提交、重复验证、跨渠道追赶被消除;客户无需再次承担错误成本 |
8. Financial Retail Cases
8.1 Payment Dispute AI:支付争议 AI 错误拒绝
场景:AI 对交易争议进行分类、材料完整性判断、provisional credit 推荐或拒绝路由。模型把“unauthorized transaction”误判为“merchant dispute”,导致客户没有及时获得临时入账,后续产生滞纳金和资金压力。
| 维度 | 设计要点 |
|---|---|
| 可能伤害 | Financial loss、Delay、Wrong explanation、Emotional distress、Regulatory complaint |
| 主要信号 | dispute appeal upheld、客户重复来电、provisional credit reversal、late fee、监管投诉、AI classification override |
| 关键控制 | 高金额、高敏、欺诈关键词、脆弱客户信号进入人工复核;争议类型 AI 分类不得单独决定客户权利;客户材料缺失时给出明确行动清单 |
| Recourse | 暂停同类自动拒绝;人工复核 affected cohort;补发临时入账或退款;逆转费用和利息;发送解释;更新分类 eval set |
| Recovery proof | 受影响交易清单、AI 分类日志、人工复核结果、账户纠正、费用逆转、客户通知、修复后 upheld appeal 下降 |
高级 PM 面试点:支付争议场景的 recourse 不能只让客户“重新提交”。如果 AI 错误导致客户错过或延迟权益,机构应主动识别同类客户并恢复资金状态。
8.2 Lending Explanation AI:信贷解释 AI 给出错误原因
场景:AI 将 credit decision reason 转成客户可读解释。系统把真实主因“income verification incomplete”转成泛化的“credit history insufficient”,客户因此不知道应补交收入材料,也无法有效申诉。
| 维度 | 设计要点 |
|---|---|
| 可能伤害 | Wrong explanation、Access denial、Discrimination、Regulatory complaint、Operational burden |
| 主要信号 | explanation dispute、appeal upheld、call reason “why denied”、不同群体解释清晰度差异、manual reason code correction |
| 关键控制 | reason code pipeline 与正式决策系统绑定;LLM 只能润色 approved reason,不得创造原因;每个解释必须可追溯到实际主要原因 |
| Recourse | 重新出具准确解释;允许客户补正材料或重新审查;检查同一 reason transformation 影响范围;审查 segment disparity |
| Recovery proof | 原始决策理由、AI 生成解释、人工校验、重新通知、申诉结果、reason transformation 修复记录 |
高级 PM 面试点:解释不是“让用户感觉透明”,而是让客户能理解实际原因并采取合理行动。错误解释会把模型风险转化为客户权利损害。
8.3 Customer-Service RAG:客服 RAG 错引政策
场景:客户问信用卡年费减免、困难援助、争议时限或费用规则。RAG 检索到过期政策,回答“不能减免”,但当前政策允许特定条件下减免。客户放弃申请并支付费用。
| 维度 | 设计要点 |
|---|---|
| 可能伤害 | Financial loss、Wrong explanation、Operational burden、Delay |
| 主要信号 | policy QA fail、retrieval source stale、客户重复追问、员工 override、费用争议、abandoned journey |
| 关键控制 | 知识库文档有效期、policy owner、source freshness、citation guardrail、high-impact answer approval;高风险政策答案需要人工或系统 API 验证 |
| Recourse | 识别引用过期政策的会话;主动通知可申请客户;退还错误费用;更新知识库;加 stale source blocker |
| Recovery proof | source document version、conversation list、customer cohort、fee reversal、knowledge update approval、post-fix QA pass |
高级 PM 面试点:RAG 的伤害不只在“幻觉”,也在“看起来有出处但出处过期或不适用”。source freshness 是客户救济设计的一部分。
8.4 Wealth Advisory Assistant:财富助手越界建议
场景:财富管理 APP 的 AI assistant 本应提供教育和产品信息,却根据客户资产和风险偏好建议“可以加仓某高波动基金”。客户理解为机构建议并交易,随后损失。
| 维度 | 设计要点 |
|---|---|
| 可能伤害 | Financial loss、Wrong explanation、Regulatory complaint、Emotional distress |
| 主要信号 | trade after AI interaction、complaint “AI told me to buy”、advisor override、suitability exception、high-risk product query |
| 关键控制 | 教育、销售、建议、下单边界明确;高风险产品、个性化建议和交易动作必须转持牌人员或适当性流程;AI 不得给出具体买卖指令 |
| Recourse | 冻结相关话术;复核交易前 AI 对话;评估客户适当性、披露和损失因果;必要时补偿或交易纠正;更新 policy guardrail |
| Recovery proof | AI conversation、客户 profile、产品风险等级、交易时间线、advisor review、客户沟通、control change |
高级 PM 面试点:财富 AI 的最大风险不是答错定义,而是越过 education / recommendation / advice / execution 的边界,造成客户把 AI 输出当成专业建议。
8.5 AML False Positive Support:AML 误报支持流程伤害客户
场景:交易监控模型标记客户账户异常,客户服务 AI 只能回复“请等待审核”,无法说明需要哪些材料,也无法升级。客户工资入账和账单支付受到影响,反复提交材料仍无法恢复。
| 维度 | 设计要点 |
|---|---|
| 可能伤害 | Access denial、Delay、Operational burden、Emotional distress、Regulatory complaint |
| 主要信号 | account restriction aging、repeat document upload、call escalation、complaint “account frozen”、manual release after review、false positive rate |
| 关键控制 | AML 保密边界与客户可行动解释分离;AI 可说明流程状态、可提交材料和预计时限,但不得泄露敏感监控规则;高影响冻结需要 human case owner |
| Recourse | 人工复核 false positive;给客户明确材料清单和时间线;恢复账户或提供替代通道;检查同类 false positive cohort;优化 triage queue |
| Recovery proof | restriction timeline、customer notice、documents received、human review、release timestamp、repeat false positive monitoring |
高级 PM 面试点:AML 场景要平衡合规保密和客户可恢复性。不能因为不能披露监控规则,就让客户完全不知道如何恢复服务。
9. Artifact Templates
以下模板以“字段 + 规则 + 示例”呈现,便于直接转成 PRD、Confluence、Jira、GRC、case management 或 evidence binder。
9.1 Harm Taxonomy Template
| Field | Rule | Example |
|---|---|---|
| Category code | 使用稳定编号,便于报表和审计 | HARM-FIN-LOSS |
| Category name | 使用客户影响语言,不使用纯技术语言 | Financial loss |
| Definition | 一句话说明何时适用 | AI 造成或放大客户资金、费用、利息、退款或经济权益损失 |
| Included scenarios | 列出 3-7 个业务场景 | 错误费用、错误拒付、错误拒绝退款、错误投资建议、错过补偿 |
| Excluded scenarios | 明确不属于该类的边界 | 只有内部测试错误且未触达客户 |
| Primary signals | 可生产监控的信号 | appeal upheld、fee reversal、complaint amount、payment dispute reopened |
| Initial severity floor | 最低严重度 | H2;涉及批量或监管投诉时 H3+ |
| Recourse owner | 默认 owner | Payments Ops + Product Owner |
| Evidence required | 关闭 case 前需要的证据 | 决策日志、账户更正、补偿计算、客户通知 |
9.2 Harm Severity Matrix Template
| Dimension | H1 | H2 | H3 | H4 |
|---|---|---|---|---|
| Financial impact | 无资金损失或极小金额 | 小额费用、短期资金占用 | 明显损失、错误拒付、利息/罚金 | 批量重大损失或系统性错误 |
| Access impact | 短时不便 | 服务流程受阻 | 账户、信贷、支付或申诉被错误拒绝 | 大规模账户限制或关键服务不可达 |
| Explanation impact | 轻微不清楚 | 客户无法采取正确行动 | 正式通知或权益解释错误 | 批量错误解释或监管关注 |
| Privacy impact | 无敏感暴露 | 内部错放低敏信息 | 客户 PII 暴露或跨客户混淆 | 批量敏感数据暴露 |
| Segment impact | 未见差异 | 局部差异需要复核 | 受保护群体或脆弱客户明显受影响 | 系统性差异或外部投诉 |
| Recovery effort | 单次修正 | 需要人工复核和客户通知 | 需要补偿、批量扫描或合规参与 | 需要 executive response 和专项治理 |
9.3 Recourse Workflow Template
| Workflow field | Rule | Example |
|---|---|---|
| Trigger | 明确哪些信号创建 recourse case | Payment dispute appeal upheld after AI denial |
| Intake owner | 负责首轮分类和严重度 | CX Risk Triage Lead |
| Pause criteria | 何时暂停自动化 | 24 小时内出现 3 个同类 upheld appeals 或单个 H3 case |
| Review packet | 人工复核必须看到的材料 | AI output、policy version、customer documents、decision log、prior contacts |
| Customer action | 客户需要做什么,越少越好 | 不要求客户重复提交已在系统中的材料 |
| Correction action | 机构主动做什么 | Reopen dispute、issue provisional credit、reverse late fee |
| Compensation authority | 谁能批准什么金额或权益恢复 | Ops manager up to policy limit;高额由 Risk/Legal 审批 |
| Closure criteria | case 关闭条件 | 客户账户已更正,通知已发送,post-fix monitoring 已启动 |
9.4 Remediation Evidence Pack Template
| Section | Required content | Acceptance criteria |
|---|---|---|
| Executive summary | harm、scope、root cause、customer recovery、residual risk | 高管 3 分钟能理解决策 |
| Scope methodology | cohort query、时间窗、AI 版本、产品范围 | 可复核、可重复执行、有排除理由 |
| Customer impact table | 客户数、金额、状态、segment、通知状态 | 汇总数与明细一致 |
| Correction ledger | 每项纠正动作和完成时间 | 有系统记录或审批记录 |
| Compensation ledger | 金额、规则、审批、发放状态 | 财务和客户账户可对账 |
| Communication archive | 通知文本、发送渠道、发送时间、失败重试 | 与客户 case 对齐 |
| Control fix evidence | 变更记录、测试、审批、上线时间 | 证明根因已处理 |
| Monitoring results | 修复后 KRI、sample QA、segment review | 能证明复发风险受控 |
9.5 Customer Communication Template
客户沟通要做到准确、克制、可行动、不过度承诺。下面给出一个支付争议 AI 错误分类后的示例文本,正式使用需经 Legal / Compliance / Brand / Accessibility 审查。
我们完成了对您 2026-06-12 提交的交易争议请求的重新审核。此前系统将该请求归类为商户争议,导致处理路径不正确。我们已经更正分类,并按照未授权交易争议流程继续处理。
我们已经在您的账户中完成以下动作:
1. 重新打开争议案件,并由专员复核。
2. 撤销因该处理延迟产生的 35 美元滞纳金。
3. 将案件状态更新为“人工复核中”,预计在 5 个工作日内向您提供下一步结果。
您无需重复提交已经提供的材料。如果您有新的证明文件,可以通过手机银行争议案件页面上传,也可以联系人工专员。我们会在案件页面保留本次更正记录。
沟通控制要点:
- 不把“AI 出错”作为推卸责任的表达。
- 明确已经采取的纠正动作。
- 明确客户是否还需要行动。
- 明确时间线和人工入口。
- 避免承诺尚未完成的补偿或结论。
- 高风险场景使用正式通知和审核流程。
9.6 Executive Risk Memo Template
| Memo section | 内容规则 | 示例表达 |
|---|---|---|
| Decision needed | 管理层需要批准、接受或升级什么 | 批准对 1,248 名客户执行批量费用逆转,并暂停相关 AI 自动分类规则 |
| Harm summary | 用客户影响语言描述 | AI-assisted dispute classifier 将部分未授权交易错误路由为商户争议,造成处理延迟和费用影响 |
| Scope | 客户数、金额、产品、渠道、时间窗 | 影响窗口为 2026-06-01 至 2026-06-18,涉及信用卡争议渠道 |
| Customer recovery | 已恢复和仍在处理的数量 | 1,102 名客户已完成费用逆转,146 名客户进入人工复核 |
| Root cause | 技术、流程、控制共同说明 | 新增 merchant descriptor 特征后未覆盖欺诈关键词回归测试,且高风险争议缺少人工抽样门禁 |
| Risk assessment | 客户、合规、运营、声誉、复发风险 | 当前复发风险已通过规则暂停降低,仍需 14 天 post-fix monitoring |
| Recommendation | 明确下一步 | 执行批量通知、完成补偿、上线分类回归测试门禁、每周向风险委员会报告 |
| Evidence location | 指向证据包 | Evidence binder: AI-HARM-2026-06-PAY-DISPUTE-001 |
10. Metrics / KRIs
AI customer harm 指标必须同时覆盖发生率、恢复质量、速度、公平性和证据质量。只看投诉量会低估隐藏伤害;只看模型准确率会忽略客户影响。
| Metric / KRI | Definition | Why it matters | Typical slice |
|---|---|---|---|
| Harm rate | confirmed harm cases / AI-involved customer journeys | 观察 AI 客户旅程实际伤害率 | product、channel、AI system、version、segment |
| Repeat harm | same customer or same root cause harm recurrence within monitoring window | 判断恢复是否真正有效 | customer、root cause、journey step |
| Appeal upheld rate | appeals reversed or corrected / total appeals for AI-involved decisions | AI 决策或解释错误的强信号 | decision type、segment、reviewer、model version |
| Remediation SLA | cases restored within policy time / total harm cases | 衡量恢复速度 | severity、owner、product |
| Customer notification delay | notification timestamp - harm confirmed timestamp | 伤害确认后通知是否及时 | severity、channel、legal review path |
| Segment disparity | harm, denial, appeal upheld, delay or notification metrics by segment | 检测公平性和脆弱客户影响 | geography、language、age band、income proxy、protected-class proxy where lawful |
| Evidence completeness | evidence sections complete / required evidence sections | 证明恢复和审计 readiness | severity、system、owner |
| Override harm conversion | overrides later linked to confirmed harm / total overrides | 员工纠错是否预示客户伤害 | AI output type、team、policy |
| Abandonment recovery rate | abandoned high-risk journeys contacted or restored / total eligible abandoned journeys | 捕捉未投诉客户 | journey、step、device、language |
| Recourse accessibility | customers reaching human review / customers requesting or needing review | 防止 AI 自助化阻断救济 | channel、language、disability accommodation |
| Compensation accuracy | compensation adjustments without rework / total compensation cases | 衡量补偿计算和账务质量 | harm type、product、approval tier |
| Post-fix recurrence | same harm events after control fix / baseline | 判断根因修复是否有效 | model version、prompt version、rule id |
10.1 KRI Threshold 设计
| KRI | Green | Amber | Red | Action |
|---|---|---|---|---|
| Appeal upheld rate for AI decisions | 稳定低于历史基线 | 连续 2 周上升 | 超过基线 2 倍或高严重度个案出现 | Amber 触发 root cause review;Red 暂停相关自动化 |
| Customer notification delay H3+ | 当日通知或按批准流程执行 | 超过内部目标 | 未经批准延迟或客户先从外部渠道获知 | Red 触发 Legal/Compliance escalation |
| Evidence completeness H3+ | 100% required sections complete | 非关键证据缺失 | 决策日志、客户通知或恢复证明缺失 | Red 禁止关闭事件 |
| Segment disparity in harm rate | 无显著差异或有业务解释 | 差异扩大但样本有限 | 差异稳定存在且无合理解释 | 启动 fairness review 和 cohort remediation |
| Repeat harm | 修复后无复发 | 单点复发 | 同根因多次复发 | 重新打开 incident,升级 owner |
11. Product and Architecture Requirements
11.1 PRD Requirements
| Requirement area | Requirement |
|---|---|
| AI disclosure | 客户在适当时点知道 AI 或 AI-assisted process 参与了回答、路由、建议或决策支持 |
| Recourse entry | 高影响旅程必须提供清晰的人工复核、申诉、投诉或纠错入口 |
| Decision packet | 每个 AI-involved high-impact action 都要生成 decision packet,包含输入、输出、版本、政策依据、人工动作和时间戳 |
| Customer impact tagging | 事件和工单必须标记 potential harm category、severity 和 AI contribution |
| Pause mechanism | Product / Risk 能按 AI system、version、journey、cohort 或 rule 快速暂停相关自动化 |
| Explainability boundary | 客户解释必须来自 approved reason、policy 或 verified source;生成式 AI 不得创造正式理由 |
| Evidence-by-design | 证据在流程中自动产生,并与 case、AI inventory、model telemetry 和 customer communication 关联 |
| Batch remediation | 系统必须支持按时间窗、版本、规则、客户群体识别受影响 cohort,并执行批量恢复 |
| Accessibility | 通知、申诉和人工入口要考虑语言、无障碍、移动端、老年客户和脆弱客户 |
11.2 Solution Architecture Pattern
Channels
mobile / web / contact center / branch / email / regulator portal
AI layer
model / prompt / retriever / rules / agent tools / decision service
Control layer
policy engine / feature flags / human review queue / reason code service / consent and disclosure
Signal layer
complaints / appeals / overrides / escalations / abandoned journeys / QA / telemetry / regulator inquiries
Harm intelligence layer
harm event ledger / severity scoring / cohort detection / root cause taxonomy / KRI dashboard
Recourse operations
case management / customer communication / correction / compensation / restoration / evidence binder
Governance
AI inventory / release gates / model risk / compliance approval / audit / executive reporting
11.3 Integration Points
| Integration | Purpose | Risk if missing |
|---|---|---|
| AI inventory to case management | 知道哪个 AI 系统参与了客户 case | 只能看到工单,看不到 AI 版本和责任系统 |
| Model telemetry to complaint data | 把客户叙述连接到 AI 输出 | 投诉趋势无法驱动模型和知识库修复 |
| Decision service to evidence binder | 保存决策包和恢复证据 | 监管问询时无法复现 |
| Feature flag to incident workflow | 快速暂停或回滚高风险自动化 | 发现伤害后仍继续影响客户 |
| Compensation engine to case closure | 确认补偿已实际入账 | 工单关闭但客户资金未恢复 |
| Customer communication archive to legal hold | 保留对客户说了什么 | 外部投诉时口径无法证明 |
12. Operating Model
12.1 Three Lines of Defense
| Line | Role in AI customer harm |
|---|---|
| First line: Business / Product / Operations | 设计 recourse、处理客户恢复、运行控制、监控 KRI、维护证据 |
| Second line: Risk / Compliance / Model Risk / Privacy / Fair Lending | 设定政策、挑战设计、审查高风险事件、监督公平性和监管响应 |
| Third line: Internal Audit | 独立评估 harm management framework、控制设计、运行有效性和证据质量 |
12.2 Governance Cadence
| Cadence | Meeting | Inputs | Outputs |
|---|---|---|---|
| Daily for H3/H4 | Harm incident standup | New cases、pause status、customer recovery、evidence gaps | action owner、deadline、customer communication decision |
| Weekly | AI harm review | KRI dashboard、appeals、overrides、complaints、QA findings | root cause backlog、control changes、training needs |
| Monthly | Product risk committee | trend、segment disparity、recourse SLA、evidence completeness | risk acceptance、roadmap priority、policy updates |
| Quarterly | Executive governance | systemic themes、regulatory inquiries、material remediation | investment decision、risk appetite update、audit readiness |
12.3 Root Cause Taxonomy
| Root cause | Examples | Fix pattern |
|---|---|---|
| Model behavior | misclassification、calibration failure、drift、insufficient eval | retraining、threshold change、eval expansion、human gate |
| Retrieval / knowledge | stale source、wrong document、missing citation、policy ambiguity | content governance、source freshness、retrieval filter、policy owner sign-off |
| Prompt / agent design | overconfident tone、unsafe tool use、hidden escalation | prompt policy、tool permission、refusal and handoff state machine |
| Workflow design | no appeal path、bad queue priority、duplicate document request | service blueprint redesign、case routing、state synchronization |
| Data quality | wrong customer record、missing data、identity merge issue | data correction、lineage control、quality monitoring |
| Human adoption | employee over-relies on AI、fails to review | training、UI friction、review checklist、supervisor sampling |
| Policy / governance | unclear owner、weak approval、no pause criteria | RACI、release gate、risk appetite、control library |
| Vendor / third party | model change、API behavior change、missing logs | vendor SLA、change notification、contractual evidence rights |
13. Interview Section
Question: How do you design customer recourse for AI failures?
30-second answer
我会先把 AI failure 从“模型答错”改定义为“错误动作 + 客户影响 + 弱恢复路径”。设计 recourse 时,我会在客户旅程中预埋 detect、notify、pause、review、correct、compensate、restore、explain 和 monitor recurrence。也就是说,高风险 AI 决策必须可申诉、可人工复核、可暂停、可纠正,并且每一步都有证据。最后我会用 harm rate、appeal upheld、remediation SLA、notification delay、segment disparity 和 evidence completeness 来证明客户已恢复、根因已修复、同类伤害没有继续发生。
2-minute answer
我不会把 AI recourse 设计成客服 FAQ 或“联系人工”按钮。金融零售场景里,AI 可能影响支付争议、信贷解释、账户限制、AML false positive、财富建议和投诉处理,所以 recourse 必须是产品架构和运营控制。
第一步是 harm taxonomy。我要定义 financial loss、access denial、wrong explanation、privacy exposure、discrimination、delay、emotional distress、regulatory complaint 和 operational burden,并给每类定义 severity、SLA、owner 和 evidence。
第二步是 signal architecture。客户通常不知道 AI 参与了哪里,所以不能只靠投诉。我会把 complaints、appeals、overrides、escalations、abandoned journeys、regulator inquiries、incident tags、QA findings 和 model telemetry 接到 harm event ledger,关联 AI system、model version、prompt version、journey step 和客户影响。
第三步是 recourse workflow。发现潜在伤害后,要通知客户或内部 owner,暂停可能继续伤害的自动化,人工复核事实,纠正账户或决策,补偿资金损失,恢复访问或权益,给出准确解释,并在修复后监控复发。
第四步是证明恢复。每个高严重度 case 都要有 remediation evidence pack,包括影响范围、时间线、决策日志、客户沟通、纠正记录、补偿计算、控制修复和 post-fix monitoring。我的成功标准不是“工单关闭”,而是客户 made whole、同类客户被识别、根因被修复、证据可审计。
如果面试官追问落地,我会举支付争议 AI 的例子:一旦 appeal upheld 或同类投诉上升,我会暂停自动拒绝,批量找出同一模型版本影响的争议案件,人工复核,补发 provisional credit 或退费,通知客户,并把错误样本加入 eval 和 release gate。
14. Portfolio Exercise
Exercise: Design an AI Customer Harm Recourse System for a Retail Bank
背景:一家零售银行上线了三个客户可见 AI 能力:
- 支付争议 AI:自动分类争议类型并推荐处理路径。
- 信贷解释 AI:把拒贷或提额失败原因转成客户可读解释。
- 客服 RAG:回答账户、费用、困难援助和争议流程问题。
最近 30 天出现以下信号:
- 支付争议 appeal upheld rate 从 8% 上升到 19%。
- 信贷解释相关投诉中,“解释不清楚”和“原因不对”增加。
- 客服 RAG 在年费减免政策上出现过期引用。
- 有 2 个 CFPB 投诉提到 “chatbot would not let me talk to a person”。
- Contact center 员工覆盖 AI 摘要和建议的比例上升。
14.1 Deliverables
| Deliverable | 产出要求 |
|---|---|
| Harm taxonomy | 至少覆盖 9 类 harm,并标出每类信号、severity floor、recourse owner |
| Signal architecture | 画出 complaints、appeals、overrides、abandoned journeys、QA、telemetry 到 harm ledger 的数据流 |
| Severity matrix | 定义 H0-H4,说明升级触发器和管理层参与条件 |
| Recourse workflow | 针对支付争议 AI 写出 detect-to-monitor 的端到端流程 |
| Remediation evidence pack | 为一个 H3 事件列出证据目录、owner、质量标准 |
| Metrics dashboard | 定义 harm rate、repeat harm、appeal upheld、remediation SLA、notification delay、segment disparity、evidence completeness |
| Executive memo | 写一页管理层决策 memo,建议是否暂停自动争议分类和是否批量补偿 |
14.2 Evaluation Rubric
| Level | 标准 |
|---|---|
| Basic | 能列出 AI 错误和客服处理路径,但缺少客户影响、证据和批量恢复 |
| Strong | 能按 harm taxonomy、severity、recourse workflow 和 KRI 组织方案 |
| Advanced | 能连接 AI inventory、model telemetry、complaints、appeals、evidence binder 和 governance;能说明如何证明客户 made whole |
| Executive-ready | 能做出暂停、补偿、客户通知、监管准备和长期控制投资的管理层建议 |
15. Checklist
15.1 Use Case Intake
- AI 是否参与客户可见回答、排序、拒绝、建议、解释、路由、摘要或员工决策支持。
- 客户是否可能受到资金、访问、解释、隐私、公平性、时间、情绪、监管或运营负担影响。
- 是否定义了 harm taxonomy、severity floor、recourse owner 和 SLA。
- 是否识别高风险客户群体、语言、渠道、产品和脆弱客户。
- 是否有人工复核、申诉、投诉、暂停和回滚路径。
- 是否明确哪些 AI 输出不能作为正式通知、建议或拒绝理由。
15.2 Pre-Launch Gate
- AI inventory 已登记 system id、owner、model/prompt/retriever/rule version 和 automation level。
- Decision packet schema 已定义并在测试中生成。
- Customer communication 已经 Legal / Compliance / Brand / Accessibility 审查。
- Harm signals 已接入 complaints、appeals、overrides、escalations、abandoned journeys、QA 和 telemetry。
- Pause criteria 和 feature flag / rollback 机制已经演练。
- 高风险场景已完成 fairness、privacy、security、model risk 和 operational readiness review。
- Evidence pack 的证据来源、保留期限和访问权限已确认。
15.3 Production Monitoring
- 每周查看 harm rate、appeal upheld、override rate、abandonment、repeat contact 和 QA findings。
- 每月按 segment 查看 denial、delay、appeal upheld、notification delay 和 remediation SLA。
- 每次 model、prompt、retriever、knowledge base、policy 或 workflow 变更后比较 post-change harm signal。
- 外部投诉和监管问询进入 harm ledger,并关联 AI touchpoint。
- H3/H4 case 有每日恢复跟踪和 evidence gap review。
15.4 Remediation Closure
- 影响客户 cohort 已完整识别,筛选逻辑已复核。
- 客户资金、访问、权益、记录、解释或服务路径已恢复。
- 补偿计算、审批和入账已完成并可对账。
- 客户通知已发送,失败发送有重试或替代渠道记录。
- 根因控制已修复,并通过测试或生产监控验证。
- Segment disparity 已检查并记录结论。
- Evidence completeness 达到关闭标准。
- Repeat harm monitoring window 已启动并有 owner。
- 高严重度事件由指定 Product / Risk / Compliance / Legal / Executive owner 批准关闭。
15.5 Red Flags
- 团队说“这是模型误差,不是客户伤害”,但客户已经被拒绝、延误、收费或误导。
- 投诉下降,但 abandoned journeys、repeat contact 或 external complaints 上升。
- 人工入口存在,但客户需要多轮 chatbot 失败后才能找到。
- 员工大量 override AI,却没有结构化 reason 和 root cause review。
- AI 生成解释无法追溯到正式决策理由或政策来源。
- 修复只改 prompt,没有识别受影响客户和补偿。
- 工单关闭,但客户账户、费用、限制、正式记录或服务路径没有恢复。
- 证据包只有会议纪要和截图,没有系统日志、版本、时间线、客户通知和纠正记录。
16. Final Operating View
AI customer harm management 的成熟状态不是“AI 很少出错”,而是组织能持续证明:
We know where AI touches customers.
We know what harm can occur.
We detect harm from multiple signals.
We give customers reachable recourse.
We pause harmful automation quickly.
We review and correct with evidence.
We compensate and restore customers proportionately.
We explain in a way customers can act on.
We monitor recurrence and segment disparity.
We can prove recovery to customers, executives, auditors and regulators.
对 CBAP+、AI PM、AI Product Architect、Customer Experience Risk Lead 和 Solutions Architect 来说,这就是从“做一个 AI 功能”升级为“经营一个可信、可恢复、可审计的 AI 客户影响系统”。