返回 Papers
AI 扩展计划 / Playbooks

AI Customer Harm / Recourse / Remediation Playbook

重要说明:本文是学习、作品集和内部治理训练材料,不构成法律意见、合规结论、审计意见、模型验证报告、监管解释或赔偿建议。正式项目必须由 Legal、Compliance、Risk、Model Risk、Fair Lending、Privacy、Security、Accessibility、Operations、Business Owner、Technology Owner 和管理层结合机构类型、司法

779AI_CUSTOMER_HARM_RECOURSE_REMEDIATION_PLAYBOOK.md

AI Customer Harm / Recourse / Remediation Playbook

定位:面向 CBAP+、AI Product Manager、AI Product Architect、Customer Experience Risk Lead、Solutions Architect、Model Risk、Compliance、Operations、Digital Banking、Lending、Payments、Wealth、AML/KYC 团队的高级实战手册。本文关注的不是普通客服话术,而是金融零售 AI 系统造成或放大的客户伤害如何被识别、分类、监控、补救、恢复和证明已经恢复。目标是把 customer harm 从“客户投诉后个案处理”升级为可治理、可度量、可追溯、可审计、可复盘的产品与架构能力。

重要说明:本文是学习、作品集和内部治理训练材料,不构成法律意见、合规结论、审计意见、模型验证报告、监管解释或赔偿建议。正式项目必须由 Legal、Compliance、Risk、Model Risk、Fair Lending、Privacy、Security、Accessibility、Operations、Business Owner、Technology Owner 和管理层结合机构类型、司法辖区、产品范围、客户群体、合同义务和内部政策确认。访问日期按 2026-06-30 记录。


Source Anchors

以下官方来源作为本文的设计锚点。本文把这些来源转成产品需求、流程控制、运行监控、客户救济、证据包和管理层决策语言,不把任何来源简化为单一检查表。

AnchorOfficial link本 playbook 的使用方式
NIST AI Risk Management Frameworkhttps://www.nist.gov/itl/ai-risk-management-framework用 Govern / Map / Measure / Manage 组织 AI customer harm 的治理、场景映射、指标测量、处置闭环和持续改进。NIST 页面显示 AI RMF 1.0 正在修订,正式项目应跟踪版本变化。
NIST AI RMF Generative AI Profilehttps://www.nist.gov/itl/ai-risk-management-framework/generative-artificial-intelligence-profilehttps://www.nist.gov/publications/artificial-intelligence-risk-management-framework-generative-artificial-intelligence用户给出的 NIST GenAI Profile 路径在 2026-06-30 访问时返回 404;当前可访问的 NIST 官方 publication 页面用于 GenAI 风险锚点。本文用它处理 hallucination、信息完整性、over-reliance、content provenance、third-party dependency、abuse、incident response 和 evidence。
EU AI Act: Regulation (EU) 2024/1689https://eur-lex.europa.eu/eli/reg/2024/1689/oj用于理解 AI 系统风险分层、透明度、高风险系统、post-market monitoring、serious incident、deployer / provider responsibility、记录和客户影响治理。正式适用性由 Legal / Compliance 判断。
CFPB Consumer Complaint Databasehttps://www.consumerfinance.gov/data-research/consumer-complaints/用作 consumer harm signal 的外部参照:投诉主题、公司响应、趋势、产品类别和客户叙述可以反向校准内部 complaint taxonomy、root cause 分类和 remediation proof。
FTC Business Blog: Keep your AI claims in checkhttps://www.ftc.gov/business-guidance/blog/2023/02/keep-your-ai-claims-check用于 AI 产品声明、营销承诺、效果证明和 customer communication 的边界:不要把 AI 能力说成无证据承诺,不要用“AI”掩盖真实限制、错误概率或专业服务边界。

Source-to-artifact mapping:

Source lens需要落到的 artifact面试表达
NIST AI RMFAI harm risk register、harm KRI dashboard、control library、release gate、incident review“我用 Govern / Map / Measure / Manage 管理客户伤害,而不是只看模型准确率。”
NIST GenAI ProfileRAG harm taxonomy、hallucination impact matrix、content provenance evidence、prompt / retrieval change log“生成式 AI 的风险不是回答错一句话,而是错信息进入客户旅程后是否造成权益、资金、隐私或解释损害。”
EU AI ActAI inventory、risk tier、post-market monitoring plan、serious incident escalation、deployer evidence“我会把客户影响、自动化程度、人类监督和生产监控作为 AI 系统适用性事实基础。”
CFPB complaintsComplaint taxonomy、recourse trigger、trend monitoring、external complaint reconciliation“投诉不是客服噪音,而是 harm detection 的生产信号。”
FTC AI claims guidanceAI claims review、customer notice、marketing substantiation file、communication control“如果产品说 AI 能解决、判断或建议,就要能证明能力边界和恢复路径。”

1. 核心心智模型:AI Customer Harm 不是只有模型错误

金融零售 AI 的 customer harm 不能只定义为 model error。一个模型输出错误但没有进入客户决策,可能只是质量问题;一个看似“部分正确”的输出如果让客户错过争议期限、被错误拒绝、被迫重复提交材料、泄露隐私或无法获得人工帮助,就是客户伤害。

本文使用一个更适合产品、架构和运营团队的公式:

AI Customer Harm =
Wrong action
+ Customer impact
+ Weak recovery path

解释:

  • Wrong action:AI 系统、AI 辅助员工、自动化策略、RAG 答案、评分模型、建议引擎或工作流采取了错误、误导、不完整、不公平、过度自信、过度延迟或无权限的动作。
  • Customer impact:客户受到资金、访问、权益、解释、隐私、时间、情绪、合规、声誉或运营负担影响。
  • Weak recovery path:客户不知道如何申诉,人工入口不可达,审核材料缺失,纠正太慢,补偿不足,解释不清,问题重复发生,组织无法证明已经恢复。

因此,高级 AI PM / Architect 不能只问:

模型准不准?

而要问:

AI 的输出进入了哪个客户旅程?
它改变了什么动作、承诺、排序、拒绝、建议、通知或服务路径?
客户最坏会损失什么?
客户如何发现、质疑、暂停、升级、纠正和获得补偿?
我们如何证明影响范围已经识别、客户已经恢复、根因已经修复、同类伤害没有继续发生?

1.1 三层伤害栈

层级问题典型失败
AI behavior layer模型、prompt、检索、规则、阈值、agent tool use 是否产生错误行为幻觉、错误解释、错误分类、过度拒绝、错误路由、过期知识、prompt injection、工具调用失败
Customer journey layer错误行为进入哪个客户触点和流程客户被拒绝、错过期限、收到错误建议、无法联系人工、被重复要求提交材料
Recovery layer伤害发生后客户和组织如何恢复无申诉入口、case owner 不清、日志不完整、没有补偿机制、无法批量找出受影响客户

高级判断的关键:很多组织只修第一层,把 prompt 改了、模型换了、阈值调了,却没有处理第二层和第三层。客户伤害管理必须同时修正 AI behavior、customer journey 和 recovery path。

1.2 Customer harm 与 incident 的区别

维度普通 AI incidentAI customer harm
判断中心系统是否异常客户是否受到实际或合理可预见的影响
触发来源监控报警、模型漂移、服务故障、安全事件投诉、申诉、拒绝、损失、延迟、隐私暴露、监管问询、群体差异
处置目标恢复系统稳定恢复客户状态、权益、资金、解释、信任和证据
成功标准服务可用、错误率下降客户 made whole、原因可解释、影响范围完整、同类伤害停止
证据要求技术日志、变更记录、报警记录再叠加客户通知、个案审核、补偿记录、申诉结果、群体公平性和复发监控

1.3 Recourse 是产品能力,不是售后动作

Recourse 指客户能够质疑、申诉、纠正、获得人工审核、恢复权益、获得补偿或获得清晰解释的制度化路径。成熟的 recourse 不依赖某个客服是否有经验,而是被嵌入:

  • Journey design:客户在关键节点能看到申诉、人工、解释和暂停入口。
  • Decision architecture:每个 AI-assisted decision 都能关联理由、证据、版本和责任人。
  • Case management:客户申诉进入统一 case,不在聊天记录、邮件和工单之间丢失。
  • Operational policy:不同 harm severity 有明确 SLA、审批和补偿权限。
  • Evidence capture:客户恢复所需的事实、日志、通知、审核和纠正动作自动沉淀。
  • Monitoring:补救后继续看 repeat harm、segment disparity 和 recurring root cause。

2. 设计原则:从“支持客户”升级为“恢复客户”

原则实战含义反模式
Impact-first先按客户影响分级,再按模型错误类型分析只按技术严重程度排队,忽略客户权益和资金影响
Recoverability by design高影响 AI 动作必须默认可质疑、可暂停、可撤销或可人工复核上线后才想如何申诉和赔偿
No dead-end automationAI 不得把客户困在无法完成任务、无法找人、无法申诉的自助循环Chatbot 反复回答同一句,隐藏人工入口
Explain what matters解释要服务于客户行动和权利,不是展示技术细节给出一堆特征权重,但客户仍不知道如何纠正
Evidence at source证据在流程运行时生成,不靠事故后拼截图事后手动整理聊天记录、日志和审批邮件
Segment-aware recovery监控不同客户群、语言、渠道、地区、产品和脆弱客户的伤害差异平均指标达标但弱势群体持续受害
Proportionate compensation补偿与损失、延迟、错误拒绝、客户负担和监管风险相匹配只道歉不纠正资金或权益
Closed-loop learning每个 harm case 都要进入 root cause、eval、知识库、流程和控制改进个案处理完即关闭,没有系统性学习

2.1 AI PM 的关键转向

传统客服项目常以 deflection rate、AHT、cost-to-serve、CSAT 衡量成功。AI customer harm 管理要求把目标改成:

  • 客户是否获得正确行动,而不仅是得到快速回答。
  • 错误是否被快速发现,而不仅是投诉数量下降。
  • 人工入口是否在高风险场景可达,而不是被自助化吞掉。
  • 补救是否恢复客户状态,而不是只关闭工单。
  • 证据是否能经受审计,而不是只满足内部复盘。

3. Harm Taxonomy:客户伤害分类法

分类法必须服务于三件事:生产识别、处置优先级和证据证明。下面分类可作为金融零售 AI harm taxonomy 的基础版本。

Harm category定义金融零售例子关键监控信号初始处置
Financial lossAI 直接或间接造成客户资金损失、费用增加、利息损失、错过退款或错误交易支付争议 AI 错误拒绝 provisional credit;RAG 错误告知费用减免条件;财富助手误导客户卖出产品退款失败、费用争议、赔偿请求、appeal upheld、负余额、chargeback reversal暂停相关自动拒绝,人工复核,计算损失,纠正账户,补偿费用和利息
Access denialAI 造成账户、服务、信用、支付、申诉、人工支持或产品访问被不当拒绝AML false positive 支持流程把客户锁在资料补交流程;信贷预审 AI 错误拒绝继续申请登录失败、账户限制、拒绝率突增、abandoned journey、人工升级失败、KYC loop恢复访问或提供临时通道,人工验证,解除错误限制,记录拒绝原因
Wrong explanationAI 给出错误、不完整、过度泛化或不可行动的解释,影响客户理解和纠正能力贷款拒绝解释把原因说成“信用评分不足”,实际主因是收入验证缺失;客服 RAG 错引政策explanation dispute、客户重复追问、员工覆盖输出、adverse action review fail重新生成正式解释,人工校验,纠正客户记录,更新 reason code pipeline
Privacy exposureAI 泄露、暴露、混合、过度收集或不当使用客户个人信息、账户信息或敏感信息RAG 答案返回其他客户信息;聊天总结进入错误客户档案;prompt 日志保存未脱敏数据DLP alert、客户报告、QA finding、异常检索、跨账户引用、访问日志异常立即隔离数据,通知隐私/安全团队,评估通知义务,删除错误记录,限制检索范围
DiscriminationAI 对受保护属性或代理变量导致不公平拒绝、价格、服务质量、解释或负担差异某语言客户更难到达人工;某邮编贷款解释更模糊;某年龄段财富建议被过度保守segment disparity、fair lending review、投诉集中、appeal upheld disparity启动公平性分析,冻结高风险规则,人工复核受影响群体,修正特征/阈值/流程
DelayAI 造成客户请求、争议、投诉、贷款、KYC、AML 或服务恢复延迟AI 分类错误把支付争议排到低优先级;文档提取错误导致贷款材料重复等待SLA breach、queue aging、duplicate contacts、timeout、journey abandonment调整队列优先级,人工清理积压,通知客户新时限,补偿可量化延迟损失
Emotional distressAI 以冷漠、威胁、错误、反复拒绝或不当语气放大客户压力,尤其在欺诈、丧亲、困难援助场景客户报告欺诈后被 AI 反复要求“再确认交易”;困难援助 chatbot 使用催收式语气negative sentiment spike、supervisor escalation、complaint narrative、vulnerable customer flag人工 warm handoff,道歉,简化证明材料,主管复核,更新 tone / policy constraints
Regulatory complaintAI 错误引发 CFPB、州监管、金融申诉、仲裁、内审、媒体或外部投诉客户因 chatbot 阻断争议权利向 CFPB 投诉;错误 adverse action explanation 被监管问询regulator inquiry、external complaint、legal hold、complaint keyword、executive escalation法务合规牵头,冻结证据,完整重建时间线,统一口径,开展同类客户影响评估
Operational burdenAI 把错误成本转嫁给客户或一线员工,要求重复提交、重复解释、重复验证或跨渠道追赶客户上传收入材料后 AI 仍要求重复上传;客服每次都要手动纠错 AI 摘要repeat contact、duplicate document upload、manual override、employee correction rate减少重复要求,自动复用已验证材料,修正工作流,给一线清晰处置权限

3.1 Taxonomy 使用纪律

一个 harm case 可以有多个 category,但必须有一个 primary harm category,用于 SLA、owner 和 executive reporting。分类时不要只看客户最先表达的情绪,而要还原客户旅程中的可验证影响。

推荐字段:

字段说明示例
primary_harm_category主伤害类型Financial loss
secondary_harm_categories次级伤害类型Delay, Emotional distress
ai_contribution_typeAI 如何参与Automated decision, AI-assisted employee, RAG response, model score, workflow routing
customer_impact对客户造成的实际影响错误拒绝 500 美元争议退款,客户被收取滞纳金
recoverability_status是否可恢复Fully recoverable, partially recoverable, difficult to restore
evidence_status证据是否足够Complete, partial, inconsistent, missing critical logs

4. Harm Severity Matrix:按客户影响和恢复难度分级

严重度不是技术团队单方面定义。应由客户影响、影响范围、可恢复性、时间敏感度、脆弱客户、监管暴露和复发风险共同决定。

Severity客户影响影响范围恢复难度处置时限决策层级
H0 - Near missAI 错误被内部控制拦截,客户未受影响单点或小范围易恢复记录并进入趋势监控Product / Ops owner
H1 - Low impact客户轻微不便、一次性误导、无资金或权益损失个案易恢复1-3 个工作日内处理Operations lead
H2 - Material inconvenience客户被延误、重复提交、错误解释、短期访问受阻或小额费用影响个案或局部群体可恢复但需要人工介入24-48 小时内 triageProduct + Ops + Risk
H3 - Significant harm资金损失、错误拒绝、隐私暴露、明显群体差异、正式投诉或高价值客户权益受损多客户或高敏个案需要补偿、纠正记录或监管证据当日升级,按小时跟踪Incident lead + Legal/Compliance
H4 - Critical / systemic系统性错误、受保护群体差异、重大隐私暴露、严重资金损失、监管重大问询、媒体风险批量或跨产品恢复复杂,可能需要批量 remediation立即启动 crisis protocolExecutive risk committee

4.1 升级触发器

即使单个客户损失不大,出现以下任一信号也应提高严重度:

  • 同一 AI 版本、prompt、retriever、规则或阈值关联多个相似 harm。
  • 客户属于 vulnerable customer、老年客户、有限英语能力客户、困难援助、欺诈受害者或受监管保护场景。
  • 影响信贷、支付争议、投诉、催收、财富建议、账户冻结或正式通知。
  • 客户可能错过法定、合同或机构政策规定的期限。
  • 证据链存在缺口,无法复现 AI 输出或人工采纳过程。
  • 外部投诉、监管问询、律师函或媒体信号出现。

5. Harm Signal Architecture:从投诉噪音到生产监控

AI harm detection 不能只靠客户明确说“AI 伤害了我”。多数客户不会知道 AI 在何处参与,他们只会说“你们拒绝了我”“一直没人处理”“解释不对”“系统让我重复上传”“客服回答前后矛盾”。因此信号架构必须把明确信号和弱信号统一起来。

Customer / Employee / System signals
-> Signal ingestion
-> Harm normalization
-> AI contribution matching
-> Severity scoring
-> Case creation or incident escalation
-> Recourse workflow
-> Remediation evidence pack
-> KRI dashboard and recurrence monitoring

5.1 必须纳入的信号源

Signal source说明需要捕获的字段Harm 价值
Complaints内部投诉、外部投诉、CFPB/监管投诉、社交媒体升级product、journey、complaint text、channel、customer segment、AI touchpoint、resolution客户伤害最直接的叙述来源
Appeals信贷、争议、KYC、费用、账户限制、财富适当性等申诉original decision、appeal reason、appeal outcome、upheld flag、reviewerappeal upheld 是 AI 决策质量和恢复有效性的强信号
Overrides员工覆盖 AI 推荐、评分、摘要、分类、话术或 next-best-actionAI output、human action、override reason、employee role、policy citation员工长期覆盖同类输出说明 AI 正在制造运营负担
Escalations客户或员工升级到主管、二线、合规、法务、执行投诉团队escalation reason、prior contacts、handoff time、resolution path识别 no-dead-end automation 和高情绪压力场景
Abandoned journeys客户在争议、贷款、KYC、投诉、聊天、上传材料中途放弃journey step、last AI response、error code、time spent、repeat attempt客户未投诉但已经放弃,是隐藏伤害的关键来源
Regulator inquiriesCFPB、州监管、证券/保险监管、内审、外审问询inquiry type、affected product、date range、requested evidence、legal hold触发证据冻结、口径一致和批量影响评估
Incident tags技术事故、数据事故、模型事故、知识库事故、供应商事故标签incident id、service、model version、time window、customer cohort把技术事故连接到客户影响
QA findingsContact center QA、model QA、RAG QA、policy QA、fairness QAsample id、finding type、severity、policy violated、customer impact发现低频高影响错误和训练机会
Model telemetryconfidence、uncertainty、retrieval score、tool error、fallback rate、drift、latencymodel_id、version、prompt_id、retrieved_docs、score、threshold、output_hash把 AI 行为与客户 case 关联,支撑 root cause

5.2 Harm Event Ledger

成熟组织需要一个 harm event ledger,不一定是独立系统,但必须有统一数据模型。它连接 AI inventory、case management、model telemetry、customer journey、complaints 和 evidence binder。

字段组字段设计要点
Identityharm_event_id、case_id、customer_id_token、product、channel、journey_step客户标识应 tokenized,满足隐私和最小化访问要求
AI contextai_system_id、model_id、model_version、prompt_version、retriever_version、policy_rule_id、tool_call_id能复现当时 AI 参与方式
Decision/actionoriginal_output、action_taken、human_adopted_flag、override_flag、decision_timestamp记录 AI 输出和最终动作的差异
Impactharm_category、severity、financial_amount、access_impact、privacy_scope、delay_hours、segment_flags支撑 severity 和 KRI
Recoursecustomer_notified_at、review_owner、pause_action、correction_action、compensation_action、restoration_at、explanation_sent_at支撑恢复证明
Evidencetranscript_ref、log_ref、data_snapshot_ref、policy_ref、approval_ref、communication_ref、audit_hash证据不一定都放在 ledger,但要有引用
Closureroot_cause、control_fix、cohort_reviewed、repeat_monitoring_window、closure_approver、closure_date关闭不是工单关闭,而是恢复和复发监控启动

5.3 Signal Normalization

同一个伤害会以不同语言出现。标准化层应把自然语言、工单分类和系统事件映射到 harm taxonomy。

客户/员工原话标准 harm signal可能的 AI contribution
“你们机器人一直说不能退,但主管说可以。”Wrong explanation + Financial lossRAG policy retrieval error
“我已经上传三次收入证明了。”Operational burden + DelayDocument AI extraction failure or workflow state mismatch
“系统说我不符合条件,但没有说明怎么改。”Access denial + Wrong explanationEligibility model + insufficient reason code
“我没有办法联系真人。”Access denial + Emotional distressChatbot containment policy
“我账户被冻结后没人告诉我缺什么材料。”Access denial + DelayAML case triage and customer notice failure

5.4 Architecture Controls

Control目的实现方式
AI touchpoint tagging知道哪些客户旅程有 AI 参与在 event schema 中加入 ai_system_id、ai_assisted_flag、automation_level
Complaint-to-AI matching把投诉映射到 AI 版本和流程case 时间窗、customer journey id、decision id、model telemetry join
Appeal outcome feedback把申诉结果回流模型和规则治理appeal upheld 进入 eval set、risk review、threshold review
Override reason taxonomy区分员工纠错、政策例外、客户偏好和 AI 错误强制选择 structured reason,允许补充文本
Abandonment sentinel发现客户无声离开高风险 journey 中连续失败、长时间停留、重复进入、上传失败触发 case
Regulator-ready evidence freeze外部问询时锁定证据legal hold、版本快照、日志保留策略、证据访问审计

6. Recourse Architecture:Detect, Notify, Pause, Review, Correct, Compensate, Restore, Explain, Monitor

Recourse architecture 是一条端到端恢复链。任何一个环节缺失,客户可能仍然受害,组织也无法证明已经修复。

Detect
-> Notify
-> Pause
-> Review
-> Correct
-> Compensate
-> Restore
-> Explain
-> Monitor recurrence

6.1 Recourse Workflow

Step目标系统动作人工动作证据
Detect发现潜在伤害从 complaints、appeals、overrides、telemetry、QA、abandonment 生成 harm eventTriage owner 确认分类和严重度signal record、case id、AI context
Notify告知客户或内部 owner生成客户通知、内部 alert、regulatory hold notice判断通知内容、渠道、时点和法律要求notification copy、send log、approval
Pause防止伤害扩大暂停自动拒绝、RAG 答案、agent tool、规则或 cohort rolloutProduct/Risk 决定 pause scopefeature flag log、change approval
Review人工复核事实和客户影响拉取 decision packet、transcript、policy、model logsReviewer 按政策和客户事实复核review checklist、reviewer notes
Correct更正错误记录、动作或输出更新账户、工单、决策、知识库、reason code、模型配置确认纠正符合业务和合规要求correction log、before/after snapshot
Compensate补偿可量化损失和合理负担计算费用、利息、退款、服务补偿批准补偿金额和例外compensation calculation、approval
Restore恢复客户状态、访问、权益和服务路径解除错误限制、恢复额度、重启流程、优先处理确认客户可以实际使用服务restoration timestamp、customer confirmation
Explain给出可理解、可行动、不过度承诺的解释使用 approved communication template人工校验高风险解释和正式通知message version、policy citation
Monitor recurrence证明同类伤害没有继续发生KRI dashboard、cohort scan、post-fix evalRisk/Product 周期复核并关闭monitoring report、closure approval

6.2 Recourse Decision Tree

判断问题Yes 时动作No 时动作
客户是否可能受到资金、权益、访问、隐私或监管影响升级 H2+,创建 harm event 和 recourse case记录为低风险质量问题并进入趋势监控
AI 是否参与了输出、排序、拒绝、路由、解释、摘要或员工建议关联 AI system id 和版本按非 AI 客户事件处理,但保留人工确认
是否仍在继续影响其他客户暂停相关自动化或 cohort rollout进入个案恢复和 root cause
是否存在可量化损失计算退款、费用、利息、补偿或权益恢复评估非金钱恢复:解释、道歉、优先处理、记录纠正
是否涉及脆弱客户、受保护群体、监管投诉或外部问询Legal/Compliance/Risk 进入审批链Product/Ops 按标准 SLA 处理
是否能复现 AI 输出和最终动作进入根因和恢复证明启动 evidence gap review,提升控制风险等级

6.3 RACI

ActivityAI PMSolutions ArchitectOps / CXModel RiskLegal / ComplianceData / SecurityExecutive Owner
Harm taxonomy ownerACRCCCI
Signal architectureARRCCCI
Severity triageACRCCII
Pause / rollbackARCCCCI / A for H4
Customer reviewCIRCCII
Compensation policyCIRIAIA for high amount
Evidence packARRCCCI
Executive memoRCCCCIA

RACI 解释:R = Responsible,A = Accountable,C = Consulted,I = Informed。不同机构可按三道防线、模型风险政策和业务授权调整。


7. Proving Recovery:如何证明客户已经恢复

“处理完工单”不等于 “customer recovered”。恢复证明必须能回答四个问题:

  1. 影响范围是否完整识别:哪些客户、哪些交易、哪些渠道、哪些 AI 版本、哪个时间窗。
  2. 客户状态是否恢复:资金、访问、解释、权益、记录、服务路径是否已经纠正。
  3. 根因是否修复:模型、prompt、知识库、规则、流程、权限、培训或供应商问题是否已经改正。
  4. 同类伤害是否停止:修复后监控窗口内 repeat harm、appeal upheld、complaint、override、segment disparity 是否下降到可接受范围。

7.1 Remediation Evidence Pack

Evidence section内容质量要求
Event summary发生了什么、何时发现、影响哪个产品和流程、严重度一页内可被高管理解,事实和推断分开
AI system contextAI system id、model/prompt/retriever/rule version、automation level、human oversight能连接 AI inventory 和 release record
Customer impact cohort受影响客户清单、筛选逻辑、排除逻辑、抽样验证SQL/规则/脚本有版本和审核记录
Timeline发生、发现、升级、暂停、通知、复核、纠正、补偿、恢复、关闭时间时间戳来自系统日志或审批记录
Root cause analysis技术根因、流程根因、控制缺口、组织责任不把原因停留在“模型错误”
Decision packet samples原始输出、最终动作、人工采纳/覆盖、政策依据、客户材料保护隐私,使用受控访问
Customer communications通知、解释、道歉、正式信函、补偿说明、申诉权利用批准版本,记录发送和客户回应
Financial correction退款、费用逆转、利息、补偿、税务或账务影响计算逻辑可复核
Restoration proof账户访问、额度、服务状态、投诉状态、KYC/AML 状态、材料状态有 before/after 证据
Control fixfeature flag、rule change、prompt change、knowledge update、model rollback、policy update、training关联变更审批和验证结果
Post-fix monitoring监控窗口、KRI、复发情况、segment disparity、appeal outcome证明同类伤害没有持续发生
Closure approvalProduct、Ops、Risk、Compliance、Legal、Executive 的关闭意见高严重度需要明确风险接受或关闭批准

7.2 Made Whole 判断

客户恢复不仅是“赔了钱”。不同 harm 需要不同恢复标准。

HarmMade whole 标准
Financial loss错误费用、利息、罚金、退款、补偿和相关账户记录已纠正;客户不因错误承担后续负面影响
Access denial客户可重新访问账户、服务、申诉、人工支持或产品流程;错误限制或拒绝记录已修正
Wrong explanation客户收到准确、具体、可行动的解释;正式通知如涉及监管要求需重新审查
Privacy exposure暴露范围、通知义务、数据删除/隔离、访问限制和后续监控已完成
Discrimination受影响群体被识别并复核;不公平差异被修正;必要时批量纠正和补偿
Delay客户请求被优先处理;因延迟产生的损失、费用或错过机会被评估和处理
Emotional distress客户获得人工支持、道歉和简化流程;高敏场景由受训人员处理
Regulatory complaint外部投诉得到一致、证据充分的回应;内部控制缺口进入整改
Operational burden重复提交、重复验证、跨渠道追赶被消除;客户无需再次承担错误成本

8. Financial Retail Cases

8.1 Payment Dispute AI:支付争议 AI 错误拒绝

场景:AI 对交易争议进行分类、材料完整性判断、provisional credit 推荐或拒绝路由。模型把“unauthorized transaction”误判为“merchant dispute”,导致客户没有及时获得临时入账,后续产生滞纳金和资金压力。

维度设计要点
可能伤害Financial loss、Delay、Wrong explanation、Emotional distress、Regulatory complaint
主要信号dispute appeal upheld、客户重复来电、provisional credit reversal、late fee、监管投诉、AI classification override
关键控制高金额、高敏、欺诈关键词、脆弱客户信号进入人工复核;争议类型 AI 分类不得单独决定客户权利;客户材料缺失时给出明确行动清单
Recourse暂停同类自动拒绝;人工复核 affected cohort;补发临时入账或退款;逆转费用和利息;发送解释;更新分类 eval set
Recovery proof受影响交易清单、AI 分类日志、人工复核结果、账户纠正、费用逆转、客户通知、修复后 upheld appeal 下降

高级 PM 面试点:支付争议场景的 recourse 不能只让客户“重新提交”。如果 AI 错误导致客户错过或延迟权益,机构应主动识别同类客户并恢复资金状态。

8.2 Lending Explanation AI:信贷解释 AI 给出错误原因

场景:AI 将 credit decision reason 转成客户可读解释。系统把真实主因“income verification incomplete”转成泛化的“credit history insufficient”,客户因此不知道应补交收入材料,也无法有效申诉。

维度设计要点
可能伤害Wrong explanation、Access denial、Discrimination、Regulatory complaint、Operational burden
主要信号explanation dispute、appeal upheld、call reason “why denied”、不同群体解释清晰度差异、manual reason code correction
关键控制reason code pipeline 与正式决策系统绑定;LLM 只能润色 approved reason,不得创造原因;每个解释必须可追溯到实际主要原因
Recourse重新出具准确解释;允许客户补正材料或重新审查;检查同一 reason transformation 影响范围;审查 segment disparity
Recovery proof原始决策理由、AI 生成解释、人工校验、重新通知、申诉结果、reason transformation 修复记录

高级 PM 面试点:解释不是“让用户感觉透明”,而是让客户能理解实际原因并采取合理行动。错误解释会把模型风险转化为客户权利损害。

8.3 Customer-Service RAG:客服 RAG 错引政策

场景:客户问信用卡年费减免、困难援助、争议时限或费用规则。RAG 检索到过期政策,回答“不能减免”,但当前政策允许特定条件下减免。客户放弃申请并支付费用。

维度设计要点
可能伤害Financial loss、Wrong explanation、Operational burden、Delay
主要信号policy QA fail、retrieval source stale、客户重复追问、员工 override、费用争议、abandoned journey
关键控制知识库文档有效期、policy owner、source freshness、citation guardrail、high-impact answer approval;高风险政策答案需要人工或系统 API 验证
Recourse识别引用过期政策的会话;主动通知可申请客户;退还错误费用;更新知识库;加 stale source blocker
Recovery proofsource document version、conversation list、customer cohort、fee reversal、knowledge update approval、post-fix QA pass

高级 PM 面试点:RAG 的伤害不只在“幻觉”,也在“看起来有出处但出处过期或不适用”。source freshness 是客户救济设计的一部分。

8.4 Wealth Advisory Assistant:财富助手越界建议

场景:财富管理 APP 的 AI assistant 本应提供教育和产品信息,却根据客户资产和风险偏好建议“可以加仓某高波动基金”。客户理解为机构建议并交易,随后损失。

维度设计要点
可能伤害Financial loss、Wrong explanation、Regulatory complaint、Emotional distress
主要信号trade after AI interaction、complaint “AI told me to buy”、advisor override、suitability exception、high-risk product query
关键控制教育、销售、建议、下单边界明确;高风险产品、个性化建议和交易动作必须转持牌人员或适当性流程;AI 不得给出具体买卖指令
Recourse冻结相关话术;复核交易前 AI 对话;评估客户适当性、披露和损失因果;必要时补偿或交易纠正;更新 policy guardrail
Recovery proofAI conversation、客户 profile、产品风险等级、交易时间线、advisor review、客户沟通、control change

高级 PM 面试点:财富 AI 的最大风险不是答错定义,而是越过 education / recommendation / advice / execution 的边界,造成客户把 AI 输出当成专业建议。

8.5 AML False Positive Support:AML 误报支持流程伤害客户

场景:交易监控模型标记客户账户异常,客户服务 AI 只能回复“请等待审核”,无法说明需要哪些材料,也无法升级。客户工资入账和账单支付受到影响,反复提交材料仍无法恢复。

维度设计要点
可能伤害Access denial、Delay、Operational burden、Emotional distress、Regulatory complaint
主要信号account restriction aging、repeat document upload、call escalation、complaint “account frozen”、manual release after review、false positive rate
关键控制AML 保密边界与客户可行动解释分离;AI 可说明流程状态、可提交材料和预计时限,但不得泄露敏感监控规则;高影响冻结需要 human case owner
Recourse人工复核 false positive;给客户明确材料清单和时间线;恢复账户或提供替代通道;检查同类 false positive cohort;优化 triage queue
Recovery proofrestriction timeline、customer notice、documents received、human review、release timestamp、repeat false positive monitoring

高级 PM 面试点:AML 场景要平衡合规保密和客户可恢复性。不能因为不能披露监控规则,就让客户完全不知道如何恢复服务。


9. Artifact Templates

以下模板以“字段 + 规则 + 示例”呈现,便于直接转成 PRD、Confluence、Jira、GRC、case management 或 evidence binder。

9.1 Harm Taxonomy Template

FieldRuleExample
Category code使用稳定编号,便于报表和审计HARM-FIN-LOSS
Category name使用客户影响语言,不使用纯技术语言Financial loss
Definition一句话说明何时适用AI 造成或放大客户资金、费用、利息、退款或经济权益损失
Included scenarios列出 3-7 个业务场景错误费用、错误拒付、错误拒绝退款、错误投资建议、错过补偿
Excluded scenarios明确不属于该类的边界只有内部测试错误且未触达客户
Primary signals可生产监控的信号appeal upheld、fee reversal、complaint amount、payment dispute reopened
Initial severity floor最低严重度H2;涉及批量或监管投诉时 H3+
Recourse owner默认 ownerPayments Ops + Product Owner
Evidence required关闭 case 前需要的证据决策日志、账户更正、补偿计算、客户通知

9.2 Harm Severity Matrix Template

DimensionH1H2H3H4
Financial impact无资金损失或极小金额小额费用、短期资金占用明显损失、错误拒付、利息/罚金批量重大损失或系统性错误
Access impact短时不便服务流程受阻账户、信贷、支付或申诉被错误拒绝大规模账户限制或关键服务不可达
Explanation impact轻微不清楚客户无法采取正确行动正式通知或权益解释错误批量错误解释或监管关注
Privacy impact无敏感暴露内部错放低敏信息客户 PII 暴露或跨客户混淆批量敏感数据暴露
Segment impact未见差异局部差异需要复核受保护群体或脆弱客户明显受影响系统性差异或外部投诉
Recovery effort单次修正需要人工复核和客户通知需要补偿、批量扫描或合规参与需要 executive response 和专项治理

9.3 Recourse Workflow Template

Workflow fieldRuleExample
Trigger明确哪些信号创建 recourse casePayment dispute appeal upheld after AI denial
Intake owner负责首轮分类和严重度CX Risk Triage Lead
Pause criteria何时暂停自动化24 小时内出现 3 个同类 upheld appeals 或单个 H3 case
Review packet人工复核必须看到的材料AI output、policy version、customer documents、decision log、prior contacts
Customer action客户需要做什么,越少越好不要求客户重复提交已在系统中的材料
Correction action机构主动做什么Reopen dispute、issue provisional credit、reverse late fee
Compensation authority谁能批准什么金额或权益恢复Ops manager up to policy limit;高额由 Risk/Legal 审批
Closure criteriacase 关闭条件客户账户已更正,通知已发送,post-fix monitoring 已启动

9.4 Remediation Evidence Pack Template

SectionRequired contentAcceptance criteria
Executive summaryharm、scope、root cause、customer recovery、residual risk高管 3 分钟能理解决策
Scope methodologycohort query、时间窗、AI 版本、产品范围可复核、可重复执行、有排除理由
Customer impact table客户数、金额、状态、segment、通知状态汇总数与明细一致
Correction ledger每项纠正动作和完成时间有系统记录或审批记录
Compensation ledger金额、规则、审批、发放状态财务和客户账户可对账
Communication archive通知文本、发送渠道、发送时间、失败重试与客户 case 对齐
Control fix evidence变更记录、测试、审批、上线时间证明根因已处理
Monitoring results修复后 KRI、sample QA、segment review能证明复发风险受控

9.5 Customer Communication Template

客户沟通要做到准确、克制、可行动、不过度承诺。下面给出一个支付争议 AI 错误分类后的示例文本,正式使用需经 Legal / Compliance / Brand / Accessibility 审查。

我们完成了对您 2026-06-12 提交的交易争议请求的重新审核。此前系统将该请求归类为商户争议,导致处理路径不正确。我们已经更正分类,并按照未授权交易争议流程继续处理。

我们已经在您的账户中完成以下动作:
1. 重新打开争议案件,并由专员复核。
2. 撤销因该处理延迟产生的 35 美元滞纳金。
3. 将案件状态更新为“人工复核中”,预计在 5 个工作日内向您提供下一步结果。

您无需重复提交已经提供的材料。如果您有新的证明文件,可以通过手机银行争议案件页面上传,也可以联系人工专员。我们会在案件页面保留本次更正记录。

沟通控制要点:

  • 不把“AI 出错”作为推卸责任的表达。
  • 明确已经采取的纠正动作。
  • 明确客户是否还需要行动。
  • 明确时间线和人工入口。
  • 避免承诺尚未完成的补偿或结论。
  • 高风险场景使用正式通知和审核流程。

9.6 Executive Risk Memo Template

Memo section内容规则示例表达
Decision needed管理层需要批准、接受或升级什么批准对 1,248 名客户执行批量费用逆转,并暂停相关 AI 自动分类规则
Harm summary用客户影响语言描述AI-assisted dispute classifier 将部分未授权交易错误路由为商户争议,造成处理延迟和费用影响
Scope客户数、金额、产品、渠道、时间窗影响窗口为 2026-06-01 至 2026-06-18,涉及信用卡争议渠道
Customer recovery已恢复和仍在处理的数量1,102 名客户已完成费用逆转,146 名客户进入人工复核
Root cause技术、流程、控制共同说明新增 merchant descriptor 特征后未覆盖欺诈关键词回归测试,且高风险争议缺少人工抽样门禁
Risk assessment客户、合规、运营、声誉、复发风险当前复发风险已通过规则暂停降低,仍需 14 天 post-fix monitoring
Recommendation明确下一步执行批量通知、完成补偿、上线分类回归测试门禁、每周向风险委员会报告
Evidence location指向证据包Evidence binder: AI-HARM-2026-06-PAY-DISPUTE-001

10. Metrics / KRIs

AI customer harm 指标必须同时覆盖发生率、恢复质量、速度、公平性和证据质量。只看投诉量会低估隐藏伤害;只看模型准确率会忽略客户影响。

Metric / KRIDefinitionWhy it mattersTypical slice
Harm rateconfirmed harm cases / AI-involved customer journeys观察 AI 客户旅程实际伤害率product、channel、AI system、version、segment
Repeat harmsame customer or same root cause harm recurrence within monitoring window判断恢复是否真正有效customer、root cause、journey step
Appeal upheld rateappeals reversed or corrected / total appeals for AI-involved decisionsAI 决策或解释错误的强信号decision type、segment、reviewer、model version
Remediation SLAcases restored within policy time / total harm cases衡量恢复速度severity、owner、product
Customer notification delaynotification timestamp - harm confirmed timestamp伤害确认后通知是否及时severity、channel、legal review path
Segment disparityharm, denial, appeal upheld, delay or notification metrics by segment检测公平性和脆弱客户影响geography、language、age band、income proxy、protected-class proxy where lawful
Evidence completenessevidence sections complete / required evidence sections证明恢复和审计 readinessseverity、system、owner
Override harm conversionoverrides later linked to confirmed harm / total overrides员工纠错是否预示客户伤害AI output type、team、policy
Abandonment recovery rateabandoned high-risk journeys contacted or restored / total eligible abandoned journeys捕捉未投诉客户journey、step、device、language
Recourse accessibilitycustomers reaching human review / customers requesting or needing review防止 AI 自助化阻断救济channel、language、disability accommodation
Compensation accuracycompensation adjustments without rework / total compensation cases衡量补偿计算和账务质量harm type、product、approval tier
Post-fix recurrencesame harm events after control fix / baseline判断根因修复是否有效model version、prompt version、rule id

10.1 KRI Threshold 设计

KRIGreenAmberRedAction
Appeal upheld rate for AI decisions稳定低于历史基线连续 2 周上升超过基线 2 倍或高严重度个案出现Amber 触发 root cause review;Red 暂停相关自动化
Customer notification delay H3+当日通知或按批准流程执行超过内部目标未经批准延迟或客户先从外部渠道获知Red 触发 Legal/Compliance escalation
Evidence completeness H3+100% required sections complete非关键证据缺失决策日志、客户通知或恢复证明缺失Red 禁止关闭事件
Segment disparity in harm rate无显著差异或有业务解释差异扩大但样本有限差异稳定存在且无合理解释启动 fairness review 和 cohort remediation
Repeat harm修复后无复发单点复发同根因多次复发重新打开 incident,升级 owner

11. Product and Architecture Requirements

11.1 PRD Requirements

Requirement areaRequirement
AI disclosure客户在适当时点知道 AI 或 AI-assisted process 参与了回答、路由、建议或决策支持
Recourse entry高影响旅程必须提供清晰的人工复核、申诉、投诉或纠错入口
Decision packet每个 AI-involved high-impact action 都要生成 decision packet,包含输入、输出、版本、政策依据、人工动作和时间戳
Customer impact tagging事件和工单必须标记 potential harm category、severity 和 AI contribution
Pause mechanismProduct / Risk 能按 AI system、version、journey、cohort 或 rule 快速暂停相关自动化
Explainability boundary客户解释必须来自 approved reason、policy 或 verified source;生成式 AI 不得创造正式理由
Evidence-by-design证据在流程中自动产生,并与 case、AI inventory、model telemetry 和 customer communication 关联
Batch remediation系统必须支持按时间窗、版本、规则、客户群体识别受影响 cohort,并执行批量恢复
Accessibility通知、申诉和人工入口要考虑语言、无障碍、移动端、老年客户和脆弱客户

11.2 Solution Architecture Pattern

Channels
  mobile / web / contact center / branch / email / regulator portal

AI layer
  model / prompt / retriever / rules / agent tools / decision service

Control layer
  policy engine / feature flags / human review queue / reason code service / consent and disclosure

Signal layer
  complaints / appeals / overrides / escalations / abandoned journeys / QA / telemetry / regulator inquiries

Harm intelligence layer
  harm event ledger / severity scoring / cohort detection / root cause taxonomy / KRI dashboard

Recourse operations
  case management / customer communication / correction / compensation / restoration / evidence binder

Governance
  AI inventory / release gates / model risk / compliance approval / audit / executive reporting

11.3 Integration Points

IntegrationPurposeRisk if missing
AI inventory to case management知道哪个 AI 系统参与了客户 case只能看到工单,看不到 AI 版本和责任系统
Model telemetry to complaint data把客户叙述连接到 AI 输出投诉趋势无法驱动模型和知识库修复
Decision service to evidence binder保存决策包和恢复证据监管问询时无法复现
Feature flag to incident workflow快速暂停或回滚高风险自动化发现伤害后仍继续影响客户
Compensation engine to case closure确认补偿已实际入账工单关闭但客户资金未恢复
Customer communication archive to legal hold保留对客户说了什么外部投诉时口径无法证明

12. Operating Model

12.1 Three Lines of Defense

LineRole in AI customer harm
First line: Business / Product / Operations设计 recourse、处理客户恢复、运行控制、监控 KRI、维护证据
Second line: Risk / Compliance / Model Risk / Privacy / Fair Lending设定政策、挑战设计、审查高风险事件、监督公平性和监管响应
Third line: Internal Audit独立评估 harm management framework、控制设计、运行有效性和证据质量

12.2 Governance Cadence

CadenceMeetingInputsOutputs
Daily for H3/H4Harm incident standupNew cases、pause status、customer recovery、evidence gapsaction owner、deadline、customer communication decision
WeeklyAI harm reviewKRI dashboard、appeals、overrides、complaints、QA findingsroot cause backlog、control changes、training needs
MonthlyProduct risk committeetrend、segment disparity、recourse SLA、evidence completenessrisk acceptance、roadmap priority、policy updates
QuarterlyExecutive governancesystemic themes、regulatory inquiries、material remediationinvestment decision、risk appetite update、audit readiness

12.3 Root Cause Taxonomy

Root causeExamplesFix pattern
Model behaviormisclassification、calibration failure、drift、insufficient evalretraining、threshold change、eval expansion、human gate
Retrieval / knowledgestale source、wrong document、missing citation、policy ambiguitycontent governance、source freshness、retrieval filter、policy owner sign-off
Prompt / agent designoverconfident tone、unsafe tool use、hidden escalationprompt policy、tool permission、refusal and handoff state machine
Workflow designno appeal path、bad queue priority、duplicate document requestservice blueprint redesign、case routing、state synchronization
Data qualitywrong customer record、missing data、identity merge issuedata correction、lineage control、quality monitoring
Human adoptionemployee over-relies on AI、fails to reviewtraining、UI friction、review checklist、supervisor sampling
Policy / governanceunclear owner、weak approval、no pause criteriaRACI、release gate、risk appetite、control library
Vendor / third partymodel change、API behavior change、missing logsvendor SLA、change notification、contractual evidence rights

13. Interview Section

Question: How do you design customer recourse for AI failures?

30-second answer

我会先把 AI failure 从“模型答错”改定义为“错误动作 + 客户影响 + 弱恢复路径”。设计 recourse 时,我会在客户旅程中预埋 detect、notify、pause、review、correct、compensate、restore、explain 和 monitor recurrence。也就是说,高风险 AI 决策必须可申诉、可人工复核、可暂停、可纠正,并且每一步都有证据。最后我会用 harm rate、appeal upheld、remediation SLA、notification delay、segment disparity 和 evidence completeness 来证明客户已恢复、根因已修复、同类伤害没有继续发生。

2-minute answer

我不会把 AI recourse 设计成客服 FAQ 或“联系人工”按钮。金融零售场景里,AI 可能影响支付争议、信贷解释、账户限制、AML false positive、财富建议和投诉处理,所以 recourse 必须是产品架构和运营控制。

第一步是 harm taxonomy。我要定义 financial loss、access denial、wrong explanation、privacy exposure、discrimination、delay、emotional distress、regulatory complaint 和 operational burden,并给每类定义 severity、SLA、owner 和 evidence。

第二步是 signal architecture。客户通常不知道 AI 参与了哪里,所以不能只靠投诉。我会把 complaints、appeals、overrides、escalations、abandoned journeys、regulator inquiries、incident tags、QA findings 和 model telemetry 接到 harm event ledger,关联 AI system、model version、prompt version、journey step 和客户影响。

第三步是 recourse workflow。发现潜在伤害后,要通知客户或内部 owner,暂停可能继续伤害的自动化,人工复核事实,纠正账户或决策,补偿资金损失,恢复访问或权益,给出准确解释,并在修复后监控复发。

第四步是证明恢复。每个高严重度 case 都要有 remediation evidence pack,包括影响范围、时间线、决策日志、客户沟通、纠正记录、补偿计算、控制修复和 post-fix monitoring。我的成功标准不是“工单关闭”,而是客户 made whole、同类客户被识别、根因被修复、证据可审计。

如果面试官追问落地,我会举支付争议 AI 的例子:一旦 appeal upheld 或同类投诉上升,我会暂停自动拒绝,批量找出同一模型版本影响的争议案件,人工复核,补发 provisional credit 或退费,通知客户,并把错误样本加入 eval 和 release gate。


14. Portfolio Exercise

Exercise: Design an AI Customer Harm Recourse System for a Retail Bank

背景:一家零售银行上线了三个客户可见 AI 能力:

  1. 支付争议 AI:自动分类争议类型并推荐处理路径。
  2. 信贷解释 AI:把拒贷或提额失败原因转成客户可读解释。
  3. 客服 RAG:回答账户、费用、困难援助和争议流程问题。

最近 30 天出现以下信号:

  • 支付争议 appeal upheld rate 从 8% 上升到 19%。
  • 信贷解释相关投诉中,“解释不清楚”和“原因不对”增加。
  • 客服 RAG 在年费减免政策上出现过期引用。
  • 有 2 个 CFPB 投诉提到 “chatbot would not let me talk to a person”。
  • Contact center 员工覆盖 AI 摘要和建议的比例上升。

14.1 Deliverables

Deliverable产出要求
Harm taxonomy至少覆盖 9 类 harm,并标出每类信号、severity floor、recourse owner
Signal architecture画出 complaints、appeals、overrides、abandoned journeys、QA、telemetry 到 harm ledger 的数据流
Severity matrix定义 H0-H4,说明升级触发器和管理层参与条件
Recourse workflow针对支付争议 AI 写出 detect-to-monitor 的端到端流程
Remediation evidence pack为一个 H3 事件列出证据目录、owner、质量标准
Metrics dashboard定义 harm rate、repeat harm、appeal upheld、remediation SLA、notification delay、segment disparity、evidence completeness
Executive memo写一页管理层决策 memo,建议是否暂停自动争议分类和是否批量补偿

14.2 Evaluation Rubric

Level标准
Basic能列出 AI 错误和客服处理路径,但缺少客户影响、证据和批量恢复
Strong能按 harm taxonomy、severity、recourse workflow 和 KRI 组织方案
Advanced能连接 AI inventory、model telemetry、complaints、appeals、evidence binder 和 governance;能说明如何证明客户 made whole
Executive-ready能做出暂停、补偿、客户通知、监管准备和长期控制投资的管理层建议

15. Checklist

15.1 Use Case Intake

  • AI 是否参与客户可见回答、排序、拒绝、建议、解释、路由、摘要或员工决策支持。
  • 客户是否可能受到资金、访问、解释、隐私、公平性、时间、情绪、监管或运营负担影响。
  • 是否定义了 harm taxonomy、severity floor、recourse owner 和 SLA。
  • 是否识别高风险客户群体、语言、渠道、产品和脆弱客户。
  • 是否有人工复核、申诉、投诉、暂停和回滚路径。
  • 是否明确哪些 AI 输出不能作为正式通知、建议或拒绝理由。

15.2 Pre-Launch Gate

  • AI inventory 已登记 system id、owner、model/prompt/retriever/rule version 和 automation level。
  • Decision packet schema 已定义并在测试中生成。
  • Customer communication 已经 Legal / Compliance / Brand / Accessibility 审查。
  • Harm signals 已接入 complaints、appeals、overrides、escalations、abandoned journeys、QA 和 telemetry。
  • Pause criteria 和 feature flag / rollback 机制已经演练。
  • 高风险场景已完成 fairness、privacy、security、model risk 和 operational readiness review。
  • Evidence pack 的证据来源、保留期限和访问权限已确认。

15.3 Production Monitoring

  • 每周查看 harm rate、appeal upheld、override rate、abandonment、repeat contact 和 QA findings。
  • 每月按 segment 查看 denial、delay、appeal upheld、notification delay 和 remediation SLA。
  • 每次 model、prompt、retriever、knowledge base、policy 或 workflow 变更后比较 post-change harm signal。
  • 外部投诉和监管问询进入 harm ledger,并关联 AI touchpoint。
  • H3/H4 case 有每日恢复跟踪和 evidence gap review。

15.4 Remediation Closure

  • 影响客户 cohort 已完整识别,筛选逻辑已复核。
  • 客户资金、访问、权益、记录、解释或服务路径已恢复。
  • 补偿计算、审批和入账已完成并可对账。
  • 客户通知已发送,失败发送有重试或替代渠道记录。
  • 根因控制已修复,并通过测试或生产监控验证。
  • Segment disparity 已检查并记录结论。
  • Evidence completeness 达到关闭标准。
  • Repeat harm monitoring window 已启动并有 owner。
  • 高严重度事件由指定 Product / Risk / Compliance / Legal / Executive owner 批准关闭。

15.5 Red Flags

  • 团队说“这是模型误差,不是客户伤害”,但客户已经被拒绝、延误、收费或误导。
  • 投诉下降,但 abandoned journeys、repeat contact 或 external complaints 上升。
  • 人工入口存在,但客户需要多轮 chatbot 失败后才能找到。
  • 员工大量 override AI,却没有结构化 reason 和 root cause review。
  • AI 生成解释无法追溯到正式决策理由或政策来源。
  • 修复只改 prompt,没有识别受影响客户和补偿。
  • 工单关闭,但客户账户、费用、限制、正式记录或服务路径没有恢复。
  • 证据包只有会议纪要和截图,没有系统日志、版本、时间线、客户通知和纠正记录。

16. Final Operating View

AI customer harm management 的成熟状态不是“AI 很少出错”,而是组织能持续证明:

We know where AI touches customers.
We know what harm can occur.
We detect harm from multiple signals.
We give customers reachable recourse.
We pause harmful automation quickly.
We review and correct with evidence.
We compensate and restore customers proportionately.
We explain in a way customers can act on.
We monitor recurrence and segment disparity.
We can prove recovery to customers, executives, auditors and regulators.

对 CBAP+、AI PM、AI Product Architect、Customer Experience Risk Lead 和 Solutions Architect 来说,这就是从“做一个 AI 功能”升级为“经营一个可信、可恢复、可审计的 AI 客户影响系统”。