返回 Papers
AI 底层逻辑 / 经典论文

AI Customer Harm:救济与恢复架构

一句话:

245ai-foundations/papers/103-ai-customer-harm-redress-recovery-architecture.md

AI Customer Harm / Redress / Recovery Architecture 解读

面向对象: AI PM / Product Architect / Customer Experience Risk Lead / Senior BA / Compliance Product Lead。 核心问题: AI 失败不是只看模型有没有答错。真正的产品风险是客户是否受到伤害, 是否能发现, 是否有救济路径, 是否能恢复权益, 是否能证明组织已经纠正并防止复发。 学习目标: 建立 customer harm taxonomy、recourse workflow、remediation evidence、harm KRI 和 recovery operating model。


Source Anchors

SourceLink用途
NIST AI RMFhttps://www.nist.gov/itl/ai-risk-management-framework用 risk management 语言组织 harm、impact、control 和 monitoring
NIST GenAI Profilehttps://www.nist.gov/itl/ai-risk-management-framework/generative-artificial-intelligence-profile参考生成式 AI 风险、misuse、overreliance、information integrity
EU AI Act, Regulation (EU) 2024/1689https://eur-lex.europa.eu/eli/reg/2024/1689/oj参考 high-risk AI、human oversight、post-market monitoring、incident reporting
CFPB Consumer Complaintshttps://www.consumerfinance.gov/data-research/consumer-complaints/参考金融消费者投诉信号和问题分类
FTC AI claims guidancehttps://www.ftc.gov/business-guidance/blog/2023/02/keep-your-ai-claims-check参考 AI 宣称、误导性体验和客户风险沟通

一句话:

AI customer harm = AI-related failure + customer impact + weak detection or recovery path.


1. 为什么 Harm Architecture 是高级产品能力

低成熟度 AI 产品只问:

模型准确率多少?
用户满意度多少?
调用量多少?

高成熟度 AI 产品还问:

  • 错误是否影响客户权益。
  • 客户是否知道如何纠错。
  • 组织是否能发现隐性伤害。
  • 投诉、申诉、人工覆盖是否能回流到风险模型。
  • 是否能证明已通知、纠正、补偿、恢复和防复发。

在金融零售场景里, AI 可能造成的伤害不是抽象伦理问题, 而是:

  • 错误拒绝服务。
  • 错误解释费用。
  • 延迟处理争议。
  • 错误分类投诉。
  • 暴露隐私数据。
  • 诱导客户相信错误政策。
  • 对某类客户产生不公平体验。

2. Customer Harm Taxonomy

Harm type示例典型 AI 触发点
Financial loss错误费用解释导致客户未及时申诉policy RAG hallucination
Access denial客户被错误引导放弃申请eligibility assistant
Wrong explanation拒绝原因、费用原因、争议状态解释错误explanation generator
Privacy exposureRAG/日志泄露 PIIcontext assembly / logging
Discrimination某群体误拒率或误报率更高model/data/proxy bias
DelayAI 错误分流导致 SLA 超时routing agent
Emotional distress欺诈/催收/投诉场景语气不当generated communication
Regulatory complaintAI 答复被客户提交监管投诉customer-facing AI
Operational burden人工团队被大量错误升级淹没agent escalation design

产品负责人要把 harm taxonomy 放进需求、评测、监控和 incident taxonomy, 而不是事故发生后临时归类。


3. Harm Signal Architecture

伤害信号不只来自模型 telemetry。

runtime traces
  + complaints
  + appeals
  + human overrides
  + QA findings
  + journey abandonment
  + regulator inquiries
  + incident reports
  + segment disparity
  -> harm detection layer
Signal可以发现什么
Complaint reason客户感知的错误、误导、延迟
Appeal upheld自动化或 AI 辅助流程错误
Override spike人类不信任 AI 建议
Escalation miss应人工处理但未升级
Abandoned journey客户因错误解释或体验放弃
QA defect内部发现但客户未投诉
Segment disparity某群体受到更高失败率
Regulator inquiry外部严重信号
Cost reversal组织主动退款/纠正

4. Recourse Workflow

一条完整救济路径:

detect
  -> classify harm
  -> pause or contain
  -> notify owner
  -> human review
  -> correct record / decision / communication
  -> compensate or restore if needed
  -> notify customer
  -> update eval/control
  -> monitor recurrence

关键设计:

  • 客户能看见申诉/纠错入口。
  • 高风险伤害自动创建 review case。
  • 纠正动作有 owner、SLA、证据。
  • 补偿不是临时人工决定, 而是有规则和审批。
  • 伤害样本进入 eval set, 防止复发。

5. 金融零售案例

5.1 Payment dispute AI

伤害:

  • 错误告诉客户争议不符合条件。
  • 延误证据提交。
  • 自动生成误导性状态说明。

控制:

  • dispute deadline guardrail。
  • customer-visible correction path。
  • high-severity complaint auto-escalation。
  • appeal upheld rate monitoring。

5.2 Lending explanation AI

伤害:

  • AI 编造拒绝原因。
  • 使用过期政策。
  • 客户误以为不能重新申请。

控制:

  • reason code source of truth。
  • adverse action wording guardrail。
  • policy version capture。
  • human review for high impact explanation。

5.3 Customer-service RAG

伤害:

  • 错误解释费用、账户限制、申诉路径。
  • 对 vulnerable customer 未升级。

控制:

  • vulnerable customer classifier。
  • no unsupported policy claim。
  • complaint linkage dashboard。

6. Harm Severity Matrix

Severity客户影响处理
S0无客户影响, 内部缺陷backlog fix
S1轻微误导, 无损失correction + monitoring
S2延迟、返工、轻微经济影响customer notification + remediation
S3重大权益、资金、隐私或合规风险incident process + executive owner
S4大规模或监管关注风险crisis response + regulator-ready evidence

Severity 要同时看:

  • harm magnitude。
  • number of customers。
  • reversibility。
  • vulnerable customer impact。
  • protected class / fairness concern。
  • regulatory exposure。

7. Metrics / KRIs

Metric用途
AI-linked complaint rate识别客户可感知伤害
Appeal upheld rate判断 AI/自动化错误
Remediation SLA救济速度
Repeat harm rate防复发效果
Customer notification delay透明度
Segment harm disparity公平性风险
Evidence completeness审计能力
Escalation miss rate人类监督有效性
Compensation amount经济影响

8. 面试表达

30 秒版本:

我不会只用模型准确率管理 AI 风险。金融零售 AI 要有 customer harm architecture: 定义伤害分类、检测信号、严重度、申诉入口、人工复核、纠正补偿、客户通知和防复发评测。真正成熟的 AI 产品能证明发现了哪些客户伤害、如何恢复权益、如何防止再次发生。

2 分钟版本:

我会先把 AI harm 定义成 failure、customer impact 和 recovery path 的组合。比如支付争议 AI 错误解释截止日期, 不只是回答错, 而是可能让客户失去申诉机会。 架构上我会把 complaints、appeals、overrides、QA findings、journey abandonment、incident tags、segment disparity 和 telemetry 接入 harm detection layer。每个 harm case 进入 detect-classify-contain-review-correct-compensate-notify-monitor 的闭环。 产品上要有客户可见的纠错/申诉入口, 内部要有 severity matrix、owner、SLA、remediation evidence pack 和 recurrence monitoring。这样 AI 治理不只是防错, 还能在出错后保护客户和组织。


9. Portfolio Exercise

选择一个 customer-facing AI:

  1. 写 harm taxonomy。
  2. 画 harm signal architecture。
  3. 设计 recourse workflow。
  4. 写 severity matrix。
  5. 定义 8 个 KRI。
  6. 写一页 executive remediation memo。

输出:

  • Customer Harm Control Pack。
  • Recourse workflow diagram。
  • Remediation evidence checklist。