AI 扩展计划 / Playbooks

AI Third-Party / Vendor Risk Playbook

版本：v1.0

912 行AI_THIRD_PARTY_VENDOR_RISK_PLAYBOOK.md

AI Third-Party / Vendor / Procurement / Outsourcing Risk Playbook

版本：v1.0 日期：2026-06-29 适用对象：AI 产品经理、业务分析师、企业架构师、解决方案架构师、第三方风险管理、采购、法务、合规、隐私、信息安全、模型风险、内审、金融零售业务负责人

定位：把 AI 供应商、外包、采购和第三方风险管理统一成一套可落地的金融零售 AI 风险手册。重点不是背诵供应商清单，而是能把 foundation model、cloud AI、RAG SaaS、agent platform、data vendor、eval vendor、系统集成商和外包团队放进同一个风险生命周期里管理。

重要说明：本文是学习、架构和作品集材料，不是法律意见、监管解释、采购建议或合同文本。正式项目必须由 legal、compliance、procurement、third-party risk、privacy、security、model risk、business owner 和 internal audit 按机构类型、监管关系、司法辖区、数据分类和业务用途确认。

1. 核心观点

金融零售 AI 第三方风险不是传统供应商管理的简单延伸。它叠加了四类依赖：

供应商依赖：模型、云平台、SaaS、数据、评估、外包交付、支持服务。
数据依赖：客户身份、账户、交易、通话、投诉、授信、AML、KYC、内部政策、知识库、日志。
模型依赖：基础模型、embedding、reranker、prompt、RAG index、agent tool、judge model、guardrail、policy engine。
运营依赖：版本变更、事故通知、服务可用性、人员访问、子处理方、审计证据、退出迁移。

一句话定义：

AI third-party risk management = 对外部 AI 能力在数据、模型、流程、合同、运营、合规和退出上的全生命周期控制，确保机构在使用第三方时仍能对客户、监管、业务结果和风险后果负责。

本手册的核心判断：

买 AI 不是把风险转移给供应商。银行、支付、借贷、财富、零售金融机构仍然需要证明自己做了适当的风险识别、尽调、合同约束、持续监控和退出准备。
AI vendor selection 不能只看 benchmark、demo 和单价。金融零售更关心数据使用边界、可审计性、变更可控性、SLA、监管协作、事故响应、集中度和可退出性。
AI 采购不是采购部门的单线程流程。PM / BA 要定义问题和使用边界；Architect 要定义架构和替换点；Risk / Legal / Security 要定义控制；Procurement 要把控制写进合同和供应商治理节奏。
任何 vendor 声称“我们已经合规”都不等于客户机构已经完成治理。证据必须能映射到本机构用例、数据、版本、流程、角色、客户影响和控制运行记录。

2. 与现有学习资产的连接

已有文档	本手册如何连接
`docs/AI_VENDOR_BUILD_BUY_ADOPTION_PLAYBOOK.md`	本手册是其供应商风险深水区：从 build / buy / hybrid 决策延伸到尽调、合同、SLA、变更、退出和集中度。
`docs/AI_MODEL_RISK_MANAGEMENT_PLAYBOOK.md`	把模型风险扩展到第三方模型、供应商模型更新、vendor-hosted eval、RAG index 和 agent tool。
`docs/AI_AUDIT_EVIDENCE_BINDER_PLAYBOOK.md`	把第三方尽调、SOC 2、ISO、合同、审计权、incident、subprocessor、exit evidence 纳入证据包。
`docs/AI_PLATFORM_SECURITY_GATEWAY_LAB.md`	把模型网关、访问控制、日志、数据脱敏、密钥管理和 vendor routing 作为技术控制落点。
`docs/AI_REQUIREMENTS_TO_EVAL_COOKBOOK.md`	把 vendor demo、RFP、PoC、release gate 和 ongoing monitoring 转成可评估需求。
`docs/AI_OPERATING_MODEL_RACI_RUNBOOK.md`	把 AI vendor owner、business owner、procurement、risk、security、legal、model risk、incident commander 的职责落到 RACI。

学习顺序建议：

先用 build / buy / hybrid 文档判断是否需要第三方。
再用本文建立第三方风险生命周期、供应商版图和合同控制。
用 model risk、eval、audit evidence 文档把供应商承诺转成验证证据。
用 platform security 和 operating model 文档把控制接入生产系统与日常运营。

3. Source Anchors And Use Boundaries

以下锚点用于组织学习语言和证据结构。它们不自动等同于某个机构的合规结论。

Anchor	Official source	本手册使用方式
Interagency Guidance on Third-Party Relationships: Risk Management	https://www.federalreserve.gov/supervisionreg/srletters/sr2304.htm	采用 planning、due diligence、contract negotiation、ongoing monitoring、termination 的生命周期；强调按风险、复杂度和关键性调整控制。
OCC Bulletin 2023-17	https://www.occ.gov/news-issuances/bulletins/2023/bulletin-2023-17.html	作为 OCC 对联合指引的官方公告；注意其 rescinds OCC Bulletin 2013-29 和 OCC Bulletin 2020-10。
FDIC FIL-29-2023	https://www.fdic.gov/news/financial-institution-letters/2023/fil23029.html	作为 FDIC 对联合指引的官方公告；强调银行使用第三方不减少自身安全稳健经营和合规责任。
Federal Register final guidance	https://www.federalregister.gov/documents/2023/06/09/2023-12340/interagency-guidance-on-third-party-relationships-risk-management	用作联合指引正式文本锚点，便于引用生命周期、治理、合同、持续监控和终止阶段。
Federal Reserve SR 13-19 / CA 13-21	https://www.federalreserve.gov/newsevents/pressreleases/bcreg20131205a.htm	历史外包风险管理锚点；Fed SR 23-4 已 supersedes 该信件，正式项目以当前联合指引为基准。
OCC Bulletin 2013-29	https://www.occ.gov/static/rescinded-bulletins/bulletin-2013-29.pdf	历史第三方风险管理锚点；OCC 2023-17 已 rescinds 该 Bulletin，学习时可对比术语演进。
OMB M-25-22, Driving Efficient Acquisition of Artificial Intelligence in Government	https://www.whitehouse.gov/wp-content/uploads/2025/02/M-25-22-Driving-Efficient-Acquisition-of-Artificial-Intelligence-in-Government.pdf	虽面向美国联邦机构，但对 AI 采购很有参考价值：跨职能采购、竞争性市场、性能追踪、风险管理、开放格式/API、避免锁定。
NIST AI RMF 1.0	https://www.nist.gov/itl/ai-risk-management-framework	用 Govern、Map、Measure、Manage 组织 AI 供应商风险、评估、监控和治理证据。
ISO/IEC 42001:2023	https://www.iso.org/standard/42001	用 AI Management System 语言审查供应商是否具备 AI 生命周期、责任、风险、变更、持续改进和治理体系。
AICPA SOC Suite / SOC 2	https://www.aicpa-cima.com/resources/landing/system-and-organization-controls-soc-suite-of-services	用于审查服务组织控制证据，重点关注 security、availability、confidentiality、privacy、processing integrity。
ISO/IEC 27001:2022	https://www.iso.org/standard/27001	用作信息安全管理体系证据锚点，辅助审查供应商 ISMS、风险管理和安全控制。

使用边界：

银行第三方风险锚点偏向安全稳健、责任不外包、生命周期管理和合同控制。
OMB M-25-22 偏向 AI acquisition 方法论，不是银行监管要求；本文借用其“跨职能采购、避免锁定、性能和风险追踪”的采购思想。
NIST AI RMF 与 ISO/IEC 42001 提供 AI 治理语言，但不能替代行业监管、隐私法规、消费者保护、模型风险、网络安全和机构内部政策。
SOC 2、ISO 27001、ISO 42001 证书只能证明某个范围内的管理体系或控制经过审查，不能证明某个金融 AI 用例已经适合上线。

4. AI Vendor Landscape：供应商版图

AI vendor landscape 要按“能力层”而不是按品牌记忆。一个金融零售 AI 系统常常同时依赖多个供应商：基础模型在 A，云和数据管道在 B，RAG SaaS 在 C，评估平台在 D，系统集成由 E 交付。第三方风险管理必须看到完整供应链。

Vendor type	典型价值	典型风险	尽调重点	合同与控制重点
Foundation model provider	提供 LLM、vision model、embedding、speech、reranker、fine-tuning	数据被用于训练、模型静默更新、跨区域处理、输出不可解释、速率限制、单模型集中度	数据使用条款、模型版本、训练边界、日志保留、eval evidence、red-team、区域和子处理方	数据不训练、不微调、不共享；版本通知；可冻结或回滚；日志保留；SLA；incident notice
Cloud AI platform	托管模型、MLOps、向量库、AI gateway、IAM、日志、监控	云集中度、跨服务数据流、权限复杂、配置错误、账单失控、region failover	IAM、tenant isolation、encryption、networking、regionality、SOC/ISO、DR、billing guardrail	责任共担矩阵；可用性与灾备；数据驻留；访问日志；密钥管理；成本上限
RAG SaaS / knowledge platform	文档摄取、搜索、权限同步、引用、知识库治理	权限泄露、旧政策引用、embedding 敏感性、索引不可导出、source lineage 不清	connector 权限、ACL 同步、index version、source freshness、citation correctness、export	权限继承；索引导出；删除证明；数据保留；知识更新 SLA；审计日志
Agent platform / workflow automation	多步骤任务、工具调用、审批流、case handling、自动执行	excessive agency、越权操作、工具误用、不可复现、prompt injection、下游系统写入风险	tool permission、approval gates、sandbox、idempotency、trace、kill switch、human override	工具权限边界；高风险动作人工批准；完整 trace；kill switch；变更审批
Data vendor	KYC、制裁名单、企业数据、收入估计、商户数据、信用/欺诈信号、地理和行为数据	数据授权不清、偏差、覆盖不足、更新滞后、二次使用限制、消费者权益风险	数据来源、许可、覆盖率、质量、刷新频率、偏差测试、纠错机制、使用限制	用途限制；再分发限制；数据质量 SLA；纠错与删除；监管配合；赔偿条款
Eval vendor / red-team vendor	离线评估、LLM-as-judge、红队、安全测试、bias testing、monitoring	评估集泄漏、judge bias、测试不贴合业务、供应商既当运动员又当裁判	methodology、calibration、negative cases、domain rubric、independence、data handling	评估数据保密；方法透明；可复现报告；独立性声明；证据导出
AI observability vendor	trace、latency、cost、quality、feedback、drift、prompt/version logging	日志含敏感信息、观测供应商变成数据集中点、保留过长、访问控制弱	data minimization、redaction、RBAC、retention、export、SIEM integration	日志脱敏；最小保留；审计导出；访问控制；删除证明
System integrator / outsourcing partner	需求、实施、数据迁移、集成、UAT、运维、变更支持	交付质量、人员访问、离岸外包、知识流失、隐藏子承包、SOW 模糊	staffing、background check、secure SDLC、IP ownership、deliverable acceptance、subcontractors	明确交付物；代码和文档归属；人员替换；访问回收；subcontractor approval
Managed service provider	托管运维、模型监控、知识库运营、case review、人工标注	操作错误、权限滥用、客户数据暴露、服务质量不稳、流程黑盒	SOP、quality assurance、training、access logging、segregation of duties、location	操作 SLA；质量抽检；访问日志；培训证据；事故通知；退出交接

供应商版图的第一原则：

不要只登记“主合同供应商”。要登记所有进入 AI 系统链路的模型、云服务、数据源、评估工具、日志平台、外包人员和子处理方。

5. Build / Buy / Hybrid 连接

AI 第三方风险从 build / buy / hybrid 决策开始。选择方式不同，风险残留位置不同。

Strategy	适用场景	优势	风险残留	第三方控制重点
Build	核心差异化能力、强监管场景、需要深度集成、数据高度敏感、供应商无法满足控制	控制力强、可定制、可审计、可逐层替换	内部人才、速度、成本、模型与平台仍可能依赖第三方	云、模型、数据、工具链仍需供应商风险管理
Buy	标准化场景、成熟 SaaS、低到中风险 workflow、快速验证价值	上线快、功能完整、运维压力低	黑盒、锁定、合同边界、数据使用、模型更新、审计不足	尽调、合同、SLA、日志、数据限制、退出
Hybrid	业务流程自建，模型/平台/评估外购；或核心决策自建，辅助能力外购	平衡速度与控制，适合金融 AI 主流路径	接口复杂、责任边界模糊、供应链更长	架构分层、责任矩阵、版本控制、集成监控
Partner / co-development	与 fintech、模型公司或 SI 共创行业方案	获取专业能力，缩短探索周期	IP、客户数据、交付依赖、商业排他、监管配合	SOW、IP、数据、人员、审计、交接、共同责任

5.1 分层决策法

不要用一个 build / buy 结论覆盖整个 AI 系统。按层决定：

Layer	默认建议	何时外购	何时自建或强控制
Foundation model	多供应商可替换	通用语言、总结、分类、抽取、低风险 copilot	关键决策、高敏感数据、模型输出影响客户权益
AI gateway	强烈建议自控或由核心平台控制	小型团队早期试点	金融零售生产系统，需要统一日志、策略、路由、成本、审计
RAG ingestion / index	视数据敏感度 hybrid	普通知识库、低敏文档	政策、客户数据、内部控制、法律文档、强权限文档
Workflow / agent	高风险场景自控审批和权限	内部效率、只读辅助	任何写入账户、支付、授信、投诉、AML case 的动作
Evaluation	内部 owner + 外部工具	通用 red-team、观测、测试平台	业务 acceptance、监管证据、模型风险验证
Data vendor	外购但强合同	KYC、制裁、商户、市场、地理数据	数据直接影响拒绝、授信、收费、风控或客户通知
Frontline operations	hybrid	低风险标注、质检、知识运营	客户敏感、投诉、争议、监管响应、人工复核

5.2 决策门禁

Gate	核心问题	必要证据	停止信号
Problem gate	业务痛点是否清楚，是否必须用 AI	Opportunity canvas、baseline、no-AI option、owner	只有“想试 AI”，没有可衡量问题
Risk gate	用例是否涉及客户权益、敏感数据、监管义务或关键运营	Risk tier、data classification、customer impact、process map	高风险但无人工复核、无审计日志、无退出
Option gate	build / buy / hybrid 是否基于证据	Decision matrix、TCO、control gap、architecture option	只因供应商 demo 漂亮而选型
Vendor gate	供应商是否满足进入 PoC 的最低要求	Due diligence pack、security evidence、data terms、subprocessor list	不接受数据限制、审计权、事故通知或模型变更通知
Pilot gate	PoC 是否证明价值和控制	Eval report、workflow UAT、risk sign-off、contract path	准确率不稳定、无法解释、无法复现、业务不信任
Production gate	是否能运营、监控、响应、退出	Runbook、SLA、monitoring、incident plan、exit plan	没有 owner、没有日志、没有 kill switch、没有回滚

6. 第三方风险生命周期

联合指引的生命周期语言可转成 AI 项目执行流：

Strategy and planning
  -> use case and criticality tiering
  -> market scan / RFI / RFP
  -> due diligence
  -> contract negotiation
  -> onboarding and implementation
  -> pilot and validation
  -> production monitoring
  -> change management
  -> incident management
  -> renewal / expansion
  -> termination and exit

Stage	关键问题	AI-specific evidence	主要责任方
Strategy and planning	为什么需要第三方，是否符合目标架构和风险偏好	Build/buy/hybrid memo、target architecture、risk tier、TCO	PM、Architect、Business、Enterprise Architecture
Use case tiering	数据和客户影响有多大，是否关键活动	Data classification、customer impact assessment、criticality assessment	BA、Risk、Privacy、Compliance
Market scan	市场有哪些供应商，是否存在集中度和锁定	Vendor landscape map、longlist、dependency map	Procurement、PM、Architect
RFI / RFP	需求是否足够具体，供应商是否按同一标准比较	Requirements-to-eval matrix、RFP response matrix、demo script	PM、BA、Procurement
Due diligence	供应商能否安全、合规、稳定地支持用例	Security pack、AI governance pack、model evidence、data flow、subprocessor list	Third-party Risk、Security、Model Risk、Legal
Contract negotiation	控制是否写入可执行合同	MSA、DPA、SLA、AI addendum、audit rights、exit terms	Legal、Procurement、Risk、Business
Onboarding	账号、权限、网络、数据、日志、培训是否受控	Access approval、integration checklist、training evidence、runbook	Security、IT、Platform、Business Ops
Pilot	是否证明价值、风险可控、用户接受	Eval report、UAT、red-team result、pilot metrics、issue log	PM、BA、Model Risk、Business
Production monitoring	供应商表现和 AI 行为是否持续可控	SLA dashboard、quality metrics、incident log、cost dashboard、vendor review minutes	Vendor Owner、Ops、Risk、SRE
Change management	模型、数据、prompt、工具、子处理方变更是否受控	Change notice、impact assessment、regression eval、approval record	Vendor Owner、Architect、Model Risk
Incident management	数据、模型、安全、服务、客户影响事故如何通知和处置	Incident notice、timeline、customer impact、root cause、remediation evidence	Incident Commander、Legal、Security、Business
Renewal / expansion	是否继续、扩大或限制供应商	Renewal scorecard、risk acceptance、audit findings、cost trend	Procurement、Business、Risk
Termination and exit	如何迁移、删除、证明、替换	Exit plan、export package、deletion certificate、parallel run result	Vendor Owner、Architect、Legal、Data

生命周期原则：

风险管理从计划阶段开始，不是在合同签完后补材料。
高风险或关键活动供应商需要更深的尽调、更强的合同、更频繁的监控和更完整的退出计划。
采购完成不是治理结束；AI 系统的模型、数据、知识库、prompt、agent tool 和供应商子处理方都会变化。
任何生产使用都需要 owner、RACI、日志、SLA、incident path、change path 和 exit path。

7. 风险分级：Criticality And AI Impact

第三方关系的风险强度取决于活动关键性、数据敏感度、客户影响、替代难度和操作复杂度。

Tier	金融零售 AI 例子	关键风险	控制强度
Tier 1: Critical / High impact	授信建议、反欺诈拦截、AML alert triage、KYC 决策辅助、催收策略、支付风险、财富适当性、监管报告、客户投诉处置	客户权益、合规、消费者保护、模型风险、操作风险、声誉风险	深度尽调、法务合同红线、独立验证、人工复核、审计权、强 SLA、事故通知、退出演练
Tier 2: Important / Controlled impact	客服 copilot、网点/呼叫中心知识助手、贷款文档抽取、支付争议摘要、运营质检、内部政策问答	错误建议、隐私泄露、员工过度依赖、知识陈旧	标准尽调、RAG 评估、日志、HITL、监控、变更通知、供应商季度评审
Tier 3: Low impact / Internal productivity	内部会议摘要、代码辅助、非敏感文档草稿、培训内容生成、市场研究摘要	数据泄露、版权/IP、输出质量、员工误用	轻量尽调、数据分类限制、使用政策、访问控制、成本监控
Tier 4: Sandbox / Learning	无真实客户数据的学习、原型、非生产 demo	数据误投、shadow AI、误认为可上线	禁止敏感数据、明确环境隔离、短期账号、无生产连接

风险升级触发：

使用真实客户 PII、账户、交易、收入、信用、投诉、健康、身份或生物识别数据。
影响授信、收费、账户限制、欺诈拦截、催收、投诉结论、客户沟通或监管报告。
AI 输出直接写入核心系统、case management、CRM、支付、贷款、AML 或 KYC 系统。
供应商模型或数据源不可替代，或迁移成本高。
供应商拒绝合同化数据限制、模型变更通知、审计权、事故通知或退出协助。

8. Due Diligence：AI 供应商尽调框架

尽调不是收一份 SOC 2 报告就结束。AI vendor diligence 至少覆盖业务、财务、数据、模型、安全、隐私、治理、评估、集成、运营、合同和退出。

8.1 尽调问题总表

Dimension	核心问题	要求证据	红旗信号
Business fit	供应商是否真正支持目标 workflow，而不是通用 demo	Reference architecture、case study、workflow demo、customer references	只展示聊天窗口，不展示异常路径和审批流程
Financial viability	供应商是否能持续运营，是否依赖单一融资或大客户	财务概况、保险、业务连续性说明、客户集中度说明	现金流不稳、服务依赖小团队、无连续性安排
Data usage	prompt、completion、embedding、日志、support ticket、telemetry 是否用于训练或改进模型	Data processing terms、DPA、retention schedule、training opt-out confirmation	“默认不训练”但日志和人工审核条款模糊
Data residency	数据处理和存储在哪些国家、云区、支持中心	Data flow diagram、region list、subprocessor location、support access policy	销售口径说本地，但合同允许全球处理
Privacy	是否支持 PII 最小化、删除、更正、访问请求和数据主体权利	Privacy policy、DPA、deletion process、DSAR support	删除只覆盖主库，不覆盖日志、embedding 和备份
Security	SSO、RBAC、SCIM、加密、密钥、网络隔离、漏洞管理是否成熟	SOC 2、ISO 27001、pen test summary、secure SDLC、incident policy	无企业级 SSO、共享管理员、弱租户隔离
AI governance	供应商是否有 AI policy、risk assessment、model change、red-team、human oversight	AI governance policy、ISO 42001 evidence、model cards、risk register	只有伦理原则网页，没有生命周期证据
Model identity	使用哪些模型、版本、routing、fallback、fine-tune、embedding 和 reranker	Model inventory、version policy、release notes、eval report	模型身份模糊，无法说明何时升级
Evaluation	是否能按客户业务数据和 rubric 做 eval，而不是只给通用 benchmark	Eval methodology、sample report、negative cases、calibration record	只给总准确率，不给失败分类和样本
RAG controls	权限、引用、索引、来源、刷新、删除如何管理	ACL sync design、index version、citation eval、freshness metrics	引用不可验证，权限只在 UI 层控制
Agent controls	工具权限、审批、回滚、幂等、沙箱、kill switch 是否完整	Tool permission matrix、approval workflow、trace schema	agent 可直接写入系统且无人工批准
Integration	与 IAM、SIEM、DLP、CRM、core、case、data lake 是否可控集成	API docs、auth pattern、integration architecture、sandbox	要求共享数据库账号或长期高权限 token
Operations	生产 SLA、support、DR、RTO/RPO、status page、incident postmortem 是否成熟	SLA、DR test、support matrix、status history、postmortem sample	SLA 排除关键依赖，支持时间不覆盖业务时段
Auditability	能否重建 case-level 证据链	Audit log schema、export API、admin log、trace sample	日志只有聊天记录，没有模型、prompt、source、tool 版本
Subprocessors	是否列明所有模型、云、数据、标注、支持、观测和外包子处理方	Subprocessor schedule、change notice policy、approval workflow	“按需使用子处理方”但不提前通知
Contractability	销售承诺是否能写入合同	MSA、DPA、SLA、AI addendum、security addendum	演示承诺无法进入合同或 order form
Exit	数据、配置、prompt、index、日志、eval、case history 能否导出	Export docs、termination assistance、deletion certificate	只能导出原始文档，无法导出审计日志和配置

8.2 分角色尽调

Role	必问问题	产出
AI PM	供应商是否解决目标用户的真实 workflow，是否支持 pilot metric 和 adoption metric	Vendor value scorecard、pilot success criteria
AI BA	AS-IS / TO-BE 流程、异常路径、人工复核、证据链是否清楚	Workflow map、requirements-to-eval matrix
Architect	数据流、系统边界、模型路由、RAG、agent tool、日志、替换点是否合理	Architecture review、ADR、dependency map
Security	IAM、加密、tenant isolation、logging、vulnerability、incident 是否达标	Security assessment、risk findings
Privacy	数据分类、用途限制、保留、删除、跨境、支持访问是否可控	Privacy impact notes、DPA issues
Model Risk	模型用途、验证、变更、监控、限制和有效挑战是否充分	Model risk assessment、validation plan
Third-party Risk	关键性、财务、运营、分包、持续监控和退出是否符合供应商政策	TPRM risk assessment
Legal	数据、IP、责任、审计权、监管配合、事故通知、终止权是否合同化	Contract issue list
Procurement	商业条款、价格、续费、SLA credit、替代供应商、集中度是否可管理	Commercial analysis、negotiation plan

8.3 最小可接受证据包

Tier 1 / Tier 2 AI 供应商进入生产前，应至少拿到以下证据：

Evidence	Why it matters	验收要点
End-to-end data flow diagram	确认数据进入哪些系统和地区	覆盖 prompt、completion、embedding、logs、telemetry、support、backup
Data processing terms / DPA	把数据用途、保留、删除、跨境、子处理方合同化	明确禁止训练、再识别、再销售和未授权二次使用
SOC 2 Type II or equivalent control evidence	验证服务组织控制运行	范围覆盖所采购服务，报告期有效，例外项有整改
ISO 27001 certificate or ISMS evidence	验证安全管理体系	证书范围覆盖产品、云环境、运营组织
AI governance policy or ISO 42001 evidence	验证 AI 生命周期管理	覆盖风险评估、模型变更、评估、监控、人工监督
Model inventory and version policy	防止模型黑盒和静默升级	说明模型、版本、fallback、升级通知和回滚
Eval methodology and sample report	验证质量而非只听销售承诺	包含业务样本、负例、失败分类、阈值、复测机制
Subprocessor list	识别供应链和跨境处理	覆盖模型、云、数据、支持、标注、监控、外包
Incident response policy	定义通知、升级和补救	覆盖安全、隐私、AI 质量、服务中断、模型异常
Exit and export documentation	降低锁定和终止风险	包含数据、配置、日志、eval、索引、删除证明

9. 合同条款：AI Vendor Contract Control Pack

合同条款要把“供应商说可以”变成“供应商必须做”。下面是金融零售 AI 项目的核心条款类别。

Clause area	控制目标	推荐写入点	不可接受写法
Data use restrictions	供应商不得把客户数据、prompt、completion、embedding、日志用于训练、微调、产品改进、再销售或第三方共享，除非本机构明确书面同意	MSA、DPA、AI addendum、order form	“用于改进服务”未限定范围
Data retention and deletion	数据保留期限、备份删除、日志删除、embedding 删除、终止后删除证明	DPA、security addendum、termination clause	只删除原始文档，不覆盖衍生数据和日志
Model update notice	模型、embedding、reranker、guardrail、prompt template、agent tool、RAG pipeline 重大变更需提前通知	AI addendum、change management clause	供应商可单方随时变更核心模型
Approval for high-impact change	对客户权益、合规、关键运营有影响的变更需客户审批或可选择延迟	AI addendum、SLA、service description	通知即生效，无测试窗口
Audit rights	客户、监管、内审、外审可获得合理审计证据或进行审查	Audit clause、regulatory cooperation clause	仅提供营销白皮书，不提供控制证据
SOC / ISO / AI governance evidence	定期提供 SOC 2、ISO、penetration test summary、AI governance evidence、bridge letter	Security addendum、vendor review schedule	证据只在签约前提供，续约前不更新
SLA and service credits	可用性、延迟、支持响应、DR、RTO/RPO、data freshness、quality defect response	SLA schedule	SLA 排除模型供应商、云依赖和高峰期
Incident notification	安全、隐私、AI 质量、模型异常、错误输出、数据暴露、服务中断、子处理方事故需在约定时限通知	Incident clause、DPA、security addendum	只通知法律意义上的 data breach，不通知 AI 事故
Subprocessors	子处理方清单、变更提前通知、异议权、同等保护义务	DPA、subprocessor schedule	供应商可随意新增子处理方
Data residency and support access	限制处理地区、支持访问地区、人员背景、离岸访问审批	DPA、support terms	“全球支持”未定义访问控制
IP and output ownership	明确输入、输出、prompt、配置、workflow、评估数据、业务规则归属	MSA、SOW、AI addendum	供应商拥有客户配置和业务规则
Regulatory cooperation	协助监管问询、审计、证据导出、事故说明、模型和控制解释	Regulatory cooperation clause	供应商只承诺普通客户支持
Termination and exit	终止权、迁移协助、数据导出、格式、时间、费用、删除证明、过渡服务	Termination clause、exit schedule	终止后立即断供且无导出义务
Liability and indemnity	数据泄露、IP 侵权、监管罚款、故意或重大过失、保密违约、服务中断的责任边界	Liability clause、indemnity clause	责任上限低于可能损失，排除核心风险
Pricing and renewal	token、seat、case、storage、connector、eval、support、overage、续费涨价、预算告警	Order form、pricing schedule	无成本上限，无使用明细，无续费涨幅约束

9.1 数据使用限制条款要点

金融零售 AI 合同中，数据限制应覆盖以下对象：

Data object	风险	条款要求
Prompts	可能包含客户、账户、交易、内部政策、业务策略	不得训练、再识别、共享、人工查看，除非受控支持场景
Completions	可能包含推断、建议、风险标签、客户沟通草稿	不得用于供应商模型改进或其他客户服务
Embeddings	可泄露语义信息，删除和迁移常被忽略	视为敏感衍生数据，支持删除、导出、重建
Logs / traces	包含输入、输出、工具调用、source、用户行为	最小化、脱敏、保留期限、访问审计、导出
Fine-tuning data	高价值业务样本和标注	明确所有权、隔离、删除、用途、模型归属
Eval dataset	包含负例、风险场景、业务规则	不得纳入供应商通用 benchmark 或共享
Support tickets	常包含截图、日志、客户信息	支持数据同样受 DPA、访问控制和删除约束
Telemetry	可能揭示业务量、客户行为、系统使用	只允许服务运营必要指标，禁止商业画像和再销售

推荐原则：

默认禁止训练、微调、产品改进和跨客户学习；例外必须由数据 owner、legal、privacy、risk 书面批准。
禁止把客户数据输入供应商公共或消费者版 AI 工具。
embedding、vector index、trace、prompt cache 和 backup 都属于数据治理范围。
供应商人工访问生产数据必须有审批、最小权限、时间限制、日志和定期复核。

9.2 模型更新与变更通知

AI vendor 的核心风险之一是模型行为可变。合同和运行机制都要定义变更等级。

Change type	例子	通知要求	客户动作
Major model change	GPT-4.x 到新一代模型，embedding 维度变化，reranker 替换	提前 30-90 天，提供 release notes、eval delta、回滚方案	回归评估、风险审批、业务 UAT
Material RAG change	chunking、index schema、permission sync、citation algorithm 变化	提前 15-30 天，提供影响说明	citation eval、权限测试、知识 freshness 检查
Agent/tool change	新增工具、扩大写权限、改变审批流	变更前客户批准	threat model、tool permission review、HITL 测试
Guardrail/policy change	拒答策略、敏感内容策略、金融建议边界变化	提前通知并提供测试结果	policy regression、frontline training
Minor patch	安全补丁、UI bug fix、低风险性能优化	发布说明或定期摘要	监控异常和用户反馈
Emergency change	安全漏洞、重大故障、紧急禁用模型	立即通知，事后报告	incident review、临时控制、风险接受

最低要求：

供应商不得对高风险生产用例进行无通知的重大模型替换。
客户应有测试窗口、延迟升级权、回滚路径或模型版本 pinning。
变更必须进入内部 AI release gate：eval、security、privacy、model risk、business sign-off。
供应商 release note 必须能映射到本机构使用的模型、API、region、feature 和数据流。

9.3 Audit rights：审计权不是形式条款

AI 供应商审计权应覆盖：

Audit object	要看什么	证据例子
Data handling	数据流、保留、删除、访问、子处理方	DPA、data flow、access log、deletion certificate
Security controls	IAM、加密、漏洞、SDLC、incident、tenant isolation	SOC 2、ISO 27001、pen test summary、policy
AI governance	risk assessment、model inventory、eval、red-team、change management	AI policy、ISO 42001 evidence、model cards、release gate
Operational resilience	DR、RTO/RPO、status、support、capacity、dependency	DR test report、SLA dashboard、incident postmortem
Case-level trace	输入、输出、模型、prompt、source、tool、approval、final action	Trace export、audit log、workflow record
Subprocessor controls	子处理方尽调、合同传递、变更通知	Subprocessor list、control inheritance matrix

审计权设计要现实：

对大型云和模型供应商，现场审计可能受限，应争取 SOC 2、ISO、第三方审计报告、桥接信、监管协作和专项问询。
对高风险垂直 SaaS、数据供应商、外包团队，应争取更具体的客户审查、样本抽查、人员访问记录和整改跟踪。
监管机构问询时，供应商必须提供合理协助，不能把“商业秘密”作为拒绝所有解释的理由。

10. SOC 2 / ISO / AI Governance Evidence：如何看证据

证书和报告要读范围、例外、期间和相关性。

Evidence	看什么	常见误读	金融 AI 审查问法
SOC 2 Type I	某一时间点控制设计	误以为证明控制长期有效运行	报告日期是什么，覆盖服务是否包括本次采购的 AI 产品
SOC 2 Type II	一段期间控制设计与运行	只看是否有报告，不看例外项	例外项是否影响数据、可用性、访问、变更、incident
ISO 27001	信息安全管理体系	误以为覆盖 AI 模型治理	证书范围是否覆盖产品、云、运营和支持组织
ISO 42001	AI 管理体系	误以为证明某个模型无风险	AIMS 范围是否覆盖供应商提供的 AI 服务和生命周期控制
Pen test summary	安全测试结果	把摘要当完整安全保证	高危漏洞是否关闭，测试是否覆盖 API、tenant、agent、RAG
AI model card	模型用途、限制、评估	模型卡替代系统级验证	是否覆盖本机构用例、语言、数据、客户群和失败场景
Red-team report	对抗测试和安全边界	只看通过率	是否覆盖 prompt injection、data exfiltration、financial advice、tool misuse
Responsible AI policy	治理原则和流程	把原则当控制运行证据	是否有 risk register、change log、eval gate、incident workflow
Bridge letter	报告期后控制变化说明	以为可长期替代审计报告	覆盖期、变化、未审计性质是否清楚

审查技巧：

先看 scope，再看 period，再看 exception，再看 mapping to purchased service。
证据要和合同、架构、数据流一致。销售口径、白皮书、DPA、SOC 报告、实际配置不能互相矛盾。
对 Tier 1 用例，供应商证据只是输入；机构仍要完成内部 risk assessment、eval、UAT、release approval 和 monitoring。

11. SLA / SLO：AI 供应商服务指标

传统 SLA 只看 uptime 不够。AI 系统还要看质量、延迟、成本、数据新鲜度和恢复能力。

SLA / SLO category	指标例子	金融零售解释
Availability	monthly uptime、API availability、region availability	客服、支付争议、AML case 等流程不能在关键时段不可用
Latency	p50 / p95 / p99 response time、streaming latency	前台坐席 copilot、实时欺诈辅助对延迟敏感
Throughput	rate limit、concurrent users、batch capacity	月末、促销、工资日、欺诈峰值要能扩容
Disaster recovery	RTO、RPO、region failover、backup restore test	关键运营场景需要降级和恢复路径
Support	severity response、resolution target、named support	事故时不能只有普通工单队列
Data freshness	knowledge sync frequency、data vendor refresh	政策、费率、制裁名单、KYC 数据过期会造成错误
Quality SLO	groundedness、citation correctness、extraction accuracy、tool success rate	AI 输出质量是业务 SLA 的一部分
Safety SLO	policy violation rate、unsafe action block rate、PII leakage test	保护客户和机构不被模型错误伤害
Cost SLO	token budget、case cost、overage alert、monthly cap	防止 agent loop、异常调用和账单失控
Observability	trace completeness、audit log export success、SIEM delivery	没有日志就无法审计、复盘和验证

示例指标设计：

Use case	Minimum SLA / SLO
Contact center copilot	99.9% availability；p95 响应小于 3 秒；引用正确率大于 95%；高风险答案人工确认
Loan document extraction	批处理完成时间小于业务 SLA；关键字段准确率按字段分别监控；低置信度自动进入人工复核
AML alert summarization	case trace 100% 保留；source citation 必填；模型不可直接关闭 alert
Payments dispute assistant	服务中断时回退到人工流程；客户沟通草稿必须由员工确认
Internal policy RAG	knowledge freshness 小于 24 小时；过期文档不可检索；权限与源系统一致

12. Exit Plan：退出计划和可替换性

退出计划不是合同终止时才写。高风险 AI 供应商进入生产前就要有 exit design。

12.1 退出触发

Trigger	例子	处置
Performance failure	质量长期低于阈值、幻觉率上升、SLA 反复违约	限制范围、暂停扩展、启动替代方案
Security / privacy incident	数据暴露、未授权访问、子处理方事故	临时停用、取证、客户影响评估、合同权利执行
Model change risk	供应商强制升级且不支持验证或回滚	冻结版本、转移流量、重新评估
Commercial risk	价格大幅上涨、续约条款不可接受	迁移计划、替代供应商、内部构建
Regulatory concern	监管或内审质疑控制不足	提供证据、补控制、必要时退出
Strategic mismatch	供应商路线图不再支持目标架构	逐步替换、减少依赖
Concentration risk	过度依赖单一模型、云、数据或平台	多供应商策略、抽象层、数据可迁移

12.2 退出资产清单

Asset	退出要求
Customer data	结构化导出，字段说明，完整性校验，删除证明
Documents and knowledge base	原始文档、处理状态、metadata、权限映射、索引版本
Embeddings / vector index	可导出或可重建，说明 embedding 模型和维度
Prompts and policies	prompt、system instruction、policy rule、guardrail 配置导出
Workflow config	case flow、approval rules、tool permission、routing rules
Audit logs and traces	输入输出摘要、模型版本、source、tool call、用户、审批、时间戳
Eval assets	eval dataset、rubric、结果、失败分类、阈值
Integration code	API mapping、connector config、auth pattern、webhook
Operational history	SLA report、incident、support ticket、change log
Deletion evidence	主存储、日志、备份、embedding、support artifact 的删除证明

12.3 退出演练

Tier 1 供应商建议至少年度做桌面演练：

选择一个关键流程，如 AML summary 或客服知识助手。
模拟供应商 30 天后停止服务或强制涨价。
检查数据、日志、配置、prompt、eval、知识库是否能导出。
设计替代路径：人工回退、第二供应商、内部模型、功能降级。
记录 gap、补充合同条款、更新 runbook。

退出原则：

架构上保留 provider abstraction，不把业务规则完全埋在供应商黑盒里。
数据和日志要定期导出或同步到机构控制范围。
高风险流程必须有 manual fallback 或 degraded mode。
续约前必须重新评估退出可行性，不让“已经太难迁移”成为被动续约理由。

13. Concentration Risk：集中度风险

AI 集中度不是只看一个供应商金额。要看关键能力是否集中在单点。

Concentration type	例子	风险	控制
Foundation model concentration	大量用例都依赖同一模型家族	模型故障、政策变化、价格上涨、区域限制	多模型评估、路由抽象、fallback、版本 pinning
Cloud concentration	AI workloads 全部在单一云和单一区域	区域故障、合同谈判弱势、技术锁定	多区域、DR、可移植架构、出口带宽计划
RAG platform concentration	所有知识库、权限、索引都在单一 SaaS	数据迁移困难、权限黑盒	定期导出、源系统为 master、索引可重建
Data vendor concentration	欺诈/KYC/制裁依赖单一数据源	覆盖缺口、数据偏差、供应中断	双源校验、质量监控、手工补充流程
Eval vendor concentration	质量判断完全依赖外部 judge	独立性不足、评估偏差	内部 gold set、人工 calibration、第二评估方法
Agent platform concentration	业务 workflow 和 tool 权限绑定平台	迁移成本高，流程不可解释	workflow 文档化、API 抽象、配置导出
Outsourcing concentration	关键知识运营由单一外包团队掌握	人员流失、交付中断、知识流失	双人制、SOP、交接材料、访问最小化

集中度仪表盘建议：

Metric	解释
Number of critical AI use cases per vendor	单一供应商承载多少关键 AI 用例
Percentage of AI spend by vendor	采购金额集中度
Percentage of customer-impacting decisions supported by vendor	客户影响集中度
Model family dependency count	模型家族依赖数量
Exit readiness score	数据、日志、配置、评估、替代方案成熟度
Subprocessor overlap	多个供应商背后是否都依赖同一云或模型

14. Subprocessors：子处理方治理

AI 供应商常常是供应链组合：云、模型、向量库、日志、监控、标注、支持、支付、CRM、数据源都可能成为子处理方。

Subprocessor category	风险	要求
Cloud infrastructure	数据存储和处理地点、区域故障	region、encryption、DR、SOC/ISO、数据驻留
Foundation model provider	数据输入、训练、模型变化	数据不训练、模型版本、日志保留、变更通知
Annotation / human review	人工接触敏感数据	背景检查、最小访问、地点限制、培训、日志
Observability / logging	日志集中，含敏感信息	脱敏、保留、访问、导出、删除
Support platform	工单截图和日志泄露	DPA 覆盖、访问控制、工单删除
Data provider	数据授权、偏差、更新	来源、许可、刷新、纠错、使用限制
Security tooling	扫描和监控访问系统	最小权限、保密、审计
Offshore delivery partner	跨境访问、人员控制	明确地点、审批、客户数据访问限制

子处理方合同要求：

签约前提供完整清单，包含名称、服务、地点、数据类型、控制证据。
新增或替换关键子处理方前提前通知，并给客户合理异议或退出权。
子处理方承担不低于主合同的数据保护、安全和保密义务。
主供应商对其子处理方行为承担责任。
供应商定期提供子处理方变更摘要和控制复核结果。

15. Incident Notification：AI 事故通知

AI 事故不只包括 data breach。金融零售 AI 需要覆盖安全、隐私、模型、质量、操作和客户影响。

Incident type	例子	通知触发	初始通知内容
Security incident	未授权访问、凭证泄露、漏洞被利用	影响客户数据、系统安全或服务完整性	时间、范围、系统、数据类型、初步控制措施
Privacy incident	PII 暴露、错误共享、跨境处理异常	涉及个人信息或隐私义务	受影响数据、人数估计、处理地点、补救
AI quality incident	批量错误摘要、错误建议、引用错误导致业务误判	影响客户沟通、决策、投诉、合规或关键运营	影响用例、模型版本、样本、错误类型、暂停措施
Model behavior incident	模型升级后拒答、幻觉、偏见、越权建议明显上升	指标超过阈值或高风险失败出现	变更内容、eval delta、回滚计划
RAG incident	权限泄露、旧政策被引用、引用伪造	敏感文档或错误来源影响输出	source、index version、权限影响、修复
Agent/tool incident	agent 执行错误动作、重复调用、越权写入	下游系统被修改或可能造成客户影响	tool、action、records affected、rollback
Availability incident	服务中断、延迟严重、区域故障	超过 SLA 或影响关键业务时段	当前状态、ETA、workaround、根因初判
Cost incident	runaway token/tool calls、异常账单	超过预算阈值或异常调用	调用量、原因、限制措施、费用处理

通知节奏建议：

Severity	例子	初始通知	更新频率	事后报告
Sev 1	客户数据暴露、关键业务中断、错误影响大量客户、监管报告风险	1-4 小时	每 4-8 小时	5-10 个工作日
Sev 2	高风险用例局部受影响、可通过人工回退控制	24 小时内	每日	10 个工作日
Sev 3	低风险质量问题、非关键服务降级	2 个工作日内	按需	月度汇总

事故条款原则：

通知时限不能只绑定法律定义的 breach；AI 质量和模型异常也要纳入。
供应商必须支持客户进行客户影响评估、监管沟通、证据保全和补救。
供应商应提供 root cause、timeline、受影响范围、修复、预防措施和验证结果。
客户应保留暂停、降级、切换、禁用特定模型或终止的权利。

16. 金融零售 AI Use Case 风险地图

Use case	典型供应商	主要风险	控制设计
客服知识助手	RAG SaaS、LLM、contact center platform	错误费率、旧政策、过度承诺、PII 泄露	权限同步、引用必填、人工确认、知识 freshness、话术边界
投诉处理摘要	LLM、case management、speech-to-text	客户陈述被错误总结、证据链缺失	原文引用、人工复核、日志保留、不可自动关闭投诉
贷款文档抽取	OCR、document AI、LLM	字段抽取错误影响授信	字段级置信度、双人复核、抽样验证、模型变更评估
信贷 policy copilot	RAG、内部政策库、LLM	错误解释政策，员工过度依赖	只读辅助、来源链接、政策版本、生效日期、培训
欺诈 case assistant	数据 vendor、LLM、agent	错误拦截或放行交易	人工审批、特征解释、下游写入权限控制、审计
AML alert summarization	AML data、LLM、case workflow	漏掉可疑活动、误导调查员	不得自动 SAR 决策、source trace、model risk review
KYC onboarding	IDV vendor、data vendor、document AI	身份误判、偏差、数据授权	数据来源审查、纠错流程、人工升级、fairness check
支付争议助手	LLM、RAG、payment platform	错误解释规则，客户沟通风险	模板化输出、人工确认、监管话术审查、日志
催收策略辅助	LLM、CRM、collections platform	不当催收、消费者保护、敏感群体影响	合规规则 guardrail、人工审批、禁用高风险话术
财富/投资适当性辅助	LLM、portfolio data、market data	误导性建议、适当性风险	适用范围限制、持牌人员复核、强披露、模型验证
员工代码助手	Foundation model、IDE plugin	代码泄露、开源许可证、漏洞	禁止敏感代码外传、代码扫描、许可证检查
供应链/采购文本分析	LLM、contract AI	合同条款误读	Legal review、source citation、不可替代律师审批

17. PM / BA / Architect / Risk 角色分工

Activity	PM	BA	Architect	Risk / Compliance	Legal	Procurement	Security / Privacy	Model Risk	Internal Audit
Define use case	A	R	C	C	C	I	C	C	I
Data classification	C	R	C	C	I	I	A	C	I
Build/buy/hybrid memo	A	C	R	C	C	C	C	C	I
Vendor RFI/RFP	R	R	C	C	C	A	C	C	I
Due diligence	C	C	C	A	C	R	R	R	I
Contract negotiation	C	C	C	C	A	R	C	C	I
Architecture review	C	C	A	C	I	I	R	C	I
Eval and pilot	A	R	C	C	I	I	C	R	I
Production approval	A	C	R	A	C	I	R	R	I
Ongoing monitoring	A	C	C	R	I	R	R	R	C
Incident response	A	C	R	R	R	C	A	C	C
Renewal decision	A	C	C	R	C	A	C	C	C
Exit execution	A	C	R	C	R	R	C	C	I

RACI 说明：R = Responsible，A = Accountable，C = Consulted，I = Informed。

关键角色能力：

Role	必须能说清楚的问题
AI PM	为什么要买，成功指标是什么，用户如何采用，风险如何不伤害体验
AI BA	流程、异常、数据、人工复核、证据链如何落地
Architect	供应商在系统边界内做什么，哪些部分可替换，如何记录和回滚
Risk / Compliance	用例风险、监管义务、客户影响、控制和 residual risk 是否可接受
Legal	数据、责任、审计、监管配合、事故、终止和 IP 是否合同化
Procurement	商业条款、供应商治理、续约、集中度和退出是否可管理
Security / Privacy	访问、加密、数据、跨境、日志、漏洞、隐私权利是否受控
Model Risk	模型和 AI 系统是否被验证、监控、变更管理和有效挑战
Internal Audit	控制是否真实运行，证据是否完整、准确、及时、可复现

18. Templates：可复制工作产物

以下模板使用“字段 + 填写规则 + 示例值”，便于直接迁移到工作文档。

Field	填写规则	示例值
Use case name	写业务场景，不写供应商品牌	Retail banking contact center policy copilot
Business owner	明确最终业务负责人	Head of Customer Operations
Vendor category	选择供应商类型	RAG SaaS + foundation model provider
Data involved	列出数据类别	内部政策、产品费率、客户对话摘要、坐席用户 ID
Customer impact	说明是否影响客户权益	AI 只生成坐席建议，客户沟通前必须人工确认
Risk tier	使用本手册 Tier	Tier 2: Important / Controlled impact
Build/buy/hybrid rationale	说明选择理由	Buy RAG SaaS for speed，AI gateway and audit logs controlled internally
Key controls	列出前五个控制	SSO、RBAC、引用必填、知识 freshness、人工确认
Required evidence	列出供应商必须提供的材料	SOC 2 Type II、DPA、model change policy、subprocessor list、exit docs
Pilot success metric	可衡量	Average handle time 降低 12%，引用正确率大于 95%，坐席信任评分大于 4/5
Stop criteria	明确停止条件	PII 泄露测试失败、旧政策引用超过阈值、供应商拒绝数据不训练条款

18.2 Vendor Scorecard

Dimension	Weight	Score 1	Score 3	Score 5
Business workflow fit	10	通用 demo	支持部分流程	支持端到端流程和异常路径
Data restrictions	12	条款模糊	可配置部分限制	明确不训练、不共享、可删除、可审计
Security evidence	10	无成熟证据	有 SOC 或 ISO 但范围有限	SOC 2 Type II、ISO、pen test、SSO/RBAC 完整
AI governance	10	原则性材料	有部分流程	有模型清单、变更、eval、red-team、incident
Evaluation capability	10	只给 benchmark	支持客户样本测试	支持业务 gold set、负例、阈值、失败分类
Auditability	10	聊天记录级日志	有基础日志	case-level trace 可导出
SLA / resilience	8	Best effort	基础 SLA	SLA、DR、RTO/RPO、degraded mode 完整
Integration	8	手工导入导出	API 可用	IAM、SIEM、DLP、workflow 集成成熟
Contractability	8	销售承诺多	部分可写入合同	关键控制可合同化
Exit readiness	8	无明确导出	可导出部分数据	数据、配置、日志、eval、索引可导出或重建
Concentration risk	4	单点依赖严重	有部分替代	支持多模型、多区域、抽象层
Commercial clarity	2	价格不可预测	基本价格清楚	单 case 成本、预算告警、续费上限清楚

评分解释：

0-50：仅适合无敏感数据学习环境。
51-70：低风险 pilot，限制数据和功能。
71-85：可进入受控 pilot 或 Tier 2 生产候选。
86-100：生产候选，仍需通过内部 release gate 和合同审批。

18.3 Contract Redline Checklist

Clause	最低可接受要求	示例审查结论
Data training	客户数据默认不用于训练、微调、产品改进	Vendor agrees to no training for prompts, outputs, logs and embeddings
Change notice	重大模型和 RAG 变更提前通知	30-day notice for model family or embedding change
Audit rights	可获得审计证据和监管协助	SOC 2 annually, bridge letter, regulatory cooperation included
Incident notice	覆盖安全、隐私、AI 质量和服务中断	Sev 1 initial notice within 4 hours
Subprocessors	清单、提前通知、异议权	30-day notice for new critical subprocessor
Exit	数据、配置、日志、eval、删除证明	Export available in JSON/CSV plus deletion certificate
SLA	可用性、延迟、支持、DR	99.9% availability, p95 latency, named support
Liability	高风险违约不被过低责任上限吞掉	Data breach and confidentiality carve-out negotiated

18.4 Model Change Notice Review Memo

Field	填写规则	示例值
Change summary	一句话说明变更	Vendor will upgrade embedding model from Embed-A v2 to Embed-A v3 for enterprise RAG
Impacted systems	列出系统和用例	Contact center policy copilot, complaint summarization assistant
Vendor evidence	列出收到材料	Release notes, eval delta, migration guide, rollback option
Internal tests	列出必须复测	Citation correctness, permission leakage, stale policy retrieval, Chinese-English query set
Risk decision	选择 approve、defer、reject、limited rollout	Defer production upgrade until regression eval passes
Owner and date	记录责任人和日期	AI Platform Owner, 2026-07-15

18.5 Incident Intake Template

Field	填写规则	示例值
Incident category	选择类型	AI quality incident
Severity	Sev 1 / Sev 2 / Sev 3	Sev 2
Use case	业务场景	Payments dispute assistant
Vendor component	受影响组件	RAG citation service
Customer impact	描述影响	42 draft letters cited an outdated dispute policy; no letters sent without human approval
Immediate containment	立即控制	Disabled outdated source, switched workflow to manual review
Evidence preserved	保存证据	Trace IDs, model version, source document version, user actions
Regulatory / legal review	是否需要	Legal and compliance reviewing customer communication obligation
Next update	时间	2026-07-02 10:00 America/Chicago

18.6 Exit Plan Template

Field	填写规则	示例值
Exit trigger	明确触发条件	Supplier discontinues model version required by Tier 1 workflow
Replacement path	写替代方案	Route through internal AI gateway to approved secondary model
Data export	列出导出范围	Documents, metadata, ACL, prompts, workflow config, traces, eval results
Format	明确格式	JSON for config, CSV for logs, source files in original format
Parallel run	说明并行验证	Two-week shadow run with 500 historical cases
Deletion proof	说明证明方式	Written deletion certificate covering primary store, logs, embeddings and backups
Business fallback	说明人工或降级流程	Contact center returns to existing knowledge base and supervisor approval
Exit owner	明确负责人	Vendor Owner under Customer Operations

19. 30-Day Lab：AI Vendor Risk 实战训练

目标：30 天内完成一个金融零售 AI 供应商风险案例包，可作为面试和作品集材料。

Day	训练任务	产出
1	选择场景：客服 copilot、AML summary、贷款文档抽取、支付争议助手四选一	Use case one-pager
2	画 AS-IS / TO-BE 流程，标出 AI 介入点和人工复核	Workflow map
3	做数据分类，列出 prompt、completion、embedding、logs、support data	Data inventory
4	做 customer impact 和 risk tier	Risk tier memo
5	写 build / buy / hybrid 决策	Decision matrix
6	建 vendor landscape：foundation model、cloud、RAG、agent、data、eval	Vendor dependency map
7	写 RFI 问题清单	RFI questionnaire
8	写 demo script，要求供应商展示异常路径	Demo script
9	建 vendor scorecard 权重	Scorecard
10	设计 due diligence evidence request	Evidence request list
11	写数据使用限制条款要点	Data use addendum notes
12	写模型变更通知要求	Model change clause notes
13	写审计权和监管协作要求	Audit rights notes
14	写 SLA / SLO 指标	SLA schedule draft
15	设计 eval 数据集和失败分类	Eval plan
16	设计 RAG 权限和引用测试	RAG control test
17	设计 agent tool permission matrix	Tool permission matrix
18	做 subprocessor inventory 模板	Subprocessor review sheet
19	做 concentration risk dashboard 草稿	Concentration risk view
20	写 incident notification matrix	Incident severity matrix
21	写 production monitoring dashboard 指标	Monitoring spec
22	写 renewal review checklist	Renewal checklist
23	写 exit plan	Exit plan
24	把所有证据映射到 NIST AI RMF Govern / Map / Measure / Manage	Control mapping
25	把所有证据映射到 ISO/IEC 42001 AIMS 思路	AIMS evidence map
26	做 PM / BA / Architect / Risk RACI	RACI
27	写 executive decision memo	Executive memo
28	做 10 分钟面试讲解脚本	Interview storyline
29	进行一次自我红队：找 10 个供应商绕过控制的方式	Red-team notes
30	整理成作品集案例包	Portfolio case pack

30 天交付标准：

能讲清楚为什么选 buy、build 或 hybrid。
能展示供应商链路、数据流、风险分级和控制。
能把尽调问题转成合同条款和运行证据。
能说明 model update、subprocessor、incident、exit 和 concentration risk。
能从 PM、BA、Architect、Risk 四个视角回答面试追问。

20. Interview Answers：面试答案

Q1：AI 供应商风险和传统 SaaS 供应商风险有什么不同？

30 秒回答：

AI 供应商风险多了模型行为、数据二次使用、prompt / embedding / trace 泄露、模型静默更新、RAG 权限、agent 工具误用和评估不可复现。传统 SaaS 主要看安全、可用性、隐私和运营；AI 还必须看模型生命周期、输出质量、变更门禁和人机协作责任。

2 分钟展开：

传统 SaaS 的风险对象通常是系统、数据和服务可用性。
AI 系统的风险对象包括 model、prompt、RAG index、embedding、tool、judge、guardrail 和 human override。
供应商如果更新模型，系统行为可能变化，即使 API 没变。
金融零售场景下，错误输出可能影响授信、投诉、AML、欺诈、支付争议和客户沟通。
所以要把第三方生命周期和 AI lifecycle 合并：尽调、合同、eval、change notice、SLA、incident、audit、exit 都要 AI-specific。

Q2：如何判断一个 AI vendor 是否可以进入 pilot？

30 秒回答：

先看用例风险和数据分类，再看供应商是否能满足最低证据包：数据不训练、数据流清楚、SOC/ISO 证据、模型版本和变更政策、eval 方法、subprocessor list、incident 通知和退出路径。pilot 也必须有成功指标和停止条件。

2 分钟展开：

先定义业务问题、baseline 和 no-AI option。
做 risk tier：是否影响客户权益、监管义务、关键运营或敏感数据。
供应商至少要回答数据如何处理、模型如何更新、日志如何保留、如何审计、如何退出。
pilot 必须限制数据和范围，不能因为是 PoC 就输入真实敏感数据。
成功指标同时包括业务价值和控制指标，例如准确率、引用正确率、人工复核通过率、用户信任、PII 泄露测试、延迟和成本。

Q3：合同中最重要的 AI 条款是什么？

30 秒回答：

我会优先看数据使用限制、模型变更通知、审计权、事故通知、subprocessor、SLA、退出计划和监管协作。金融零售 AI 不能只签普通 SaaS MSA，因为 prompt、completion、embedding、trace 和 eval dataset 都可能包含敏感业务信息。

2 分钟展开：

数据条款要明确不用于训练、微调、产品改进、再销售或跨客户学习。
模型变更条款要覆盖 foundation model、embedding、reranker、RAG pipeline、agent tool 和 guardrail。
审计权要能拿到 SOC/ISO、AI governance、case-level trace 和监管协作。
事故通知不能只覆盖 data breach，还要覆盖 AI quality incident、model behavior incident、RAG permission issue 和 service outage。
退出条款要包括数据、配置、日志、eval、索引、删除证明和过渡支持。

Q4：如何管理模型更新风险？

30 秒回答：

把模型更新当成生产变更管理，而不是供应商 release note。重大模型、embedding、RAG、agent tool 或 guardrail 变更要提前通知，进入内部回归评估、风险审批、UAT 和回滚计划。

2 分钟展开：

先要求供应商提供 model inventory、version policy 和 change notice。
对高风险用例，争取 version pinning、延迟升级权和 rollback。
内部做 regression eval：历史 case、负例、边界样本、敏感政策、权限测试、引用测试。
如果输出影响客户或监管流程，还要 model risk、compliance 和 business sign-off。
上线后监控 hallucination、citation correctness、override rate、complaints、latency 和 cost drift。

Q5：如何防止供应商锁定？

30 秒回答：

架构上做 provider abstraction，合同上要求数据、配置、日志、eval 和索引可导出，运营上定期做 exit review。锁定不只来自模型，也来自 RAG index、workflow、agent tool、审计日志和供应商特有配置。

2 分钟展开：

在 AI gateway 层隔离模型调用，保留多模型路由和 fallback。
业务规则、prompt、policy、eval dataset 尽量由机构控制。
源文档系统作为 master，RAG index 可重建。
合同写清导出格式、终止协助、删除证明和过渡服务。
续约前评估替代供应商和内部方案，不让迁移难度变成被动续约。

Q6：如何看 SOC 2 和 ISO 证书？

30 秒回答：

先看范围、期间、例外和是否覆盖本次采购服务。SOC 2 或 ISO 27001 证明安全控制或管理体系的一部分，不证明 AI 用例自动合规。ISO 42001 可作为 AI 管理体系证据，但仍要看它是否覆盖模型变更、eval、risk assessment 和供应商实际产品。

2 分钟展开：

SOC 2 Type II 比 Type I 更能说明控制运行，但也要看报告期和例外。
ISO 27001 看 ISMS 范围是否覆盖产品、云环境、运营和支持组织。
ISO 42001 看 AIMS 范围、AI 生命周期、风险、责任、持续改进。
对 AI 供应商，还要额外看 model card、eval report、red-team、AI incident process、change log。
任何证据都要映射到机构自己的用例、数据、架构和控制要求。

Q7：如何处理 subprocessor 风险？

30 秒回答：

要求供应商提供完整子处理方清单，说明每个子处理方处理什么数据、在哪个地区、承担什么控制。新增关键子处理方要提前通知，客户有异议权，主供应商对其子处理方承担责任。

2 分钟展开：

AI 供应链里子处理方可能包括云、模型、日志、标注、支持、数据、监控和外包人员。
风险不是只看主供应商品牌，还要看背后的模型和云是否集中。
合同要求同等数据保护、安全、保密和 incident notification 义务下传。
对高风险用例，子处理方变更也要触发影响评估和可能的回归测试。
供应商季度评审时要核对清单变化和控制证据。

Q8：金融零售 AI use case 中哪些最需要强第三方风险控制？

30 秒回答：

授信、欺诈、AML、KYC、支付争议、催收、投诉、财富建议和监管报告最需要强控制，因为它们可能影响客户权益、合规义务、消费者保护、财务损失和声誉风险。

2 分钟展开：

如果 AI 只做内部低敏摘要，风险较低。
如果 AI 影响客户是否被批准、拦截、收费、催收、投诉结论或监管报告，就进入高风险。
高风险不一定禁止外购，但要有深度尽调、合同条款、人工复核、eval、监控、审计日志和退出。
尤其要防止 vendor demo 直接跳到生产，绕过 model risk、privacy、security 和 legal。

Q9：PM 和 BA 在供应商风险里有什么价值？

30 秒回答：

PM 定义价值、范围、pilot 指标和 adoption；BA 把流程、数据、异常、人工复核和证据链讲清楚。没有 PM/BA，供应商风险容易变成采购和安全清单，无法判断 AI 是否真的适合业务流程。

2 分钟展开：

PM 能明确目标用户、业务结果、优先级和停止条件。
BA 能把 AS-IS / TO-BE、异常路径、角色权限和数据字段拆出来。
这些内容会变成 RFP、demo script、eval dataset、contract requirements 和 runbook。
Architect、Risk、Legal、Security 需要 PM/BA 的业务上下文才能设计控制。
面试时可以强调自己能把业务语言翻译成供应商尽调和工程控制。

Q10：如果供应商拒绝模型变更通知或审计权怎么办？

30 秒回答：

先根据用例风险判断是否可接受。低风险内部场景可以通过限制数据和范围缓解；高风险金融场景如果供应商拒绝关键变更通知、审计证据或监管协作，通常不能进入生产。

2 分钟展开：

可谈判替代：SOC 报告、bridge letter、第三方审计、release note、客户专属测试窗口、监管协作承诺。
可降低风险：只用于低敏、只读、人工复核、不接核心系统、不影响客户权益。
如果是 Tier 1，缺少审计权和变更通知会破坏可验证性和可控性。
最终结论应记录为 risk acceptance、scope limitation 或 vendor rejection，不能口头带过。

21. 自检清单

本文已覆盖以下要求：

Requirement	Coverage
Vendor landscape	Section 4 覆盖 foundation model、cloud AI、RAG SaaS、agent platform、data vendor、eval vendor，并扩展 observability、SI、managed service。
Build / buy / hybrid link	Section 5 连接 build、buy、hybrid、partner 和分层决策。
Third-party risk lifecycle	Section 6 使用 planning、due diligence、contract negotiation、ongoing monitoring、termination 等生命周期。
Due diligence	Section 8 提供尽调框架、角色问题和最小证据包。
Contract clauses	Section 9 覆盖数据、变更、审计、SOC/ISO、SLA、incident、subprocessor、exit、IP、liability。
Data use restrictions	Section 9.1 专门覆盖 prompt、completion、embedding、logs、fine-tuning、eval、support、telemetry。
Model update / change notice	Section 9.2 专门覆盖模型、RAG、agent、guardrail、emergency change。
Audit rights	Section 9.3 专门覆盖数据、安全、AI governance、case trace、subprocessor。
SOC2 / ISO / AI governance evidence	Section 10 专门说明如何读证据。
SLAs	Section 11 覆盖 availability、latency、quality、safety、cost、observability。
Exit plan	Section 12 覆盖触发、资产、演练和原则。
Concentration risk	Section 13 覆盖模型、云、RAG、数据、eval、agent、外包集中度。
Subprocessors	Section 14 覆盖子处理方类别和合同要求。
Incident notification	Section 15 覆盖安全、隐私、AI quality、model behavior、RAG、agent、availability、cost。
Financial retail use cases	Section 16 覆盖客服、投诉、贷款、信贷、欺诈、AML、KYC、支付、催收、财富、代码、合同分析。
PM / BA / Architect / Risk roles	Section 17 覆盖 RACI 和角色能力。
Templates	Section 18 提供 intake、scorecard、contract checklist、change memo、incident intake、exit plan。
30-day lab	Section 19 提供 30 天实战训练。
Interview answers	Section 20 提供 10 个面试答案。
Source anchors	Section 3 覆盖 Interagency Guidance、OCC Bulletin、SR references、OMB M-25-22、NIST AI RMF、ISO/IEC 42001。

质量自检：

未使用未完成标记。
模板均包含填写规则和示例值。
文档保持为学习和架构手册，不替代法律、合规或采购审批。
本文件可由主索引后续登记，不依赖同时修改其他文件。

AI Third-Party / Vendor Risk Playbook

AI Third-Party / Vendor / Procurement / Outsourcing Risk Playbook

1. 核心观点

2. 与现有学习资产的连接

3. Source Anchors And Use Boundaries

4. AI Vendor Landscape：供应商版图

5. Build / Buy / Hybrid 连接

5.1 分层决策法

5.2 决策门禁

6. 第三方风险生命周期

7. 风险分级：Criticality And AI Impact

8. Due Diligence：AI 供应商尽调框架

8.1 尽调问题总表

8.2 分角色尽调

8.3 最小可接受证据包

9. 合同条款：AI Vendor Contract Control Pack

9.1 数据使用限制条款要点

9.2 模型更新与变更通知

9.3 Audit rights：审计权不是形式条款

10. SOC 2 / ISO / AI Governance Evidence：如何看证据

11. SLA / SLO：AI 供应商服务指标

12. Exit Plan：退出计划和可替换性

12.1 退出触发

12.2 退出资产清单

12.3 退出演练

13. Concentration Risk：集中度风险

14. Subprocessors：子处理方治理

15. Incident Notification：AI 事故通知

16. 金融零售 AI Use Case 风险地图

17. PM / BA / Architect / Risk 角色分工

18. Templates：可复制工作产物

18.1 AI Vendor Intake One-Pager

18.2 Vendor Scorecard

18.3 Contract Redline Checklist

18.4 Model Change Notice Review Memo

18.5 Incident Intake Template

18.6 Exit Plan Template

19. 30-Day Lab：AI Vendor Risk 实战训练

20. Interview Answers：面试答案

Q1：AI 供应商风险和传统 SaaS 供应商风险有什么不同？

Q2：如何判断一个 AI vendor 是否可以进入 pilot？

Q3：合同中最重要的 AI 条款是什么？

Q4：如何管理模型更新风险？

Q5：如何防止供应商锁定？

Q6：如何看 SOC 2 和 ISO 证书？

Q7：如何处理 subprocessor 风险？

Q8：金融零售 AI use case 中哪些最需要强第三方风险控制？

Q9：PM 和 BA 在供应商风险里有什么价值？

Q10：如果供应商拒绝模型变更通知或审计权怎么办？

21. 自检清单