Arch Day 59

Arch Day 59: 反洗钱(AML)系统架构 — 金融系统的信任基础

反洗钱(Anti-Money Laundering)不只是合规义务——它是金融系统能够正常运作的信任基石。AML系统的核心使命是在海量交易中识别可疑资金流动，涉及KYC(客户尽职调查)、交易监控(Transaction Monitoring)、名单筛查(Sanctions Screening)和可疑报告(STR/SAR)四大核心模块。行业面临的最大挑战是95%以上的误报率——这意味着每100条告警

2026-05-28

第二阶段 - 金融域深度

AML反洗钱KYC交易监控名单筛查STRRegTech合规

日期: 2026-05-28 (Day 59) 阶段: 第二阶段 - 金融域深度标签: #AML #反洗钱 #KYC #交易监控 #名单筛查 #STR #RegTech #合规

核心概念

一句话定义

反洗钱(Anti-Money Laundering)不只是合规义务——它是金融系统能够正常运作的信任基石。AML系统的核心使命是在海量交易中识别可疑资金流动，涉及KYC(客户尽职调查)、交易监控(Transaction Monitoring)、名单筛查(Sanctions Screening)和可疑报告(STR/SAR)四大核心模块。行业面临的最大挑战是95%以上的误报率——这意味着每100条告警中只有不到5条是真正的可疑交易。

为什么资深架构师仍需关注

维度	价值
生死攸关	AML合规失败的代价是致命的——罚款可达数十亿美元，严重时银行会被吊销牌照
全球要求	几乎所有国家都有AML法规(FATF标准)——做金融产品必须理解AML
架构挑战	海量交易实时监控+低延迟名单筛查+图分析——是性能和准确性的极限挑战
AI落地	AML是NLP(名单模糊匹配)+图分析(可疑网络)+异常检测的综合应用场景
Web3高度相关	加密货币的匿名性使AML成为行业最大的合规挑战——Chainalysis/Elliptic就做这个

常见误区与反模式

误区	真相
"AML就是查黑名单"	名单筛查只是AML的一部分——交易监控、客户风险评级、可疑交易报告都是核心组件
"误报率高是可接受的"	95%误报率意味着分析师90%的时间在处理假告警——这是巨大的人力浪费和合规风险
"合规部门的事，技术不用管"	AML系统的效果严重依赖技术架构——差的架构=差的检测+高的误报
"规则越多检测越好"	规则膨胀导致告警爆炸——300条规则不如30条精准规则
"区块链匿名所以无法AML"	Chainalysis等公司已能追踪90%+的比特币交易——匿名不等于不可追踪

知识点详解

知识点1：AML法规框架与监管体系

全球AML监管体系:
━━━━━━━━━━━━━━━

国际标准:
┌────────────────────────────────────────────────────┐
│ FATF (Financial Action Task Force / 金融行动特别工作组)│
│                                                    │
│ 成员: 39个国家/地区                                │
│ 核心: FATF 40条建议(AML/CFT国际标准)               │
│                                                    │
│ 关键建议:                                           │
│ ├── 建议10: 客户尽职调查(CDD)                      │
│ ├── 建议11: 记录保存(至少5年)                      │
│ ├── 建议16: 电汇信息(旅行规则)                     │
│ ├── 建议20: 可疑交易报告(STR)                      │
│ └── 建议15: 虚拟资产服务提供商(VASP)               │
│     ——2019年扩展到加密货币领域                      │
└────────────────────────────────────────────────────┘

中国AML法规:
├── 《反洗钱法》(2007年实施，2024年修订)
├── 《金融机构大额交易和可疑交易报告管理办法》
│   ├── 大额交易: 现金≥5万/转账≥200万
│   └── 可疑交易: 需要报告的可疑行为清单
├── 《金融机构客户身份识别和客户身份资料及交易记录保存管理办法》
├── 监管机构: 中国人民银行(反洗钱局)
└── 处罚: 罚款最高500万元+责任人处罚

美国AML法规:
├── BSA (Bank Secrecy Act, 1970)
├── USA PATRIOT Act (2001)
├── AML Act of 2020
├── 监管机构: FinCEN (Financial Crimes Enforcement Network)
├── SAR (Suspicious Activity Report): 向FinCEN报告
└── 处罚: 罚款无上限(HSBC曾被罚$19亿)

欧盟AML指令:
├── AMLD6 (第6版反洗钱指令, 2021)
├── MiCA (加密资产市场法规, 2023)
├── 旅行规则: 加密交易必须包含发送方/接收方信息
└── 处罚: 年营收10%或500万欧元(取高值)

知识点2：KYC/CDD/EDD流程架构

客户尽职调查分级体系:
━━━━━━━━━━━━━━━━━━━━

  客户注册/开户
      │
      ▼
  ┌──────────────┐
  │ SDD           │  简化尽职调查(Simplified Due Diligence)
  │ 简化尽职调查   │  适用: 低风险客户(如小额存款)
  │               │  内容: 基本身份信息收集
  │               │  ├── 姓名+身份证号
  │               │  ├── 手机号验证
  │               │  └── 基础身份核验
  └──────┬───────┘
         │ 风险评估
         ▼
  ┌──────────────┐
  │ CDD           │  标准尽职调查(Customer Due Diligence)
  │ 客户尽职调查   │  适用: 普通客户(默认级别)
  │               │  内容:
  │               │  ├── 身份核验(OCR+人脸识别+活体检测)
  │               │  ├── 地址证明
  │               │  ├── 职业和收入信息
  │               │  ├── 资金来源说明
  │               │  ├── 名单筛查(制裁/PEP/不利媒体)
  │               │  └── 风险评级(高/中/低)
  └──────┬───────┘
         │ 高风险触发
         ▼
  ┌──────────────┐
  │ EDD           │  增强尽职调查(Enhanced Due Diligence)
  │ 增强尽职调查   │  适用: 高风险客户
  │               │  触发条件:
  │               │  ├── PEP(政治敏感人物)及其关联人
  │               │  ├── 高风险国家/地区客户
  │               │  ├── 复杂或异常的交易模式
  │               │  ├── 匿名账户/代名人账户
  │               │  └── 非面对面开户
  │               │  额外要求:
  │               │  ├── 高级管理层审批
  │               │  ├── 资金来源详细证明
  │               │  ├── 交易目的说明
  │               │  ├── 更频繁的持续监控
  │               │  └── 定期复查(每年/半年)
  └──────────────┘

KYC技术架构:
┌────────────────────────────────────────────────────────┐
│                     KYC平台架构                         │
│                                                        │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐  ┌────────┐│
│  │ 身份采集  │  │ 身份核验  │  │ 名单筛查  │  │ 风险评级││
│  │          │  │          │  │          │  │        ││
│  │ ├── OCR  │  │ ├── 公安  │  │ ├── OFAC │  │ ├── 评分││
│  │ ├── NFC  │  │ │   联网  │  │ ├── EU   │  │ │   模型││
│  │ ├── 活体  │  │ ├── 银行  │  │ ├── UN   │  │ ├── 规则││
│  │ └── 录入  │  │ │   四要素│  │ ├── PEP  │  │ └── 人工││
│  │          │  │ ├── 人脸  │  │ └── 不利  │  │        ││
│  │          │  │ │   比对  │  │    媒体   │  │ 输出:   ││
│  │          │  │ └── 学历  │  │          │  │ 高/中/低││
│  │          │  │    验证   │  │          │  │        ││
│  └──────────┘  └──────────┘  └──────────┘  └────────┘│
│                                                        │
│  ┌──────────────────────────────────────────────────┐  │
│  │                持续监控(Ongoing Monitoring)        │  │
│  │  ├── 定期名单筛查(每日更新名单后全量重筛)         │  │
│  │  ├── 风险评级定期复查(低风险1年/中风险半年/高风险季度)│
│  │  ├── 交易行为监控(异常触发复查)                   │  │
│  │  └── 负面新闻监控(自动爬取+关联分析)              │  │
│  └──────────────────────────────────────────────────┘  │
└────────────────────────────────────────────────────────┘

知识点3：交易监控系统(Transaction Monitoring)

交易监控系统架构:
━━━━━━━━━━━━━━━━

┌─────────────────────────────────────────────────────────────┐
│                    交易数据接入                               │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐  ┌──────────┐   │
│  │ 转账交易  │  │ 现金交易  │  │ 外汇交易  │  │ 证券交易  │   │
│  └────┬─────┘  └────┬─────┘  └────┬─────┘  └────┬─────┘   │
│       └──────────────┴──────────────┴──────────────┘         │
│                              │                               │
├──────────────────────────────▼───────────────────────────────┤
│                    实时处理层                                  │
│                                                              │
│  ┌──────────────────────────────────────────────────────┐   │
│  │                  规则引擎(Rule Engine)                 │   │
│  │                                                      │   │
│  │  规则类型                    示例                       │   │
│  │  ├── 阈值规则              单笔现金>5万 → 大额报告     │   │
│  │  ├── 频次规则              24小时内转账>10笔 → 告警    │   │
│  │  ├── 行为规则              首次大额跨境转账 → 告警     │   │
│  │  ├── 结构化交易规则        多笔刚好<5万的现金交易 → 告警│   │
│  │  │   (Structuring)        (故意拆分规避大额报告)       │   │
│  │  ├── 地理风险规则          涉及高风险国家的交易 → 告警  │   │
│  │  └── 客户行为偏离规则      交易模式与历史基线偏差>3σ    │   │
│  └──────────────────────────────────────────────────────┘   │
│                                                              │
│  ┌──────────────────────────────────────────────────────┐   │
│  │                  模型引擎(Model Engine)                │   │
│  │                                                      │   │
│  │  ├── 异常检测模型: Isolation Forest / Autoencoder     │   │
│  │  │   检测偏离正常模式的交易                            │   │
│  │  ├── 聚类模型: K-Means / DBSCAN                       │   │
│  │  │   发现行为相似的可疑账户群体                        │   │
│  │  ├── 图分析模型: GNN / PageRank                       │   │
│  │  │   发现可疑资金流转网络                              │   │
│  │  └── 分类模型: XGBoost / LightGBM                     │   │
│  │      基于历史SAR数据训练的分类器                       │   │
│  └──────────────────────────────────────────────────────┘   │
│                              │                               │
├──────────────────────────────▼───────────────────────────────┤
│                    告警管理层                                  │
│                                                              │
│  ┌──────────────┐  ┌──────────────┐  ┌──────────────────┐  │
│  │ 告警生成      │  │ 告警评分      │  │ 告警分派           │  │
│  │              │  │              │  │                  │  │
│  │ 规则/模型触发 │  │ 优先级评分:   │  │ 自动分派:         │  │
│  │ → 生成告警   │  │ ├── 金额权重  │  │ ├── L1: 初级分析师│  │
│  │              │  │ ├── 客户风险  │  │ ├── L2: 高级分析师│  │
│  │              │  │ ├── 规则权重  │  │ └── L3: 合规官    │  │
│  │              │  │ └── 模型分数  │  │                  │  │
│  └──────────────┘  └──────────────┘  └──────────────────┘  │
│                              │                               │
├──────────────────────────────▼───────────────────────────────┤
│                    案件调查层                                  │
│                                                              │
│  ├── 交易链路可视化(资金流向图)                               │
│  ├── 客户360度视图(基本信息+交易+告警+关联)                  │
│  ├── 调查记录管理(每步操作留痕)                              │
│  └── 决策:                                                   │
│      ├── 关闭告警(False Positive/误报)                       │
│      ├── 提交SAR/STR(确认可疑)                               │
│      ├── 升级调查(需更多信息)                                │
│      └── 冻结账户(紧急情况)                                  │
│                              │                               │
├──────────────────────────────▼───────────────────────────────┤
│                    报告层                                      │
│                                                              │
│  ├── 大额交易报告(CTR): 自动生成+自动报送                    │
│  ├── 可疑交易报告(STR/SAR): 人工撰写+审核后报送             │
│  └── 统计报表: 告警数/SAR数/误报率等合规指标                 │
└──────────────────────────────────────────────────────────────┘

知识点4：名单筛查(Sanctions Screening)

名单筛查系统:
━━━━━━━━━━━━

名单来源:
┌────────────────────────────────────────────────┐
│                                                │
│  制裁名单(Sanctions):                           │
│  ├── OFAC SDN List (美国财政部)                 │
│  │   Specially Designated Nationals             │
│  │   ——全球最重要的制裁名单                     │
│  ├── EU Consolidated List (欧盟)               │
│  ├── UN Security Council (联合国安理会)         │
│  ├── HMT (英国财政部)                           │
│  └── 中国: 外交部制裁名单                       │
│                                                │
│  PEP名单(Politically Exposed Persons):          │
│  ├── 国家元首/政府首脑                          │
│  ├── 高级政府官员                               │
│  ├── 高级军事官员                               │
│  ├── 国企高管                                   │
│  ├── 司法高官                                   │
│  └── 上述人员的家属和密切关联人                  │
│                                                │
│  不利媒体(Adverse Media):                       │
│  ├── 涉及洗钱/腐败/制裁的新闻报道              │
│  └── 需要持续监控(不是一次性)                   │
│                                                │
└────────────────────────────────────────────────┘

名单筛查的核心挑战: 模糊匹配
┌────────────────────────────────────────────────┐
│                                                │
│  为什么需要模糊匹配:                            │
│  ├── 名字拼写变体: Mohammed/Muhammad/Mohamed    │
│  ├── 音译差异: 习近平→Xi Jinping/Hsi Chin-ping │
│  ├── 名字顺序: John Smith / Smith, John        │
│  ├── 缩写: Robert → Rob / Bob                  │
│  ├── 打字错误: Michael → Micheal               │
│  └── 故意变形: 逃避制裁的人会故意拼错名字       │
│                                                │
│  模糊匹配算法:                                  │
│  ├── 编辑距离(Levenshtein): 字符级相似度        │
│  ├── 音标匹配(Soundex/Metaphone): 发音相似     │
│  ├── N-Gram匹配: 子串级相似度                   │
│  ├── Jaro-Winkler: 考虑前缀权重的相似度        │
│  └── 综合评分: 多种算法加权得出最终匹配分数     │
│                                                │
│  匹配阈值的挑战:                                │
│  ├── 阈值太低(如70%): 大量误报(合法客户被标记)  │
│  ├── 阈值太高(如95%): 遗漏变体(制裁对象漏过)   │
│  └── 最佳实践: 分级阈值                        │
│      ├── ≥90%: 自动拦截+人工确认               │
│      ├── 80-90%: 生成告警+人工审核             │
│      └── <80%: 不告警(但记录日志)              │
│                                                │
└────────────────────────────────────────────────┘

名单筛查的触发时机:
├── 客户入驻时(Onboarding): 开户前必须筛查
├── 交易时(Transaction): 每笔交易的收/付方筛查
├── 批量重筛(Batch Re-screening): 名单更新后全量重筛
│   ├── OFAC名单更新频率: 每周数次
│   └── 全量重筛: 所有现有客户重新筛查
└── 定期复查(Periodic Review): 高风险客户定期筛查

知识点5：AML误报率挑战

AML误报率问题:
━━━━━━━━━━━━━━

行业现状:
┌────────────────────────────────────────────────┐
│                                                │
│  误报率(False Positive Rate): 95-99%           │
│                                                │
│  含义: 每100条告警中                            │
│  ├── 95-99条是误报(合法交易被错误标记)          │
│  └── 1-5条是真正的可疑交易                     │
│                                                │
│  后果:                                          │
│  ├── 人力浪费: 分析师90%的时间处理假告警        │
│  ├── 告警疲劳: 长期处理假告警导致真告警被忽视   │
│  ├── 成本高昂: 大型银行AML团队数千人            │
│  │   (花旗银行合规人员>30,000人)                │
│  └── 效率低下: 平均一个SAR的调查成本$1,000-5,000│
│                                                │
│  为什么误报率这么高:                            │
│  ├── 1. 规则过于简单(阈值规则无法区分正常和异常) │
│  ├── 2. 缺乏上下文(不知道客户为什么做这笔交易)  │
│  ├── 3. 保守策略(宁可多报不可漏报——监管压力)    │
│  ├── 4. 名单筛查模糊(名字相似≠同一个人)         │
│  └── 5. 规则膨胀(300条规则互相重叠)              │
│                                                │
└────────────────────────────────────────────────┘

降低误报率的策略:
┌────────────────────────────────────────────────┐
│                                                │
│  策略1: 规则优化                                │
│  ├── 定期评估每条规则的误报率                   │
│  ├── 淘汰低效规则(命中100%是误报的规则)         │
│  ├── 增加上下文条件(不仅看金额，还看客户画像)   │
│  └── 动态阈值(根据客户风险等级设不同阈值)       │
│                                                │
│  策略2: ML模型增强                              │
│  ├── 用历史SAR数据训练分类模型                  │
│  ├── 异常检测(无监督)发现新型可疑模式           │
│  ├── 模型对告警二次评分——低分告警自动关闭       │
│  └── 效果: 可降低误报率30-50%                   │
│                                                │
│  策略3: 图分析增强                              │
│  ├── 孤立的可疑交易→可能是误报                  │
│  ├── 关联到已知可疑网络→更可能是真告警          │
│  └── 图分析帮助区分"巧合"和"关联"               │
│                                                │
│  策略4: 自动化调查                              │
│  ├── 自动收集调查所需的信息(客户画像/交易历史)  │
│  ├── 自动生成调查报告初稿                      │
│  ├── 简单误报自动关闭(基于历史判定规则)         │
│  └── 效果: 减少分析师50%的手工工作              │
│                                                │
│  策略5: 数据质量提升                            │
│  ├── 客户信息的完整性和准确性                   │
│  ├── 交易描述的标准化                           │
│  └── 名单数据的清洗和去重                       │
│                                                │
└────────────────────────────────────────────────┘

知识点6：AI在AML中的应用

AI在AML的四大应用场景:
━━━━━━━━━━━━━━━━━━━━━━

场景1: NLP名单筛查优化
┌────────────────────────────────────────┐
│ 传统: 字符串模糊匹配(Jaro-Winkler等)  │
│ AI增强: NLP语义理解                    │
│                                        │
│ 应用:                                  │
│ ├── 多语言名字标准化                   │
│ │   "穆罕默德" ↔ "Muhammad" ↔ "محمد"   │
│ ├── 实体消歧                           │
│ │   "Bank of China"(银行) vs           │
│ │   "Bank of China, Ltd"(上市公司)     │
│ ├── 不利媒体自动分析                   │
│ │   爬取新闻→NLP提取实体→关联到客户    │
│ └── 效果: 名单筛查误报率降低40%+       │
└────────────────────────────────────────┘

场景2: Graph分析可疑网络
┌────────────────────────────────────────┐
│ 传统: 单笔交易独立评估                  │
│ AI增强: 构建交易图谱，分析资金流网络    │
│                                        │
│ 应用:                                  │
│ ├── 洗钱模式识别:                      │
│ │   分层(Layering): A→B→C→D→A(环形)  │
│ │   混合(Mixing): 多入→一出            │
│ │   扇出(Fan-out): 一入→多出           │
│ ├── 社区检测: 发现紧密关联的可疑群体    │
│ ├── 路径分析: 追踪资金从源头到目的地   │
│ └── 中心性分析: 找到网络中的关键节点   │
│                                        │
│ 技术:                                  │
│ ├── Neo4j/TigerGraph: 图数据库         │
│ ├── GraphSAGE/GAT: GNN模型             │
│ └── PageRank: 重要性排序               │
└────────────────────────────────────────┘

场景3: 异常检测(无监督)
┌────────────────────────────────────────┐
│ 传统: 基于阈值的规则(金额>X万)          │
│ AI增强: 学习每个客户的"正常行为基线"    │
│         偏离基线则告警                   │
│                                        │
│ 应用:                                  │
│ ├── 个性化基线:                        │
│ │   客户A月均交易10万→突然500万 → 告警  │
│ │   客户B月均交易500万→500万 → 正常     │
│ │   同样的金额，对不同客户意义不同      │
│ ├── 时间序列异常:                      │
│ │   交易频率突然变化                    │
│ │   交易时间模式变化                    │
│ └── 效果: 比固定阈值降低60%误报         │
│                                        │
│ 技术:                                  │
│ ├── Isolation Forest: 轻量级异常检测    │
│ ├── Autoencoder: 重建误差检测异常       │
│ └── LSTM: 时间序列异常检测              │
└────────────────────────────────────────┘

场景4: LLM辅助调查
┌────────────────────────────────────────┐
│ 应用:                                  │
│ ├── 自动生成调查报告初稿               │
│ │   输入: 告警信息+客户数据+交易记录    │
│ │   输出: 结构化的调查报告              │
│ ├── 自动解读法规变更                   │
│ │   新法规发布→LLM分析对现有规则的影响  │
│ ├── 智能问答                           │
│ │   分析师问"这个客户的所有高风险关联"   │
│ │   LLM查询系统返回分析结果             │
│ └── SAR自动撰写                        │
│     基于调查结论自动生成SAR文本          │
│                                        │
│ 风险: LLM可能"幻觉"→合规文件不能有错误 │
│ 方案: LLM生成初稿→人工审核→最终提交    │
└────────────────────────────────────────┘

对比分析

AML系统方案对比

维度	传统规则	规则+ML	AI-Native
误报率	95-99%	70-90%	50-70%(目标)
检测新型模式	差(需人工)	中(无监督补充)	好(自动学习)
可解释性	高(规则即解释)	中	需额外工具
监管接受度	高	中高	发展中
实施成本	低	中	高
维护成本	高(规则膨胀)	中	低(自动迭代)

传统AML vs 链上AML对比

维度	传统AML	链上AML(Chainalysis等)
数据获取	需要各机构配合	链上数据公开可得
身份识别	实名(KYC)	匿名(地址)
交易追踪	需要SWIFT/银行配合	链上完全透明可追踪
跨境追踪	极其困难(多国多银行)	天然全球化(一条链)
实时性	准实时(有延迟)	实时(链上即可见)
规避难度	中(多银行多账户)	中(混币器/隐私币)
监管成熟度	高(数十年经验)	低(发展中)

架构设计实操

设计目标

设计AML系统完整架构，包含KYC流程+交易监控+名单筛查+可疑报告。

完整架构设计

AML系统完整架构:
━━━━━━━━━━━━━━

┌─ KYC模块 ──────────────────────────────────────┐
│  客户注册 → 身份采集 → 身份核验 → 名单筛查      │
│  → 风险评级 → 审批(自动/人工) → 持续监控        │
└────────────────────────┬───────────────────────┘
                         │
┌─ 交易监控模块 ─────────▼───────────────────────┐
│  交易接入 → 实时规则 → ML模型 → 图分析          │
│  → 告警生成 → 告警评分 → 告警分派               │
└────────────────────────┬───────────────────────┘
                         │
┌─ 名单筛查模块 ─────────▼───────────────────────┐
│  名单更新 → 模糊匹配 → 匹配评分 → 人工确认      │
│  → 实时筛查(交易时) + 批量重筛(名单更新时)      │
└────────────────────────┬───────────────────────┘
                         │
┌─ 案件管理模块 ─────────▼───────────────────────┐
│  告警 → 调查工单 → 信息收集 → 分析决策          │
│  → 关闭/升级/SAR报告                            │
└────────────────────────┬───────────────────────┘
                         │
┌─ 报告模块 ─────────────▼───────────────────────┐
│  大额报告(CTR/自动) + 可疑报告(SAR/人工审核)    │
│  → 生成 → 审核 → 签批 → 报送 → 反馈跟踪        │
└────────────────────────────────────────────────┘

ADR: AML系统关键决策

## ADR-059: AML系统架构关键决策

### 决策1: 交易监控采用规则+ML混合方案
原因: 纯规则误报率太高(95%+)，纯ML监管不接受
方案: 规则作为基础检测层，ML作为告警评分层(二次过滤)
效果: 预期降低误报率30-50%

### 决策2: 名单筛查采用多算法组合
方案: Jaro-Winkler + Soundex + N-Gram 加权评分
原因: 单一算法各有盲区，组合可以互补
阈值: ≥90%自动拦截，80-90%人工审核

### 决策3: 图分析作为准实时层补充
原因: 实时图计算延迟过高(数百ms)
方案: 图分析在准实时层(秒级)运行，对可疑告警做深度分析
技术: Neo4j + GraphSAGE

与Web3/DeFi的关联

链上AML: Chainalysis如何工作

Chainalysis核心技术:
━━━━━━━━━━━━━━━━━━

1. 地址聚类(Address Clustering)
   ├── 共同输入启发式: 同一笔交易的多个输入地址属于同一实体
   ├── 找零地址识别: 找零输出地址与发送方属于同一实体
   └── 效果: 将数百万个匿名地址聚类为数千个"实体"

2. 实体标注(Entity Labeling)
   ├── 已知交易所地址(Binance/Coinbase等)
   ├── 已知暗网市场地址
   ├── 已知混币器地址(Tornado Cash等)
   ├── 已知制裁实体地址
   └── 来源: 公开信息+执法合作+用户举报

3. 资金追踪(Fund Tracing)
   ├── 从已知可疑地址出发
   ├── 追踪资金流向(跨链/跨交易所)
   ├── 标记"污染"资金(接触过可疑地址的资金)
   └── 用于: 执法机构追查/交易所合规/DeFi风控

4. 风险评分(Risk Scoring)
   ├── 直接暴露: 地址直接与可疑实体交互
   ├── 间接暴露: 地址通过N跳与可疑实体关联
   └── 评分: 0-10的风险等级

挑战:
├── 隐私币(Monero/Zcash): 交易不透明，难以追踪
├── 混币器(Tornado Cash): 打断资金链路
├── 跨链桥: 资金跨链后追踪困难
└── DeFi协议: 智能合约交互使资金链路复杂化

今日思考

三个深度问题

问题1: AML系统95%的误报率是否是一个本质上无法解决的问题？还是说AI技术的进步可以将其降到可接受的水平？

思考方向: 高误报率有结构性原因——洗钱行为本身就极其稀少(<0.1%的交易)，加上"宁多勿漏"的监管压力。AI可以显著降低误报率(到50-70%)，但要降到10%以下可能需要根本性的范式变革——比如从"基于规则的告警"转向"基于风险的持续评估"。

问题2: Tornado Cash被美国OFAC制裁后(2022年8月)，DeFi的AML合规边界在哪里？去中心化协议能否/应该做AML？

思考方向: 这是Web3最大的哲学争论之一。一方面，去中心化协议的核心价值是"无审查、无许可"；另一方面，如果协议被用于洗钱，监管会将其视为"促进犯罪的工具"。可能的折中方案是"前端合规+后端无许可"——前端UI可以拒绝制裁地址，但智能合约本身保持中立。

问题3: 如果你为一个加密交易所设计AML系统，与传统银行的AML系统有什么根本不同？

思考方向: 最大的不同是数据来源——传统银行依赖KYC的实名信息，加密交易所虽然也做KYC，但还需要链上分析(Chainalysis集成)。链上数据是公开的，但需要专业工具解读。另外，加密资产的跨境特性使得合规要求更复杂——需要同时满足多国法规。

面试题准备

面试题1: AML系统最大的技术挑战是什么？

30秒版本

最大的技术挑战是误报率——行业普遍在95%以上，这意味着每100条告警只有不到5条是真正的可疑交易。其根本原因是规则过于简单(阈值检测)+缺乏上下文(不理解客户正常行为)+保守策略(监管压力下宁多勿漏)。解决方向是ML增强(异常检测+图分析)+自动化调查(减少人力成本)+数据质量提升(更完整的客户画像)。

面试题2: 如何降低AML误报率？

30秒版本

五个策略：第一，ML告警评分——用历史SAR数据训练模型对告警二次打分，低分自动关闭；第二，个性化基线——每个客户有自己的"正常行为"模型，偏离自身基线才告警；第三，图分析增强——孤立交易可能是误报，与可疑网络关联的更可能是真告警；第四，规则精简——淘汰效果差的规则，减少告警数量；第五，自动化调查——AI收集信息+生成报告初稿，减少人工处理时间。

追问准备

追问: 降低误报率的同时如何保证不增加漏报？
- 答: 关键是分层——ML模型降低误报主要作用在"明显是误报"的告警上(如VIP客户的正常大额交易)。对于"模糊地带"的告警，仍然保留人工审核。同时建立漏报监控机制——定期回溯已关闭告警中是否有后来确认的可疑交易。

学习资源

资源	类型	推荐度
FATF官网	标准	了解全球AML标准
Chainalysis Blog	博客	链上AML最佳实践
《反洗钱：金融科技的合规之路》	书籍	中文AML系统入门
FinCEN SAR Filing Guide	官方指南	美国SAR申报指南
ACAMS	认证	AML专业认证(CAMS)

明日预告

Day 60: 监管报送系统架构 — 决定银行存亡的"必须做但没人想做"的事

明天将学习监管报送系统的架构设计，包括中国银行业的PBOC 1104/EAST报送体系、国际监管报表(Basel III/IFRS 9)、数据质量管理、数据血缘追踪、以及AI+RegTech如何自动解读监管文件。监管报送是金融系统中最"无趣"但最关键的部分——做不好，银行可能被关停。