Arch Day 4

Arch Day 4: 业务流程架构(高级) — STP率、异常处理与流程治理

业务流程架构不是"画BPMN图"，而是设计流程的治理体系、自动化策略和异常处理模式 — 核心目标是提高STP(Straight-Through Processing，直通处理)率，让正常交易尽可能自动化完成，同时确保异常情况有明确的升级和处理路径。

2026-04-02

第一阶段 - 架构基础

业务流程STP异常处理流程治理自动化

日期: 2026-04-02 阶段: 第一阶段 - 架构基础标签: #业务流程 #STP #异常处理 #流程治理 #自动化

核心概念

一句话定义

业务流程架构不是"画BPMN图"，而是设计流程的治理体系、自动化策略和异常处理模式 — 核心目标是提高STP(Straight-Through Processing，直通处理)率，让正常交易尽可能自动化完成，同时确保异常情况有明确的升级和处理路径。

为什么资深架构师仍需关注

STP率直接影响运营成本: 金融机构70%的运营成本来自"非直通"处理(人工干预、异常处理)。提高STP率1个百分点，可能节省数百万运营费用
异常处理设计是真正的架构能力: 正常流程人人都会画，但95%的系统复杂度来自异常处理。资深架构师的价值在于系统性地设计异常路径
流程治理是数字化转型的基础: 如果流程本身没有标准化和度量化，任何技术投入都是在"烂路上铺沥青"
微服务编排 vs 编舞的架构决策: 流程架构直接决定微服务间的协作模式

常见误区与反模式

反模式	表现	根因	正确做法
Happy Path唯一论	只设计正常流程，异常"另议"	低估异常复杂度	异常路径和正常路径同等重要地设计
BPMN过度	用BPMN画到最细粒度(每个字段校验)	混淆流程建模和需求规格	BPMN到子流程级别即可，细节用API规格
流程=系统流程	画的全是"系统调用流程"	技术思维主导	先画业务流程(What)，再设计系统流程(How)
缺少度量	流程没有KPI	为画图而画图	每个流程必须有STP率、Lead Time、异常率等KPI
一刀切自动化	试图100%自动化	忽略"自动化不经济"的场景	区分"必须自动化""可以自动化""不应自动化"
流程烟囱	每个部门/产品有独立的流程	缺少流程治理	建立流程目录和复用机制

知识点详解

知识点1: STP(直通处理)率 — 金融流程的核心KPI

STP的精确定义

STP率 = 无需任何人工干预即可完成的交易数 / 总交易数 × 100%

注意:
- "无需人工干预"包括: 无需人工审核、无需人工修正、无需人工确认
- 部分STP: 某些步骤自动化但仍需人工确认 → 不算STP
- 真正的STP: 从触发到完成，全程零人工参与

金融行业典型STP率基准

业务类型	行业平均STP率	领先水平	提升空间
境内转账	95%	99.5%	低
跨境汇款	40-60%	85%	高
信用卡交易	98%	99.9%	低
贷款审批	30-50%	75%	高
反洗钱审查	20-30%	60%	极高
基金申赎	85%	98%	中
保险理赔	15-25%	50%	极高

STP率的经济学

STP率经济模型(以跨境汇款为例):

假设:
- 日均交易量: 10,000笔
- 人工处理成本: ¥50/笔
- 自动化处理成本: ¥0.5/笔
- 当前STP率: 50%

当前成本:
  自动化部分: 5,000 × ¥0.5 = ¥2,500/天
  人工部分: 5,000 × ¥50 = ¥250,000/天
  总成本: ¥252,500/天 = ¥92M/年

STP率提升到80%后:
  自动化部分: 8,000 × ¥0.5 = ¥4,000/天
  人工部分: 2,000 × ¥50 = ¥100,000/天
  总成本: ¥104,000/天 = ¥38M/年

节省: ¥54M/年 ← 这就是STP率的商业价值

STP率优化的四个层次

层次1: 数据质量优化 → STP率提升5-10%
  - 输入数据校验(前端实时校验)
  - 标准化数据格式(如地址、姓名)
  - 减少数据缺失(必填字段设计)

层次2: 规则引擎优化 → STP率提升10-20%
  - 将人工判断规则化
  - 动态阈值调整
  - 规则的A/B测试

层次3: AI辅助决策 → STP率提升10-15%
  - ML模型替代复杂规则
  - 自然语言处理(如票据OCR)
  - 异常模式自动识别

层次4: 流程重新设计 → STP率提升15-25%
  - 消除不必要的审批层级
  - 合并冗余检查
  - 异步化非关键步骤

知识点2: 异常处理架构设计模式

异常处理是流程架构中最体现功力的部分。以下是金融行业常用的异常处理模式：

模式1: 异常分级(Exception Tiering)

异常分级框架:

Level 0: 自动修复(Auto-heal)
  触发: 系统可自动识别和修复的异常
  处理: 自动重试、数据补全、格式转换
  STP影响: 不影响(仍算STP)
  示例: 网络超时自动重试、金额格式自动转换

Level 1: 规则处理(Rule-based)
  触发: 预定义规则能匹配的异常
  处理: 规则引擎自动路由和处理
  STP影响: 部分影响(可能需要审核但不需人工处理)
  示例: 金额超过阈值自动拆分、高风险国家自动增强筛查

Level 2: 人工辅助(Human-assisted)
  触发: AI模型标记的疑似异常
  处理: 系统预处理后人工确认
  STP影响: 不算STP
  示例: AML可疑交易审核、模糊匹配人工确认

Level 3: 完全人工(Full Manual)
  触发: 系统无法处理的异常
  处理: 人工分析、决策、执行
  STP影响: 不算STP
  示例: 新型欺诈模式、监管特殊要求、系统bug

Level 4: 升级处理(Escalation)
  触发: 超时或超出权限的异常
  处理: 升级到高级别(主管/合规/管理层)
  STP影响: 不算STP
  示例: 大额可疑交易(>$1M)、政治敏感人物(PEP)

模式2: 补偿事务(Compensating Transaction / Saga)

Saga模式在金融流程中的应用:

正常流程: A → B → C → D
如果C失败:  A → B → C(失败) → CompB → CompA

跨境支付Saga示例:
1. 冻结付款方资金 [✓]
2. 提交清算通道 [✓]
3. 通道执行汇款 [✗ 失败:收款行拒收]
4. 补偿: 取消清算请求
5. 补偿: 解冻付款方资金
6. 通知客户并记录异常原因

关键设计要求:
- 每个正向步骤必须有对应的补偿步骤
- 补偿步骤必须是幂等的(可重复执行)
- 补偿失败时必须有人工介入机制
- 完整的审计日志(哪一步失败、为什么、补偿了什么)

模式3: 超时处理(Timeout Handling)

超时处理设计框架:

每个流程节点需要定义:
┌─────────────────────────────────────────┐
│ 节点: AML筛查                            │
│                                           │
│ 正常SLA: 5分钟                           │
│ 告警阈值: 10分钟 → 通知处理人员           │
│ 超时阈值: 30分钟 → 自动升级到主管         │
│ 硬超时: 2小时 → 暂停交易 + 通知客户       │
│                                           │
│ 超时补偿:                                │
│   - 如果已冻结资金 → 保持冻结(不自动释放)  │
│   - 记录超时原因                          │
│   - 纳入异常报表                          │
└─────────────────────────────────────────┘

超时策略选择:
┌──────────────┬──────────────┬──────────────┐
│ 策略         │ 适用场景      │ 风险         │
├──────────────┼──────────────┼──────────────┤
│ 自动通过     │ 低风险交易    │ 可能放行风险 │
│ 自动拒绝     │ 高风险交易    │ 客户体验差   │
│ 暂停等待     │ 中风险交易    │ 资金冻结时间 │
│ 升级处理     │ 任何超时      │ 增加人工成本 │
│ 降级处理     │ 非关键步骤    │ 功能降级     │
└──────────────┴──────────────┴──────────────┘

模式4: 重试策略(Retry Strategy)

重试策略设计:

指数退避(Exponential Backoff):
  第1次重试: 1秒后
  第2次重试: 2秒后
  第3次重试: 4秒后
  第4次重试: 8秒后
  最大重试: 5次(总等待约30秒)

金融场景特殊要求:
- 幂等性: 重试不能导致重复扣款/放款
- 重试窗口: 超过清算截止时间不再重试
- 重试隔离: 重试交易不能影响正常交易的处理

幂等性设计:
  每笔交易有唯一的idempotency_key
  重试时携带相同的key
  服务端检查key是否已处理
  如果已处理 → 返回之前的结果
  如果未处理 → 正常处理

知识点3: 流程KPI体系设计

金融流程KPI框架

流程KPI金字塔:

         战略级KPI
        ┌─────────┐
        │ STP率   │ ← CEO/COO关注
        │ 客户NPS │
        └────┬────┘
             │
      运营级KPI
    ┌────────────────┐
    │ Lead Time      │ ← 部门经理关注
    │ 异常率         │
    │ 处理成本/笔    │
    │ First Pass Yield│
    └───────┬────────┘
            │
    技术级KPI
  ┌──────────────────┐
  │ 系统可用性       │ ← IT团队关注
  │ 响应时间(P95/P99)│
  │ 队列堆积量       │
  │ 重试成功率       │
  └──────────────────┘

每个流程节点的标准度量

度量名称	定义	计算方法	监控频率
处理时间	节点开始到完成的时间	End_time - Start_time	实时
等待时间	上一节点完成到本节点开始的时间	Start_time - Previous_end_time	实时
一次通过率	无需返工的比例	通过数 / 总数	日
异常率	进入异常处理的比例	异常数 / 总数	日
超时率	超过SLA的比例	超时数 / 总数	实时
堆积量	当前排队等待处理的数量	Queue_size	实时

知识点4: 流程自动化决策框架

不是所有流程都应该自动化。决策框架：

流程自动化决策矩阵:

          高交易量
              |
    RPA首选   |   全自动化首选
   (结构化+    |  (结构化+
    高重复)    |   高重复+高价值)
              |
  ────────────────────────  高结构化程度
              |
    不自动化   |   AI+人工混合
   (非结构化+  |  (非结构化+
    低重复)    |   高重复)
              |
          低交易量

详细决策:

完全自动化(BPM Engine):
  条件: 规则明确 + 高交易量 + 低异常率
  示例: 小额转账、信用卡交易授权
  技术: Camunda/Flowable + 规则引擎

RPA自动化:
  条件: 跨多个遗留系统 + 规则明确 + 人工操作可模拟
  示例: 报表生成、数据搬运、合规报送
  技术: UiPath/Blue Prism/Automation Anywhere

AI辅助(Human-in-the-loop):
  条件: 规则模糊 + 需要判断 + 高价值决策
  示例: AML审查、贷款审批、异常交易识别
  技术: ML模型预判 + 人工最终决策

不自动化(人工处理):
  条件: 低频 + 高复杂度 + 高风险
  示例: 新产品上线审批、大额M&A审查、监管响应
  理由: 自动化成本 > 手动成本，且风险不可承受

知识点5: 流程编排 vs 编舞(Orchestration vs Choreography)

这是微服务架构中流程设计的核心架构决策：

维度	编排(Orchestration)	编舞(Choreography)
控制方式	中央编排器控制流程	各服务通过事件自主协作
可见性	流程全局可见	需要通过事件追踪还原
耦合度	编排器与所有服务耦合	服务间松耦合
复杂度	编排器复杂度高	理解和调试复杂度高
适用场景	有明确流程的业务(如审批)	事件驱动的松散协作
金融场景	贷款审批、交易处理	市场数据广播、通知

金融行业推荐:
- 核心交易流程: 编排(Orchestration) → 需要事务控制和可审计
- 辅助支撑流程: 编舞(Choreography) → 松耦合、易扩展
- 混合模式: 核心链路编排 + 非关键分支事件驱动

示例: 贷款审批流程
编排部分(必须顺序执行):
  数据校验 → 反欺诈 → 信用评分 → 审批决策 → 放款

编舞部分(事件驱动):
  审批完成事件 → [并行]通知客户、更新报表、记录征信

对比分析

流程建模方法对比

方法	适用层级	标准化	工具支持	学习曲线	金融推荐
BPMN 2.0	操作级(详细流程)	高(国际标准)	Camunda/Flowable	中	★★★★★
ArchiMate Process	架构级(流程概览)	高	Archi/Sparx EA	中	★★★★
价值流	战略级	中	通用工具	低	★★★★
泳道图	协作级	低	Visio/Draw.io	低	★★★
事件风暴(Event Storming)	领域发现	低(Workshop方法)	便利贴/Miro	低	★★★★
状态机	实体生命周期	中	PlantUML/代码	中	★★★★

BPM引擎对比

工具	类型	BPMN支持	微服务集成	金融客户	价格
Camunda 8	云原生BPM	完整	原生(Zeebe)	多	$$
Flowable	开源BPM	完整	好	中等	免费/$$
Temporal	工作流引擎	代码定义	原生	增长中	免费/$$
AWS Step Functions	云服务	JSON定义	AWS生态	多	按量
Netflix Conductor	开源编排	JSON定义	好	少	免费

金融行业推荐:

传统金融(银行/保险): Camunda — 有金融行业认证和合规支持
金融科技: Temporal — 代码定义工作流，开发者体验好
云优先: AWS Step Functions — 但注意供应商锁定

架构设计实操

实操: 设计"反洗钱审查"全流程

设计目标

设计一个完整的AML(Anti-Money Laundering)交易监控和审查流程，包含正常路径、异常路径、升级路径和超时处理。目标是将现有STP率从25%提升到60%。

设计方案

Step 1: 流程上下文

AML审查的触发场景:
1. 交易监控触发(实时) — 每笔交易过规则引擎
2. 批量筛查触发(日终) — 每日客户名单筛查
3. 人工举报触发 — 员工或外部举报

本流程关注: 场景1(交易监控触发)
输入: 一笔待审查的交易
输出: 审查结果(通过/拒绝/冻结+SAR报告)

Step 2: 流程设计(含异常路径)

AML交易监控审查流程:

[交易发生]
    │
    ▼
┌──────────────────┐
│ 1. 规则引擎筛查   │ ← 自动化(Level 0)
│ (实时,<100ms)     │
└────────┬─────────┘
         │
    ┌────┴────┐
    │匹配规则?│
    └────┬────┘
     N/  │  \Y
    /    │    \
   ▼     │     ▼
 [通过]   │  ┌──────────────────┐
  STP     │  │ 2. AI模型评分     │ ← 自动化(Level 1)
          │  │ (实时,<500ms)     │
          │  └────────┬─────────┘
          │           │
          │     ┌─────┴─────┐
          │     │  风险评分   │
          │     └─────┬─────┘
          │      Low/ │  \Medium  \High
          │      /    │     \       \
          │     ▼     │      ▼       ▼
          │  [通过]   │  ┌────────┐ ┌─────────────────┐
          │  STP+AI   │  │3.自动   │ │4. 人工审核      │
          │           │  │增强检查 │ │ (SLA: 2h)       │
          │           │  │(30s)   │ └────────┬────────┘
          │           │  └───┬────┘          │
          │           │     │           ┌────┴────┐
          │           │  ┌──┴──┐       │ 审核结果 │
          │           │  │通过?│       └────┬────┘
          │           │  └──┬──┘      通过/ │  \拒绝  \升级
          │           │  Y/ │ \N      /    │    \      \
          │           │  / │  \     ▼     │     ▼      ▼
          │           │ ▼  │   ▼  [通过]  │  [拒绝]  ┌──────┐
          │           │[通] │ [人工]       │  +记录   │5.合规│
          │           │    │ 审核         │         │升级  │
          │           │    │ (→4)         │         │(SLA: │
          │           │    │              │         │24h)  │
          │           │    │              │         └──┬───┘
          │           │    │              │       通过/│\冻结
          │           │    │              │        /  │  \
          │           │    │              │       ▼   │   ▼
          │           │    │              │     [通过] │ [冻结账户]
          │           │    │              │           │ +[提交SAR]
          │           │    │              │           │ +[通知监管]

超时处理:
  节点4(人工审核) 超时2h → 自动升级到主管
  节点5(合规升级) 超时24h → 自动通知合规总监
  任何节点超时 → 交易保持"冻结"状态，不自动放行

Step 3: STP率分析

当前STP率分析(25%):

交易分布(每日10,000笔):
  通过规则筛查(无匹配): 6,000笔 → STP ✓ (60%)
  AI评分Low(自动通过): 1,000笔 → 当前需人工确认 ✗
  AI评分Medium(增强检查): 1,500笔 → 人工审核 ✗
  AI评分High(人工审核): 1,000笔 → 人工审核 ✗
  直接规则匹配(制裁名单等): 500笔 → 人工审核 ✗

当前STP率: 6,000/10,000 = 60%
(注: 题目说25%是因为之前连规则引擎都没有，
所有交易都要人工过一遍)

目标优化方案:
1. AI评分Low → 自动通过(信任AI模型)
   新增STP: 1,000笔
2. AI评分Medium + 自动增强检查通过 → 自动通过
   新增STP: 约750笔(50%自动通过)
3. 优化规则引擎(减少误报)
   新增STP: 约500笔

优化后:
  STP笔数: 6,000 + 1,000 + 750 + 500 = 8,250
  STP率: 8,250/10,000 = 82.5%

仍需人工处理: 1,750笔/天
  - Medium审核(750笔)
  - High审核(1,000笔)

按每笔人工成本¥50计算:
  优化前: 7,500笔 × ¥50 = ¥375,000/天
  优化后: 1,750笔 × ¥50 = ¥87,500/天
  节省: ¥287,500/天 = ¥105M/年

Step 4: 流程KPI仪表板设计

AML流程KPI仪表板:

实时指标(大屏展示):
┌─────────────────────────────────────────────┐
│ STP率: 82.5% [↑ 3.2%]  │ 待审核队列: 127  │
│ 今日处理: 8,342         │ 平均审核时间: 45min│
│ 告警数: 23              │ 超时数: 2         │
└─────────────────────────────────────────────┘

日度指标:
│ 各风险等级分布    │ 误报率(FPR): 15% │
│ Low:  40%        │ 漏报率(FNR): 0.1%│
│ Med:  35%        │ SAR提交: 3笔     │
│ High: 25%        │                   │

周度趋势:
│ STP率趋势(目标线82%) │
│ 异常类型TOP5分布      │
│ 审核员效率排行        │

ADR

ADR-004: AML流程自动化策略

状态: 已批准
日期: 2026-04-02

背景:
当前AML交易监控的STP率仅25%，人工审核成本¥137M/年。
需要在保证合规的前提下提升自动化率。

决策:
采用"AI预筛+规则引擎+人工分级审核"三层架构:
1. 规则引擎筛查(全量交易,<100ms)
2. AI模型评分(规则匹配的交易,<500ms)
3. 人工审核(Medium+High风险)

AI模型自动通过条件:
- 只有AI评分为Low的交易可以自动通过
- Medium需要自动增强检查后决定
- High必须人工审核

理由:
1. 分层处理平衡了效率和风险
2. AI模型的Low评分准确率达99.5%(经过6个月验证)
3. 保留人工审核High风险交易满足监管要求

风险缓解:
- AI模型每月回测，FNR必须<0.2%
- 每季度随机抽查5%的AI自动通过交易
- 建立模型漂移监控(数据分布变化告警)

后果:
- STP率从25%提升到82.5%
- 人工审核团队可从50人缩减到15人
- 需要建设AI模型运维团队(3人)
- 需要每月向监管报告AI模型表现

权衡取舍

决策点	保守方案	激进方案	选择
AI Low自动通过	仍需人工确认	完全自动通过	完全自动通过 — 模型准确率99.5%已验证
Medium处理	全部人工	增强检查后部分自动	增强检查+部分自动 — 在可控范围内提效
超时策略	自动放行	冻结等待	冻结等待 — 宁可误杀不可漏放(合规优先)
流程引擎	Camunda	自建	Camunda — 有审计日志和合规认证

AI增强实践

本日AI提效方法

流程异常模式发现: AI分析历史流程日志，识别常见异常模式并推荐处理规则
STP率预测: AI基于输入数据质量预测单笔交易的STP概率
流程瓶颈实时诊断: AI分析流程实时数据，识别当前瓶颈节点

AI辅助的具体Prompt示例

Prompt 1: 异常处理路径设计

我正在设计一个跨境支付的业务流程，需要设计完整的异常处理路径。

正常流程:
1. 接收支付指令 → 2. 合规筛查 → 3. 汇率锁定
→ 4. 资金扣款 → 5. 通道提交 → 6. 确认到账

请为每个步骤设计:
1. 可能发生的异常类型(至少3种)
2. 每种异常的处理策略(自动修复/规则处理/人工介入/升级)
3. 补偿事务设计(如果该步骤失败，前面的步骤如何回滚)
4. 超时设计(正常SLA、告警阈值、硬超时、超时后处理)
5. 每种异常的预估发生率

要求:
- 考虑金融合规要求(资金安全、审计追踪)
- 考虑幂等性设计
- 考虑并发场景(如汇率在处理过程中变化)

Prompt 2: STP率优化方案

我的AML交易监控流程当前STP率为25%。异常分布如下:
- 规则引擎误报: 45%(最大问题)
- 数据质量问题: 20%
- 需要人工判断的复杂案例: 15%
- 系统间数据不一致: 10%
- 其他: 10%

请针对每个异常类别，提供具体的STP率提升方案:
1. 技术方案(什么系统/工具/模型)
2. 预期提升幅度
3. 实施难度和时间
4. 风险(特别是合规风险)
5. 投资估算

目标: 6个月内将STP率提升到60%以上

AI生成 vs 人工判断的边界

环节	AI可以做	人必须做
异常类型枚举	基于行业知识列举常见异常	确认是否覆盖本企业特有的异常
STP率计算	从日志数据统计各节点STP率	判断哪些"非STP"是合理的(如监管要求的人工审核)
超时阈值设定	基于历史数据建议P95/P99作为SLA	确认SLA是否满足业务要求和监管要求
自动化决策	推荐可自动化的节点	判断该节点自动化的合规风险
补偿事务设计	生成补偿事务代码框架	验证补偿事务的正确性(资金安全)

与Web3/DeFi的关联

传统流程架构	Web3对应	关键差异
BPM引擎(Camunda)	智能合约(自动执行)	合约即流程，不可修改
异常处理(人工升级)	治理提案(社区投票)	异常处理需要链上治理
STP(直通处理)	DeFi的Permissionless执行	DeFi天然STP率接近100%(无需审批)
补偿事务(Saga)	Flash Loan回滚	原子性：一笔交易内全部成功或全部回滚
超时处理	交易Gas不足/区块拥堵	链上超时是Gas机制而非SLA
流程审计	区块链天然审计	不可篡改的完整操作记录
规则引擎	Modifier/require语句	规则硬编码在合约中

深度思考: DeFi的清算(Liquidation)流程是一个绝佳的流程架构案例:

Aave清算流程(极致STP):
1. Health Factor < 1.0 → 触发
2. 清算人(Liquidator)发起清算交易
3. 智能合约自动执行:
   - 偿还借款人债务
   - 转移抵押品给清算人(含奖励)
   - 更新借款人头寸
4. 一笔交易内完成(原子性)

STP率: 100% — 没有人工环节
异常处理: Gas不够或价格变动→交易回滚(零成本)
补偿事务: 不需要(原子性保证)

这是传统金融梦寐以求的STP率水平

今日思考

思考1: 为什么金融机构的STP率普遍低于科技公司？

核心原因有三：

监管要求的人工检查点: 很多"非STP"不是技术问题，而是监管要求人工审核
遗留系统间的数据不一致: 数据从A系统到B系统格式不匹配，需要人工修正
风险厌恶文化: "出了问题谁负责"的心态导致不必要的审批层级

提升STP率的真正挑战不是技术(AI和规则引擎都很成熟)，而是改变组织的风险文化和监管沟通能力。

思考2: 异常处理设计的"冰山效应"是什么？

我的经验是：正常流程占代码量的20%，异常处理占80%。但在需求文档中，正常流程占80%的篇幅，异常处理只有一句"异常情况按XX规则处理"。

这种"冰山效应"是系统质量问题的根源。资深架构师的价值就在于在设计阶段就把冰山下面的80%挖出来。

方法论：对每个流程节点问五个问题：

如果输入数据不完整/格式错？
如果下游系统超时/不可用？
如果并发操作导致状态冲突？
如果处理到一半需要回滚？
如果成功了但通知失败？

思考3: 流程编排(Orchestration)和编舞(Choreography)真的需要二选一吗？

不需要。在金融行业，最佳实践是核心交易链路用编排，辅助流程用编舞：

交易处理(编排 — Camunda/Temporal):
  接收 → 校验 → 风控 → 执行 → 确认
  (需要强一致性、可审计、可回滚)

辅助处理(编舞 — 事件驱动):
  交易完成事件 → [各自订阅]
    → 通知服务(发短信)
    → 报表服务(更新统计)
    → 营销服务(触发推荐)
    → 征信服务(上报)

面试题准备

Q1: 如何提高金融流程的STP率？

30秒版本: 分四个层次：首先优化数据质量(减少输入错误)，其次优化规则引擎(降低误报率)，再次引入AI模型(替代复杂人工判断)，最后重新设计流程(消除不必要的审批)。关键是同时关注合规约束——某些人工步骤是监管要求的，不能为了STP率而跳过。

2分钟版本:

我的STP率优化方法论分四个层次，投入产出比从高到低:

第一层是数据质量优化(投入最小、见效最快)。金融流程中大量"非STP"是因为数据问题——格式不对、字段缺失、编码不一致。我的方法是在流程入口做严格的数据校验和自动标准化，通常可以提升STP率5-10个百分点。

第二层是规则引擎优化。很多规则过时或过于保守，导致大量误报(False Positive)。通过定期review规则、引入动态阈值、做规则的A/B测试，可以在不增加风险的前提下降低误报率。

第三层是AI模型引入。对于需要"判断"而非"规则"的环节(如AML审查、贷款审批)，用ML模型做预筛。模型评分低风险的交易可以自动通过，只有高风险才进入人工审核。关键是要建立模型的持续监控机制(漂移检测、定期回测)。

第四层是流程重新设计。审视每个人工审批环节是否真的必要。很多审批是历史遗留(某次出过事就加了一层审批)，实际风险已经被其他机制覆盖。需要勇气去简化——但必须有数据支撑和合规部门认可。

实际案例：我曾帮助一个支付流程将STP率从50%提升到85%。最大的贡献来自第一层(数据校验)和第二层(规则优化)，而不是AI。这说明很多时候最简单的方法最有效。

追问准备:

追问: STP率有上限吗？ → 有。金融合规要求的人工审查设置了硬上限。对于AML，监管通常要求某些交易必须人工审核，STP率上限约85-90%
追问: AI模型在AML中的合规风险？ → 主要风险是"可解释性"。监管要求能解释为什么通过/拒绝一笔交易。黑箱模型不行，需要用可解释的模型或SHAP等解释工具
追问: 如何衡量STP率优化的ROI？ → 直接成本节省(人工成本减少) + 间接收益(处理速度提升带来的客户体验改善和流失减少)

Q2: 设计一个金融流程的异常处理框架

30秒版本: 我用五级异常分级：L0自动修复(重试/格式转换)、L1规则处理(自动路由)、L2人工辅助(AI预处理+人工确认)、L3完全人工(复杂案例)、L4升级处理(超权限/超时)。每个级别有明确的触发条件、处理SLA和超时策略。核心原则是"尽可能在低级别解决，只有必要时才升级"。

2分钟版本:

(展开五级异常分级的具体设计，结合AML实操中的内容)

追问准备:

追问: 超时后应该自动放行还是冻结？ → 取决于风险类型。支付类→冻结(宁可延迟不可错付)；查询类→降级处理(返回缓存数据)；审批类→升级(不自动决策)
追问: 如何避免异常处理变成"黑洞"？ → 每类异常必须有明确的完结条件和最大处理时间，超过后强制升级或强制决策

学习资源

资源	类型	推荐度	说明
《Fundamentals of BPM》(Dumas等)	书籍	★★★★★	BPM领域最全面的教材
Camunda Best Practices	在线文档	★★★★★	实战导向的流程设计最佳实践
《Enterprise Integration Patterns》(Hohpe)	书籍	★★★★	异常处理和补偿事务的模式参考
Temporal.io文档	在线文档	★★★★	现代工作流引擎的设计理念
《Designing Data-Intensive Applications》Ch9	书籍(章节)	★★★★	分布式事务和Saga模式
SWIFT Payments Best Practices	行业文档	★★★★	金融支付流程的行业标准

明日预告

Day 5: Wardley Map战略推演 — 从流程的操作层面跳回战略层面。学习用Wardley Map做build/buy/partner决策，理解演进阶段(Genesis→Commodity)判断方法论，掌握气候模式(Climatic Patterns)和博弈策略(Gameplay)。实操环节将为"银行数字化转型"画Wardley Map并推演技术战略。