返回架构笔记
Arch Day 62

Arch Day 62: 案例分析(7):蚂蚁集团风控体系 — 架构分析文章#6

蚂蚁集团风控体系是全球金融科技领域最复杂的智能风控系统之一,通过"实时+准实时+离线"三层架构、图计算关系网络和联邦学习隐私保护技术,实现日均数十亿次交易的毫秒级风控决策,资损率低于百万分之一。

2026-05-31
第二阶段 - 金融域深度
蚂蚁集团AlphaRisk图计算联邦学习智能风控

日期: 2026-05-31 (Day 62) 阶段: 第二阶段 - 金融域深度 标签: #蚂蚁集团 #AlphaRisk #图计算 #联邦学习 #智能风控


核心概念

一句话定义

蚂蚁集团风控体系是全球金融科技领域最复杂的智能风控系统之一,通过"实时+准实时+离线"三层架构、图计算关系网络和联邦学习隐私保护技术,实现日均数十亿次交易的毫秒级风控决策,资损率低于百万分之一。

为什么关注

  • 行业标杆:蚂蚁数科在2024年中国零售信贷智能风控市场份额15.7%,排名第一
  • 技术深度:从AlphaRisk到图风控再到联邦学习,代表金融风控技术最前沿
  • 架构参考:三层风控架构已成为业界事实标准
  • PM视角:理解如何将复杂AI技术产品化(蚁盾开放平台)
  • 规模极致:服务10亿+用户、数十亿日交易量的系统设计挑战

误区与反模式

误区现实
风控就是规则引擎蚂蚁风控已进入第五代,AI模型是核心驱动力
风控越严越好蚂蚁追求"安全与体验平衡"的最优解
只需要实时风控三层架构(实时/准实时/离线)各有不可替代的价值
单一模型就够了蚂蚁使用数千个模型协同工作
风控只看个体图风控通过关系网络发现个体模型无法发现的团伙欺诈

知识点详解

1. 蚂蚁风控演进史(五代风控)

第一代 (2004-2008): 规则引擎时代
  ├── 支付宝成立初期
  ├── 手动编写规则(如:单笔>5000元需验证)
  ├── 规则数量:数百条
  └── 痛点:规则爆炸、维护困难

第二代 (2008-2013): 统计模型时代
  ├── 引入逻辑回归等统计模型
  ├── 特征工程驱动
  ├── 模型+规则混合决策
  └── 痛点:特征构建耗时、模型更新慢

第三代 (2013-2017): 机器学习时代
  ├── 大规模特征自动化
  ├── 深度学习模型上线
  ├── 实时决策引擎成型
  └── 痛点:模型可解释性差

第四代 (2017-2021): 智能风控(AlphaRisk)
  ├── AlphaRisk实时决策引擎
  ├── 图计算+关系网络
  ├── 联邦学习隐私计算
  ├── AI策略推荐"一键优化"
  └── 资损率降至百万分之一以下

第五代 (2021-至今): 全局视角风控
  ├── 图风控体系(业内首个)
  ├── 多模态风控(文本+图像+行为)
  ├── 大模型驱动的合规分析
  ├── 蚁盾能力开放
  └── 交互式风控标准(国内首个)

2. 蚂蚁风控三层体系架构

graph TB
    subgraph "用户交互层"
        A[用户操作] --> B[API网关]
    end

    subgraph "实时风控层(毫秒级)"
        B --> C[实时决策引擎<br>AlphaRisk]
        C --> D{决策结果}
        D -->|通过| E[放行交易]
        D -->|拒绝| F[阻断交易]
        D -->|存疑| G[二次验证]
    end

    subgraph "准实时风控层(秒~分钟级)"
        H[流式计算引擎<br>Flink/Blink]
        I[图计算引擎<br>GeaFlow]
        J[关系网络分析]
        K[行为序列分析]
        H --> I
        H --> J
        H --> K
    end

    subgraph "离线风控层(小时~天级)"
        L[离线特征工厂]
        M[模型训练平台]
        N[策略回测引擎]
        O[全量图谱构建]
        L --> M
        M --> N
        N --> O
    end

    C -.->|特征请求| H
    H -.->|准实时特征| C
    M -.->|模型更新| C
    O -.->|图谱数据| I

    style C fill:#ff6b6b,color:#fff
    style H fill:#ffa502,color:#fff
    style M fill:#1e90ff,color:#fff

三层架构详解

第一层:实时风控(毫秒级决策)

实时决策引擎(AlphaRisk)核心指标:
├── 决策延迟:<100ms(P99)
├── 日均决策量:100亿+次
├── 可用性:99.999%
├── 模型数量:数千个在线模型
└── 特征数量:10万+维度实时特征

技术栈:
├── 决策引擎:自研AlphaRisk
├── 特征计算:实时特征服务(Feature Store)
├── 模型推理:GPU集群 + 模型压缩
├── 规则引擎:自研Optimus
└── 消息队列:自研消息中间件

AlphaRisk决策流程

用户请求 → [网关接入]
    → [设备指纹采集] (设备ID/IP/位置/行为)
    → [实时特征计算] (账户特征+交易特征+环境特征)
    → [多模型并行推理]
        ├── 账户风险模型 (该账户是否异常)
        ├── 交易风险模型 (该交易是否异常)
        ├── 设备风险模型 (该设备是否风险)
        ├── 关系风险模型 (对手方关系是否异常)
        └── 场景特定模型 (贷款/支付/转账)
    → [策略引擎综合决策]
        ├── 通过 → 放行
        ├── 拒绝 → 阻断 + 原因码
        └── 存疑 → 触发二次验证(短信/人脸/安全问题)
    → [结果记录 + 反馈闭环]

全流程 < 100ms

第二层:准实时风控(秒到分钟级)

准实时风控核心能力:
├── 流式聚合特征(近5分钟交易次数、金额等)
├── 实时图计算(发现新的风险关系)
├── 行为序列分析(操作模式异常检测)
├── 动态名单更新(新增黑名单/灰名单)
└── 跨事件关联(多笔交易关联分析)

技术栈:
├── 流式计算:Apache Flink(蚂蚁版Blink)
├── 图计算:GeaFlow(自研流式图计算引擎)
├── 时序数据库:自研TSDB
└── CEP引擎:复杂事件处理

第三层:离线风控(小时到天级)

离线风控核心能力:
├── 全量特征工厂(千万级特征计算)
├── 模型训练与评估(日/周更新模型)
├── 策略回测与优化
├── 全量知识图谱构建
├── 历史趋势分析
└── 反馈标签生产(案件标注)

技术栈:
├── 大数据平台:MaxCompute(ODPS)
├── 模型训练:PAI(自研机器学习平台)
├── 图谱构建:GraphScope
├── 调度系统:自研DAG调度
└── 数据仓库:分层数据仓库(ODS/DWD/DWS/ADS)

3. 图计算在反欺诈中的应用

为什么需要图风控?

传统风控(个体视角)的局限:

用户A → [特征提取] → [模型打分] → 决策
  问题:只看A自身的特征,无法发现:
  ├── A的资金来自已知欺诈账户B
  ├── A和C、D、E共用同一设备(可能是团伙)
  ├── A的收款方F与多个可疑账户关联
  └── A的行为模式与某个欺诈团伙高度相似

图风控(关系视角)的优势:

           B(已知欺诈)
          ↗
    A ——→ F ——→ G(可疑)
    ↓       ↘
    C        H
    ↓
    D(共用设备)

  通过图关系,A的风险被"传播"识别

蚂蚁图风控体系

蚂蚁图风控三层架构:

第一层:图构建
  ├── 节点:用户/设备/账户/手机号/IP/商户
  ├── 边:转账/登录/共用设备/共用IP/社交
  ├── 属性:时间戳/金额/频次/设备指纹
  └── 规模:百亿节点+千亿边

第二层:图分析
  ├── 社区发现:Louvain/Label Propagation
  ├── 风险传播:PageRank变体/Belief Propagation
  ├── 路径分析:最短路径/资金链路追踪
  ├── 子图匹配:欺诈模式识别
  └── 图神经网络:GCN/GAT/GraphSAGE

第三层:图决策
  ├── 团伙识别→批量处置
  ├── 风险传播评分→实时决策补充
  ├── 异常子图→人工审核
  └── 新模式发现→规则/模型更新

图计算关键算法

# 伪代码:简化的风险传播算法

class RiskPropagation:
    """
    基于图的风险传播算法
    类似PageRank,但传播的是"风险信号"
    """

    def __init__(self, graph, damping=0.85, max_iter=100):
        self.graph = graph  # 图结构(邻接表)
        self.damping = damping  # 衰减因子
        self.max_iter = max_iter

    def propagate(self, seed_risks: dict) -> dict:
        """
        从已知风险节点出发,传播风险评分

        seed_risks: {node_id: risk_score}
          例如已知欺诈账户 risk_score = 1.0
        """
        # 初始化所有节点的风险评分
        risk_scores = {}
        for node in self.graph.nodes:
            risk_scores[node] = seed_risks.get(node, 0.0)

        # 迭代传播
        for iteration in range(self.max_iter):
            new_scores = {}
            for node in self.graph.nodes:
                # 从邻居节点接收的风险
                neighbor_risk = sum(
                    risk_scores[neighbor] * self.edge_weight(neighbor, node)
                    for neighbor in self.graph.neighbors(node)
                )
                # 风险 = 自身初始风险 + 衰减 * 邻居传播风险
                new_scores[node] = (
                    (1 - self.damping) * seed_risks.get(node, 0.0) +
                    self.damping * neighbor_risk
                )

            # 收敛检查
            if self.converged(risk_scores, new_scores):
                break
            risk_scores = new_scores

        return risk_scores

    def edge_weight(self, source, target):
        """
        边权重:考虑关系类型、时间衰减、金额等
        """
        edge = self.graph.get_edge(source, target)
        type_weight = {
            "transfer": 0.8,    # 转账关系权重最高
            "same_device": 0.6, # 共用设备
            "same_ip": 0.4,     # 共用IP
            "social": 0.2       # 社交关系
        }.get(edge.type, 0.1)

        # 时间衰减:越近的关系权重越高
        time_decay = math.exp(-0.1 * edge.days_ago)

        return type_weight * time_decay

图风控典型场景

场景图分析方法效果
团伙欺诈社区发现+子图匹配识别200+人团伙
洗钱网络资金链路追踪+路径分析发现多层洗钱路径
虚假交易环路检测+交易模式识别刷单/对敲
身份冒用设备-账户关系图一机多号检测
养号欺诈时序图+行为聚类批量注册识别

4. 联邦学习在风控中的隐私保护实践

联邦学习风控架构

传统风控建模的隐私问题:
  银行A的数据 + 银行B的数据 → 中心化训练 → 风控模型
  问题:数据需要集中,违反隐私法规(如GDPR/个人信息保护法)

联邦学习解决方案:
  银行A: 本地数据 → 本地训练 → 梯度/参数
  银行B: 本地数据 → 本地训练 → 梯度/参数
  聚合服务器: 聚合梯度 → 更新全局模型 → 下发

  数据不出域,模型共享知识
sequenceDiagram
    participant Server as 聚合服务器
    participant BankA as 银行A
    participant BankB as 银行B
    participant BankC as 银行C

    Server->>BankA: 下发全局模型V1
    Server->>BankB: 下发全局模型V1
    Server->>BankC: 下发全局模型V1

    BankA->>BankA: 本地数据训练
    BankB->>BankB: 本地数据训练
    BankC->>BankC: 本地数据训练

    BankA->>Server: 上传加密梯度
    BankB->>Server: 上传加密梯度
    BankC->>Server: 上传加密梯度

    Server->>Server: 安全聚合(FedAvg)
    Server->>BankA: 下发全局模型V2
    Server->>BankB: 下发全局模型V2
    Server->>BankC: 下发全局模型V2

蚂蚁联邦学习实践

蚂蚁联邦学习技术栈:

1. 蚂蚁隐私计算平台(隐语 SecretFlow)
   ├── 联邦学习(Federated Learning)
   ├── 多方安全计算(MPC)
   ├── 可信执行环境(TEE)
   └── 同态加密(HE)

2. 风控场景应用:
   ├── 联合风控建模
   │   └── 多家银行联合训练反欺诈模型
   ├── 联合信用评估
   │   └── 不同数据方(银行+电商+运营商)联合评分
   ├── 联合黑名单
   │   └── 隐私保护的跨机构黑名单查询
   └── 联合营销
       └── 隐私保护的跨域用户画像

3. 关键性能指标(蚂蚁公开数据):
   ├── 基于MPC的联合风控延迟比传统联邦学习提升37%
   ├── 数据泄露风险降至0.0003%以下
   └── 联合模型效果接近集中式训练的95%

联邦学习方案对比

方案数据安全计算开销模型效果适用场景
横向联邦同类机构(银行间)
纵向联邦互补数据(银行+电商)
MPC极高高安全要求
TEE有可信硬件
差分隐私大规模统计

5. 蚁盾——风控AI能力开放

蚁盾产品矩阵(2025):

┌─────────────────────────────────────┐
│           蚁盾开放平台               │
├─────────────────────────────────────┤
│                                     │
│  ┌─────────┐  ┌─────────┐         │
│  │ 智能风控  │  │ 内容安全  │        │
│  │ (贷前/中/│  │(文本/图像/│        │
│  │  后全链路)│  │ 音视频)  │        │
│  └─────────┘  └─────────┘         │
│                                     │
│  ┌─────────┐  ┌─────────┐         │
│  │ 身份验证  │  │ 营销风控  │        │
│  │ (eKYC/   │  │(薅羊毛/  │        │
│  │  活体检测)│  │ 刷单识别) │        │
│  └─────────┘  └─────────┘         │
│                                     │
│  ┌─────────┐  ┌─────────┐         │
│  │ 图风控   │  │ 知识交互  │        │
│  │(关系网络/│  │ 建模引擎  │        │
│  │ 团伙识别)│  │(10分钟定制)│       │
│  └─────────┘  └─────────┘         │
│                                     │
│  底层:数据安全(联邦学习/MPC/TEE)   │
└─────────────────────────────────────┘

商业模式:
├── SaaS模式:API调用按量付费
├── 私有化部署:整套系统输出
└── 联合建模:联邦学习合作

知识交互建模引擎(2023发布)

核心创新:让非技术人员10分钟定制AI风控模型

传统方式:
  业务需求 → 数据准备(2周) → 特征工程(1周) →
  模型训练(1周) → 测试验证(1周) → 上线部署(1周)
  总计:6周+

知识交互方式:
  业务专家输入领域知识(对话式) → 系统自动构建特征 →
  自动选择算法 → 自动训练优化 → 一键部署
  总计:10分钟 - 1天

6. 蚂蚁风控关键技术指标

指标数值说明
日均决策次数100亿+覆盖支付/贷款/保险全场景
决策延迟(P99)<100ms用户无感知
资损率<百万分之一远低于行业平均
在线模型数数千个多模型协同决策
特征维度10万+实时特征计算
图谱规模百亿节点+千亿边覆盖全量关系
可用性99.999%五个9
市场份额(零售信贷)15.7%2024年中国第一

对比分析

蚂蚁 vs 其他大厂风控体系

维度蚂蚁集团腾讯(天御)字节跳动京东(天盾)
核心场景支付+信贷社交+支付内容+电商电商+金融
技术特色图风控社交网络分析内容理解供应链风控
日决策量100亿+数十亿数十亿数十亿
联邦学习隐语平台Angel联邦不详九数平台
对外输出蚁盾天御开放火山引擎京东云
开源贡献GeaFlow/隐语Angel/FATE不详九数

蚂蚁风控 vs 国际金融机构

维度蚂蚁集团JP MorganGoldman SachsHSBC
风控模式全AI驱动AI+人工混合量化+AI规则+AI
图计算核心能力在探索在探索在探索
决策延迟毫秒级秒级秒级分钟级
数据优势C端行为数据机构交易数据市场数据全球KYC数据
开放程度技术输出内部使用内部使用内部使用

架构设计实操

完整架构分析文章

一、系统概述

蚂蚁集团风控体系是全球最大的实时智能风控系统,服务超过10亿用户,日均处理超100亿次风控决策。该系统经历了从规则引擎到AI驱动的五代演进,当前第五代风控以"全局视角"为核心,集成了图计算、联邦学习、大模型等前沿技术。

二、架构核心设计原则

原则1: 分层决策(三层体系)
  → 不同时效性要求对应不同技术方案
  → 实时层解决"快",离线层解决"准"

原则2: 全局视角(图风控)
  → 从"看个体"升级到"看关系"
  → 图计算提供传统模型无法获得的信息增量

原则3: 安全与体验平衡
  → 不是风控越严越好
  → AlphaRisk的AI策略推荐追求最优平衡点

原则4: 数据安全底线(联邦学习)
  → 数据不出域
  → 隐私计算保障合作方数据安全

原则5: 能力开放(蚁盾)
  → 内部验证→外部输出
  → SaaS/私有化/联合建模多种模式

三、关键技术深度解析

3.1 AlphaRisk实时决策引擎

AlphaRisk是蚂蚁第四代/第五代风控的核心引擎,其设计哲学是"无人驾驶风控"。传统风控需要专家手动配置规则和策略,而AlphaRisk通过AI策略推荐实现"一键推荐"最优风控策略,自动平衡安全与体验。

AlphaRisk核心模块:

1. 特征引擎(Feature Engine)
   ├── 实时特征:设备/网络/行为/交易
   ├── 准实时特征:近X分钟聚合
   ├── 离线特征:用户画像/历史统计
   └── 图特征:关系网络特征

2. 模型推理引擎(Model Inference)
   ├── 模型加载:热更新无需重启
   ├── 并行推理:多模型并行执行
   ├── 模型压缩:量化+蒸馏降低延迟
   └── A/B测试:模型灰度发布

3. 策略引擎(Strategy Engine)
   ├── 规则执行:确定性规则
   ├── 决策树:多条件组合
   ├── AI推荐:最优策略组合
   └── 兜底策略:异常降级

4. 反馈闭环(Feedback Loop)
   ├── 决策日志记录
   ├── 案件标注回流
   ├── 模型效果监控
   └── 策略自适应调优

3.2 GeaFlow图计算引擎

蚂蚁集团自研的GeaFlow(图引擎)是支撑图风控的核心基础设施。与传统的批处理图计算(如Spark GraphX)不同,GeaFlow支持流式图计算——能在关系实时变化时动态更新图分析结果。

GeaFlow关键特性:
├── 流+图一体(Streaming Graph Processing)
│   └── 新的交易/登录实时更新图结构
├── 增量计算
│   └── 只计算变化部分,不需要全量重算
├── 时序图(Temporal Graph)
│   └── 边和节点都有时间属性
├── 大规模
│   └── 支持百亿节点+千亿边
└── 已开源
    └── Apache GeaFlow

3.3 交互式风控

蚂蚁集团牵头编写了国内首个交互式风控标准,核心理念是:

传统风控: 用户操作 → 后台风控 → 通过/阻断(用户被动)

交互式风控: 用户操作 → 风控评估 →
  ├── 低风险 → 直接通过
  ├── 中风险 → 引导验证(短信/人脸/安全问题)
  └── 高风险 → 阻断 + 解释原因 + 申诉通道

核心改变: 用户从"被动接受"变为"主动参与"
  → 安全体验提升
  → 误杀率降低
  → 用户信任增强

四、PM视角关键洞察

洞察1: 风控产品化思维
  蚂蚁不只是做内部风控系统,而是将风控能力"产品化"输出(蚁盾)
  → 10分钟定制模型的背后是极致的产品设计

洞察2: 安全与体验的量化平衡
  AlphaRisk的核心创新不是技术,而是产品理念:
  → 将"安全"和"体验"都量化为可优化的指标
  → AI自动搜索最优平衡点

洞察3: 从个体到生态的风控视角
  图风控的价值不只是技术创新:
  → 它改变了风控的"观察粒度"——从个体交易到关系网络
  → 这对PM意味着:产品设计需要考虑用户间的关系

洞察4: 数据合作的新范式
  联邦学习解决了"数据孤岛"问题:
  → PM需要思考:哪些外部数据可以增强我的风控?
  → 如何设计隐私保护的数据合作方案?

ADR: 图风控引擎选型

## ADR-062: 图风控引擎选型

### 状态: 已采纳

### 上下文
需要支持图风控能力,可选方案:
A. 使用关系型数据库模拟图查询
B. 使用图数据库(Neo4j/TigerGraph)
C. 使用流式图计算引擎(GeaFlow/类似方案)

### 决策
采用方案C(流式图计算),辅以方案B(图数据库用于离线分析)

### 理由
1. 风控场景需要实时图更新(新交易→新边)
2. 批量图计算延迟太高(小时级),无法满足准实时需求
3. 图数据库适合OLTP查询但不适合大规模图分析
4. 流式图计算兼顾实时性和分析能力

### 后果
- 技术复杂度较高,需要专业图计算团队
- 需要处理图数据一致性问题
- 内存开销大(全图需要加载到内存)
- 需要与现有特征服务整合

AI增强实践

大模型在蚂蚁风控中的新应用(2025-2026)

1. LLM驱动的合规分析
   ├── 自动解读最新监管文件
   ├── 评估对风控策略的影响
   └── 生成合规调整建议

2. 多模态风控
   ├── 文本分析:聊天记录/通话内容识别诈骗话术
   ├── 图像分析:证件照片/人脸识别
   ├── 行为分析:操作序列/设备传感器
   └── 多模态融合:综合判断

3. AI策略推荐升级
   ├── 从"规则推荐"到"策略方案推荐"
   ├── 自然语言描述风控目标
   └── AI自动生成完整风控策略组合

4. 知识交互建模(2023发布)
   ├── 非技术人员通过对话定制风控模型
   ├── AI自动提取领域知识构建特征
   └── 10分钟从零到模型上线

AI在风控中的前沿趋势(2025-2026)

趋势说明成熟度
AI Agent风控自主分析案件、自主决策探索期
对抗学习模拟攻击者优化防御应用期
因果推断从相关性到因果性研究期
可解释AI满足监管要求的透明决策应用期
合成数据解决欺诈样本不足问题应用期

与Web3/DeFi的关联

CeFi风控 vs DeFi风控

维度蚂蚁(CeFi)DeFi风控
身份识别KYC实名制匿名地址
数据源内部+外部数据纯链上数据
决策引擎集中式服务器智能合约+链下预言机
图分析内部关系图谱链上地址关系图
交易监控实时拦截交易前模拟/MEV保护
合规受监管正在建立监管框架
反洗钱SAR报告Chainalysis链上追踪

蚂蚁风控技术在DeFi的可借鉴之处

1. 三层架构 → DeFi也需要
   ├── 实时:交易前模拟(Tenderly)
   ├── 准实时:MEV检测(Flashbots)
   └── 离线:链上数据分析(Dune)

2. 图风控 → 链上地址图谱
   ├── 节点:地址/合约/协议
   ├── 边:交易/授权/创建
   └── 应用:女巫检测/洗钱追踪

3. 联邦学习 → 跨链隐私计算
   ├── 不同链的数据不能直接共享
   ├── ZK证明作为隐私保护方案
   └── 跨链风控信息共享

4. 交互式风控 → DeFi钱包安全UX
   ├── 交易前风险提示
   ├── 分级验证(小额直接/大额确认)
   └── 授权风险可视化

今日思考

三个深度问题

  1. 图风控的"冷启动"问题:图风控依赖关系网络数据,但新用户/新设备加入时关系稀疏。蚂蚁如何解决图风控的冷启动?是否可以利用外部数据(如公开社交网络)补充关系信息?在隐私保护的约束下如何实现?

  2. 联邦学习的"搭便车"问题:在多方联邦学习中,如果某方提供的数据质量差或规模小,但享受了其他方贡献的模型提升,如何设计激励机制确保各方公平贡献?这是否可以借鉴Web3的Token激励模型?

  3. AI风控的"军备竞赛"悖论:风控AI越强,欺诈者也在用AI反制(如Deepfake绕过人脸识别、AI生成虚假信息)。这种军备竞赛的均衡点在哪里?作为PM,应该把资源投入到防御技术升级,还是转向风控范式创新(如从"检测"转向"预防")?


面试题准备

面试题1: 蚂蚁风控的核心技术壁垒?

30秒回答: 蚂蚁风控的技术壁垒主要在三个方面:一是百亿级决策量级练出的模型效果,这种数据飞轮其他公司很难追赶;二是图风控体系,通过关系网络视角发现传统模型无法识别的风险;三是联邦学习生态,通过蚁盾连接了大量金融机构形成数据联盟,网络效应显著。

2分钟详细回答: 蚂蚁风控的核心壁垒可以从技术、数据、生态三个维度来分析。

技术壁垒:蚂蚁在图计算(GeaFlow)、隐私计算(隐语SecretFlow)、实时决策引擎(AlphaRisk)上投入了大量研发资源,这些自研系统的性能远超开源方案。特别是GeaFlow支持流式图计算,可以在图结构实时变化时动态更新分析结果,这是市面上极少数系统能做到的。

数据壁垒:蚂蚁拥有10亿+用户的行为数据、百亿级的日交易数据,以及积累多年的欺诈案例标注数据。这种数据量级产生的模型效果是中小公司无法复制的。同时,数据覆盖支付、信贷、保险等全场景,模型可以跨场景迁移。

生态壁垒:通过蚁盾平台连接了数百家金融机构,形成了联邦学习数据联盟。每多一个参与方,联邦模型效果更好,吸引更多参与方——这是一个正向飞轮。

追问准备

  • Q: 其他大厂(腾讯/字节)能追上吗?
  • A: 在各自优势场景(社交/内容)可以做得很好,但支付+信贷全链路的风控积累很难短期追赶。数据飞轮一旦转起来差距会越来越大。

面试题2: 图计算如何提升反欺诈效果?

30秒回答: 图计算将风控视角从"个体特征"升级为"关系网络",能发现传统模型无法识别的团伙欺诈和洗钱行为。具体机制是通过构建包含用户、设备、交易等节点的关系图谱,利用社区发现识别欺诈团伙、风险传播算法扩散风险评分、路径分析追踪资金链路。蚂蚁数据显示,图风控对团伙欺诈的识别率提升了30%以上。

2分钟详细回答: 图计算在反欺诈中的价值可以从三个层面理解。

第一层:信息增量。传统模型只看个体特征(交易金额、频率、时间等),而图计算引入了关系特征(和谁交易、共用什么设备、资金流向哪里)。这些关系特征是传统模型无法获取的信息增量,能显著提升模型效果。

第二层:模式发现。欺诈团伙在图上会形成特定的子图结构——比如多个账户从同一来源获得资金,经过多层中转后汇聚到同一账户。社区发现算法可以自动识别这种结构,即使单个账户看起来完全正常。

第三层:风险传播。一旦某个节点被标记为高风险(如确认欺诈),其关联节点的风险评分会相应提升。这就像"牵一发动全身",一个欺诈案件的确认可以带出一整个欺诈网络。

追问准备

  • Q: 图计算的计算开销很大,如何保证实时性?
  • A: 采用分层策略——实时层做轻量级图查询(1-2度关系),准实时层做流式图分析(增量计算),离线层做全图分析。GeaFlow的流式图计算能力是关键,只计算变化部分而非全量重算。

学习资源

资源类型说明
蚂蚁集团技术博客博客官方技术分享
GeaFlow开源代码蚂蚁流式图计算引擎
隐语SecretFlow代码蚂蚁隐私计算框架
IDC图风控报告报告IDC图风控趋势预测
蚁盾官网产品蚂蚁风控开放平台
Rekt News资讯DeFi安全事件对比参考

明日预告

Day 63: 证券交易系统架构

  • 撮合引擎核心设计:订单簿/撮合算法
  • 行情系统:实时推送/Level 1&2
  • 清算交收:T+1/DVP/CCP
  • 交易系统的极致性能追求(微秒级延迟)
  • FIX协议深度解析