高频与风险科学 · 其他
高频交易与风控科学基础 — 6周学习计划
06-hft-risk-science/plan.md
高频交易与风控科学基础 — 6周学习计划
定位:从架构设计升维到科学原理,掌握HFT和风控背后的数学模型与算法 目标人群:金融架构师/PM,不需要自己写量化策略,但需要能评审、设计、面试 前置:已完成5个金融系统设计(支付/记账/风控/信贷/清算) 开始日期:2026-04-13 产出目录:
docs/finance-design/06-hft-risk-science/
为什么需要科学基础?
| 场景 | 只懂架构 | 懂架构+科学 |
|---|---|---|
| 面试追问"评分卡为什么用WOE" | 答不上来 | 讲清楚信息论基础和实操取舍 |
| 评审风控模型方案 | 只看工程指标 | 能质疑模型假设、特征穿越、过拟合 |
| 设计HFT系统架构 | 画框图 | 理解延迟瓶颈的物理极限和算法优化 |
| 与量化团队沟通 | 听不懂术语 | 对齐语言,做出正确的架构trade-off |
知识体系全景
高频交易 & 风控科学基础
│
├── Part A:高频交易科学(3篇)
│ ├── 01-市场微观结构 → 订单簿/价格发现/做市理论
│ ├── 02-统计套利与量化策略 → 时间序列/协整/因子模型/回测
│ └── 03-延迟工程 → 硬件/网络/算法/系统层面的延迟优化
│
├── Part B:风控科学(5篇)
│ ├── 04-信用风险建模 → 评分卡/PD-LGD-EAD/Basel/压力测试
│ ├── 05-反欺诈科学 → 异常检测/图分析/序列建模/对抗学习
│ ├── 06-市场风险 → VaR/ES/GARCH/EVT/蒙特卡洛
│ ├── 07-实时特征工程 → 滑动窗口/流式计算/特征一致性/特征选择
│ └── 08-ML模型生命周期 → 训练/评估/上线/监控/迭代的科学方法
│
├── Part C:核心算法代码(3个文件)
│ ├── credit-scorecard.ts → 评分卡核心算法(WOE/IV/评分映射)
│ ├── fraud-detection.ts → 异常检测算法(Isolation Forest/Z-Score/AutoEncoder)
│ └── risk-metrics.ts → 风险指标计算(VaR/ES/EWMA/GARCH)
│
└── Part D:面试题集
└── interview-qa.md → 20题深度Q&A(HFT 8题 + 风控 12题)
6周学习安排
Week 1:市场微观结构 + 统计套利
| 天 | 主题 | 核心内容 | 产出 |
|---|---|---|---|
| Day 1 | 订单簿与价格形成 | LOB模型/Bid-Ask Spread/价格冲击 | 笔记01第一部分 |
| Day 2 | 价格发现理论 | Kyle模型/信息不对称/做市商角色 | 笔记01第二部分 |
| Day 3 | 做市策略科学 | Avellaneda-Stoikov模型/库存管理/最优报价 | 笔记01完成 |
| Day 4 | 时间序列基础 | 平稳性/自相关/ADF检验/ARIMA | 笔记02第一部分 |
| Day 5 | 配对交易与协整 | Engle-Granger/Johansen/半衰期/Z-Score策略 | 笔记02第二部分 |
Week 2:量化策略 + 延迟工程
| 天 | 主题 | 核心内容 | 产出 |
|---|---|---|---|
| Day 1 | 因子模型 | Fama-French/Alpha因子/IC/IR | 笔记02第三部分 |
| Day 2 | 回测科学 | 过拟合/前视偏差/存活偏差/蒙特卡洛回测 | 笔记02完成 |
| Day 3 | 延迟的物理极限 | 光速延迟/网络拓扑/主机托管Co-Location | 笔记03第一部分 |
| Day 4 | 系统层延迟优化 | 内核旁路/FPGA/无锁数据结构/CPU亲和 | 笔记03第二部分 |
| Day 5 | 算法层延迟优化 | 增量计算/预计算/热路径优化/GC调优 | 笔记03完成 |
Week 3:信用风险建模
| 天 | 主题 | 核心内容 | 产出 |
|---|---|---|---|
| Day 1 | 评分卡方法论 | 逻辑回归/WOE/IV/信息增益/分箱策略 | 笔记04第一部分 |
| Day 2 | A/B/C卡与申请评分 | 申请评分(A卡)/行为评分(B卡)/催收评分(C卡) | 笔记04第二部分 |
| Day 3 | PD-LGD-EAD框架 | 违约概率/违约损失率/违约风险暴露 | 笔记04第三部分 |
| Day 4 | Basel框架与压力测试 | IRB方法/资本计量/压力情景/逆周期缓冲 | 笔记04第四部分 |
| Day 5 | 信用风险代码实战 | 评分卡核心算法实现 | 笔记04完成 + 代码 |
Week 4:反欺诈科学
| 天 | 主题 | 核心内容 | 产出 |
|---|---|---|---|
| Day 1 | 异常检测数学基础 | Z-Score/IQR/Benford定律/Isolation Forest/LOF | 笔记05第一部分 |
| Day 2 | 图分析与团伙识别 | 社区发现/PageRank/GCN/资金链追踪 | 笔记05第二部分 |
| Day 3 | 序列建模与行为分析 | HMM/LSTM/Transformer/会话分析/用户画像 | 笔记05第三部分 |
| Day 4 | 对抗学习与概念漂移 | GAN对抗训练/在线学习/数据漂移检测 | 笔记05第四部分 |
| Day 5 | 反欺诈代码实战 | 异常检测算法实现 | 笔记05完成 + 代码 |
Week 5:市场风险 + 特征工程
| 天 | 主题 | 核心内容 | 产出 |
|---|---|---|---|
| Day 1 | VaR方法论 | 参数法/历史模拟法/蒙特卡洛/ES(CVaR) | 笔记06第一部分 |
| Day 2 | 波动率建模 | EWMA/GARCH/随机波动率/隐含波动率 | 笔记06第二部分 |
| Day 3 | 极值理论与压力测试 | EVT/GPD/POT/Copula/压力情景设计 | 笔记06完成 + 代码 |
| Day 4 | 实时特征工程 | 滑动窗口/EWMA/流式计算/特征存储 | 笔记07第一部分 |
| Day 5 | 特征选择与一致性 | IV/相关性/RFE/特征穿越/训练推理一致性 | 笔记07完成 |
Week 6:ML生命周期 + 面试冲刺
| 天 | 主题 | 核心内容 | 产出 |
|---|---|---|---|
| Day 1 | 模型训练科学 | 类别不平衡/交叉验证/超参调优/集成学习 | 笔记08第一部分 |
| Day 2 | 模型评估科学 | AUC/KS/Lift/PSI/稳定性/可解释性(SHAP) | 笔记08第二部分 |
| Day 3 | 模型上线与监控 | A/B测试/影子模式/PSI监控/概念漂移/重训策略 | 笔记08完成 |
| Day 4 | 面试题整理(HFT) | 8题HFT科学面试题 + 详细答案 | 面试Q&A(上) |
| Day 5 | 面试题整理(风控) | 12题风控科学面试题 + 详细答案 | 面试Q&A(下) |
每篇笔记的标准结构
# [主题名称]
## 一、核心概念与直觉
(用类比和图表建立直觉,不上来就甩公式)
## 二、数学基础
(公式推导、核心定理、关键假设)
## 三、实际应用
(在金融系统中如何使用,与架构设计的关联)
## 四、模型/算法详解
(每个模型:原理→假设→优缺点→适用场景→代码示意)
## 五、工程落地要点
(PM/架构师需要关注的:性能/可解释性/合规/监控)
## 六、常见误区
(面试中容易踩的坑)
## 七、与已有笔记的关联
(与Day 56-62风控笔记、W3风控引擎设计的对照)
## 八、延伸阅读
(论文/书籍/课程推荐)
交付物清单
| 文件 | 内容 | 预计行数 |
|---|---|---|
plan.md | 本计划文档 | ~200 |
01-market-microstructure.md | 订单簿/价格发现/做市理论 | ~500 |
02-statistical-arbitrage.md | 时间序列/协整/因子/回测 | ~600 |
03-latency-engineering.md | 延迟优化的科学 | ~450 |
04-credit-risk-modeling.md | 评分卡/PD-LGD-EAD/Basel | ~600 |
05-fraud-detection.md | 异常检测/图分析/对抗学习 | ~650 |
06-market-risk.md | VaR/GARCH/EVT/蒙特卡洛 | ~550 |
07-feature-engineering.md | 实时特征/特征选择/一致性 | ~500 |
08-ml-model-lifecycle.md | 训练/评估/上线/监控 | ~550 |
code/credit-scorecard.ts | 评分卡算法 | ~250 |
code/fraud-detection.ts | 异常检测算法 | ~250 |
code/risk-metrics.ts | VaR/ES/GARCH计算 | ~250 |
interview-qa.md | 20题深度Q&A | ~800 |
| 合计 | 13个文件 | ~6,000行 |
学习定位提醒
你的定位是:金融架构师/PM,不是Quant
所以学习重点是:
├── ✅ 理解模型的直觉和假设(能讲出why)
├── ✅ 知道每种方法的优缺点和适用场景(能做选型)
├── ✅ 理解工程落地的挑战(能设计系统)
├── ✅ 能评审模型方案(能提出好问题)
├── ✅ 面试能讲清楚科学原理(能展示深度)
│
├── ❌ 不需要自己推导HJB方程
├── ❌ 不需要自己训练生产级模型
└── ❌ 不需要写FPGA代码