返回金融系统设计
高频与风险科学 · 其他

高频交易与风控科学基础 — 6周学习计划

06-hft-risk-science/plan.md

高频交易与风控科学基础 — 6周学习计划

定位:从架构设计升维到科学原理,掌握HFT和风控背后的数学模型与算法 目标人群:金融架构师/PM,不需要自己写量化策略,但需要能评审、设计、面试 前置:已完成5个金融系统设计(支付/记账/风控/信贷/清算) 开始日期:2026-04-13 产出目录docs/finance-design/06-hft-risk-science/


为什么需要科学基础?

场景只懂架构懂架构+科学
面试追问"评分卡为什么用WOE"答不上来讲清楚信息论基础和实操取舍
评审风控模型方案只看工程指标能质疑模型假设、特征穿越、过拟合
设计HFT系统架构画框图理解延迟瓶颈的物理极限和算法优化
与量化团队沟通听不懂术语对齐语言,做出正确的架构trade-off

知识体系全景

高频交易 & 风控科学基础
│
├── Part A:高频交易科学(3篇)
│   ├── 01-市场微观结构    → 订单簿/价格发现/做市理论
│   ├── 02-统计套利与量化策略 → 时间序列/协整/因子模型/回测
│   └── 03-延迟工程        → 硬件/网络/算法/系统层面的延迟优化
│
├── Part B:风控科学(5篇)
│   ├── 04-信用风险建模     → 评分卡/PD-LGD-EAD/Basel/压力测试
│   ├── 05-反欺诈科学      → 异常检测/图分析/序列建模/对抗学习
│   ├── 06-市场风险         → VaR/ES/GARCH/EVT/蒙特卡洛
│   ├── 07-实时特征工程     → 滑动窗口/流式计算/特征一致性/特征选择
│   └── 08-ML模型生命周期   → 训练/评估/上线/监控/迭代的科学方法
│
├── Part C:核心算法代码(3个文件)
│   ├── credit-scorecard.ts  → 评分卡核心算法(WOE/IV/评分映射)
│   ├── fraud-detection.ts   → 异常检测算法(Isolation Forest/Z-Score/AutoEncoder)
│   └── risk-metrics.ts      → 风险指标计算(VaR/ES/EWMA/GARCH)
│
└── Part D:面试题集
    └── interview-qa.md      → 20题深度Q&A(HFT 8题 + 风控 12题)

6周学习安排

Week 1:市场微观结构 + 统计套利

主题核心内容产出
Day 1订单簿与价格形成LOB模型/Bid-Ask Spread/价格冲击笔记01第一部分
Day 2价格发现理论Kyle模型/信息不对称/做市商角色笔记01第二部分
Day 3做市策略科学Avellaneda-Stoikov模型/库存管理/最优报价笔记01完成
Day 4时间序列基础平稳性/自相关/ADF检验/ARIMA笔记02第一部分
Day 5配对交易与协整Engle-Granger/Johansen/半衰期/Z-Score策略笔记02第二部分

Week 2:量化策略 + 延迟工程

主题核心内容产出
Day 1因子模型Fama-French/Alpha因子/IC/IR笔记02第三部分
Day 2回测科学过拟合/前视偏差/存活偏差/蒙特卡洛回测笔记02完成
Day 3延迟的物理极限光速延迟/网络拓扑/主机托管Co-Location笔记03第一部分
Day 4系统层延迟优化内核旁路/FPGA/无锁数据结构/CPU亲和笔记03第二部分
Day 5算法层延迟优化增量计算/预计算/热路径优化/GC调优笔记03完成

Week 3:信用风险建模

主题核心内容产出
Day 1评分卡方法论逻辑回归/WOE/IV/信息增益/分箱策略笔记04第一部分
Day 2A/B/C卡与申请评分申请评分(A卡)/行为评分(B卡)/催收评分(C卡)笔记04第二部分
Day 3PD-LGD-EAD框架违约概率/违约损失率/违约风险暴露笔记04第三部分
Day 4Basel框架与压力测试IRB方法/资本计量/压力情景/逆周期缓冲笔记04第四部分
Day 5信用风险代码实战评分卡核心算法实现笔记04完成 + 代码

Week 4:反欺诈科学

主题核心内容产出
Day 1异常检测数学基础Z-Score/IQR/Benford定律/Isolation Forest/LOF笔记05第一部分
Day 2图分析与团伙识别社区发现/PageRank/GCN/资金链追踪笔记05第二部分
Day 3序列建模与行为分析HMM/LSTM/Transformer/会话分析/用户画像笔记05第三部分
Day 4对抗学习与概念漂移GAN对抗训练/在线学习/数据漂移检测笔记05第四部分
Day 5反欺诈代码实战异常检测算法实现笔记05完成 + 代码

Week 5:市场风险 + 特征工程

主题核心内容产出
Day 1VaR方法论参数法/历史模拟法/蒙特卡洛/ES(CVaR)笔记06第一部分
Day 2波动率建模EWMA/GARCH/随机波动率/隐含波动率笔记06第二部分
Day 3极值理论与压力测试EVT/GPD/POT/Copula/压力情景设计笔记06完成 + 代码
Day 4实时特征工程滑动窗口/EWMA/流式计算/特征存储笔记07第一部分
Day 5特征选择与一致性IV/相关性/RFE/特征穿越/训练推理一致性笔记07完成

Week 6:ML生命周期 + 面试冲刺

主题核心内容产出
Day 1模型训练科学类别不平衡/交叉验证/超参调优/集成学习笔记08第一部分
Day 2模型评估科学AUC/KS/Lift/PSI/稳定性/可解释性(SHAP)笔记08第二部分
Day 3模型上线与监控A/B测试/影子模式/PSI监控/概念漂移/重训策略笔记08完成
Day 4面试题整理(HFT)8题HFT科学面试题 + 详细答案面试Q&A(上)
Day 5面试题整理(风控)12题风控科学面试题 + 详细答案面试Q&A(下)

每篇笔记的标准结构

# [主题名称]

## 一、核心概念与直觉
(用类比和图表建立直觉,不上来就甩公式)

## 二、数学基础
(公式推导、核心定理、关键假设)

## 三、实际应用
(在金融系统中如何使用,与架构设计的关联)

## 四、模型/算法详解
(每个模型:原理→假设→优缺点→适用场景→代码示意)

## 五、工程落地要点
(PM/架构师需要关注的:性能/可解释性/合规/监控)

## 六、常见误区
(面试中容易踩的坑)

## 七、与已有笔记的关联
(与Day 56-62风控笔记、W3风控引擎设计的对照)

## 八、延伸阅读
(论文/书籍/课程推荐)

交付物清单

文件内容预计行数
plan.md本计划文档~200
01-market-microstructure.md订单簿/价格发现/做市理论~500
02-statistical-arbitrage.md时间序列/协整/因子/回测~600
03-latency-engineering.md延迟优化的科学~450
04-credit-risk-modeling.md评分卡/PD-LGD-EAD/Basel~600
05-fraud-detection.md异常检测/图分析/对抗学习~650
06-market-risk.mdVaR/GARCH/EVT/蒙特卡洛~550
07-feature-engineering.md实时特征/特征选择/一致性~500
08-ml-model-lifecycle.md训练/评估/上线/监控~550
code/credit-scorecard.ts评分卡算法~250
code/fraud-detection.ts异常检测算法~250
code/risk-metrics.tsVaR/ES/GARCH计算~250
interview-qa.md20题深度Q&A~800
合计13个文件~6,000行

学习定位提醒

你的定位是:金融架构师/PM,不是Quant

所以学习重点是:
├── ✅ 理解模型的直觉和假设(能讲出why)
├── ✅ 知道每种方法的优缺点和适用场景(能做选型)
├── ✅ 理解工程落地的挑战(能设计系统)
├── ✅ 能评审模型方案(能提出好问题)
├── ✅ 面试能讲清楚科学原理(能展示深度)
│
├── ❌ 不需要自己推导HJB方程
├── ❌ 不需要自己训练生产级模型
└── ❌ 不需要写FPGA代码