高频与风险科学 · 其他

高频交易与风控科学基础 — 6周学习计划

06-hft-risk-science/plan.md

高频交易与风控科学基础 — 6周学习计划

定位：从架构设计升维到科学原理，掌握HFT和风控背后的数学模型与算法 目标人群：金融架构师/PM，不需要自己写量化策略，但需要能评审、设计、面试前置：已完成5个金融系统设计（支付/记账/风控/信贷/清算） 开始日期：2026-04-13 产出目录：docs/finance-design/06-hft-risk-science/

为什么需要科学基础？

场景	只懂架构	懂架构+科学
面试追问"评分卡为什么用WOE"	答不上来	讲清楚信息论基础和实操取舍
评审风控模型方案	只看工程指标	能质疑模型假设、特征穿越、过拟合
设计HFT系统架构	画框图	理解延迟瓶颈的物理极限和算法优化
与量化团队沟通	听不懂术语	对齐语言，做出正确的架构trade-off

知识体系全景

高频交易 & 风控科学基础
│
├── Part A：高频交易科学（3篇）
│   ├── 01-市场微观结构    → 订单簿/价格发现/做市理论
│   ├── 02-统计套利与量化策略 → 时间序列/协整/因子模型/回测
│   └── 03-延迟工程        → 硬件/网络/算法/系统层面的延迟优化
│
├── Part B：风控科学（5篇）
│   ├── 04-信用风险建模     → 评分卡/PD-LGD-EAD/Basel/压力测试
│   ├── 05-反欺诈科学      → 异常检测/图分析/序列建模/对抗学习
│   ├── 06-市场风险         → VaR/ES/GARCH/EVT/蒙特卡洛
│   ├── 07-实时特征工程     → 滑动窗口/流式计算/特征一致性/特征选择
│   └── 08-ML模型生命周期   → 训练/评估/上线/监控/迭代的科学方法
│
├── Part C：核心算法代码（3个文件）
│   ├── credit-scorecard.ts  → 评分卡核心算法（WOE/IV/评分映射）
│   ├── fraud-detection.ts   → 异常检测算法（Isolation Forest/Z-Score/AutoEncoder）
│   └── risk-metrics.ts      → 风险指标计算（VaR/ES/EWMA/GARCH）
│
└── Part D：面试题集
    └── interview-qa.md      → 20题深度Q&A（HFT 8题 + 风控 12题）

6周学习安排

Week 1：市场微观结构 + 统计套利

天	主题	核心内容	产出
Day 1	订单簿与价格形成	LOB模型/Bid-Ask Spread/价格冲击	笔记01第一部分
Day 2	价格发现理论	Kyle模型/信息不对称/做市商角色	笔记01第二部分
Day 3	做市策略科学	Avellaneda-Stoikov模型/库存管理/最优报价	笔记01完成
Day 4	时间序列基础	平稳性/自相关/ADF检验/ARIMA	笔记02第一部分
Day 5	配对交易与协整	Engle-Granger/Johansen/半衰期/Z-Score策略	笔记02第二部分

Week 2：量化策略 + 延迟工程

天	主题	核心内容	产出
Day 1	因子模型	Fama-French/Alpha因子/IC/IR	笔记02第三部分
Day 2	回测科学	过拟合/前视偏差/存活偏差/蒙特卡洛回测	笔记02完成
Day 3	延迟的物理极限	光速延迟/网络拓扑/主机托管Co-Location	笔记03第一部分
Day 4	系统层延迟优化	内核旁路/FPGA/无锁数据结构/CPU亲和	笔记03第二部分
Day 5	算法层延迟优化	增量计算/预计算/热路径优化/GC调优	笔记03完成

Week 3：信用风险建模

天	主题	核心内容	产出
Day 1	评分卡方法论	逻辑回归/WOE/IV/信息增益/分箱策略	笔记04第一部分
Day 2	A/B/C卡与申请评分	申请评分(A卡)/行为评分(B卡)/催收评分(C卡)	笔记04第二部分
Day 3	PD-LGD-EAD框架	违约概率/违约损失率/违约风险暴露	笔记04第三部分
Day 4	Basel框架与压力测试	IRB方法/资本计量/压力情景/逆周期缓冲	笔记04第四部分
Day 5	信用风险代码实战	评分卡核心算法实现	笔记04完成 + 代码

Week 4：反欺诈科学

天	主题	核心内容	产出
Day 1	异常检测数学基础	Z-Score/IQR/Benford定律/Isolation Forest/LOF	笔记05第一部分
Day 2	图分析与团伙识别	社区发现/PageRank/GCN/资金链追踪	笔记05第二部分
Day 3	序列建模与行为分析	HMM/LSTM/Transformer/会话分析/用户画像	笔记05第三部分
Day 4	对抗学习与概念漂移	GAN对抗训练/在线学习/数据漂移检测	笔记05第四部分
Day 5	反欺诈代码实战	异常检测算法实现	笔记05完成 + 代码

Week 5：市场风险 + 特征工程

天	主题	核心内容	产出
Day 1	VaR方法论	参数法/历史模拟法/蒙特卡洛/ES(CVaR)	笔记06第一部分
Day 2	波动率建模	EWMA/GARCH/随机波动率/隐含波动率	笔记06第二部分
Day 3	极值理论与压力测试	EVT/GPD/POT/Copula/压力情景设计	笔记06完成 + 代码
Day 4	实时特征工程	滑动窗口/EWMA/流式计算/特征存储	笔记07第一部分
Day 5	特征选择与一致性	IV/相关性/RFE/特征穿越/训练推理一致性	笔记07完成

Week 6：ML生命周期 + 面试冲刺

天	主题	核心内容	产出
Day 1	模型训练科学	类别不平衡/交叉验证/超参调优/集成学习	笔记08第一部分
Day 2	模型评估科学	AUC/KS/Lift/PSI/稳定性/可解释性(SHAP)	笔记08第二部分
Day 3	模型上线与监控	A/B测试/影子模式/PSI监控/概念漂移/重训策略	笔记08完成
Day 4	面试题整理(HFT)	8题HFT科学面试题 + 详细答案	面试Q&A(上)
Day 5	面试题整理(风控)	12题风控科学面试题 + 详细答案	面试Q&A(下)

每篇笔记的标准结构

# [主题名称]

## 一、核心概念与直觉
（用类比和图表建立直觉，不上来就甩公式）

## 二、数学基础
（公式推导、核心定理、关键假设）

## 三、实际应用
（在金融系统中如何使用，与架构设计的关联）

## 四、模型/算法详解
（每个模型：原理→假设→优缺点→适用场景→代码示意）

## 五、工程落地要点
（PM/架构师需要关注的：性能/可解释性/合规/监控）

## 六、常见误区
（面试中容易踩的坑）

## 七、与已有笔记的关联
（与Day 56-62风控笔记、W3风控引擎设计的对照）

## 八、延伸阅读
（论文/书籍/课程推荐）

交付物清单

文件	内容	预计行数
`plan.md`	本计划文档	~200
`01-market-microstructure.md`	订单簿/价格发现/做市理论	~500
`02-statistical-arbitrage.md`	时间序列/协整/因子/回测	~600
`03-latency-engineering.md`	延迟优化的科学	~450
`04-credit-risk-modeling.md`	评分卡/PD-LGD-EAD/Basel	~600
`05-fraud-detection.md`	异常检测/图分析/对抗学习	~650
`06-market-risk.md`	VaR/GARCH/EVT/蒙特卡洛	~550
`07-feature-engineering.md`	实时特征/特征选择/一致性	~500
`08-ml-model-lifecycle.md`	训练/评估/上线/监控	~550
`code/credit-scorecard.ts`	评分卡算法	~250
`code/fraud-detection.ts`	异常检测算法	~250
`code/risk-metrics.ts`	VaR/ES/GARCH计算	~250
`interview-qa.md`	20题深度Q&A	~800
合计	13个文件	~6,000行

学习定位提醒

你的定位是：金融架构师/PM，不是Quant

所以学习重点是：
├── ✅ 理解模型的直觉和假设（能讲出why）
├── ✅ 知道每种方法的优缺点和适用场景（能做选型）
├── ✅ 理解工程落地的挑战（能设计系统）
├── ✅ 能评审模型方案（能提出好问题）
├── ✅ 面试能讲清楚科学原理（能展示深度）
│
├── ❌ 不需要自己推导HJB方程
├── ❌ 不需要自己训练生产级模型
└── ❌ 不需要写FPGA代码