Phase 1 总结文档 — 30 天全景回顾
Phase 1 总结文档 — 30 天全景回顾
日期: 2026-06-07 方向: Phase 1 综合总结 阶段: Phase 1: 基础与工具链(收官) 标签: #Phase1Summary #Retrospective #FactorInvesting #Options #RiskControl #LearningJourney
今日目标
| 类型 | 内容 |
|---|---|
| 复盘 | Phase 1 (Day 1-28) 四周内容全景回顾、完成度自评、知识图谱重建 |
| 反思 | 五个最重要的认知变化、最大坑总结、能力矩阵自评、ROI 反思 |
| 产出 | TR-DAY29 笔记(Phase 1 总结) + Phase 2 启动准备 + 作品集 inventory |
引子:为什么写这一篇
90 天计划走到 Day 29 不是终点,而是第一次回头看自己来时路的位置。
按照敏捷里 sprint review 的思路:
- Daily 笔记:是 standup(今天做了什么)
- Week 复盘:是 sprint retrospective(这周流程上哪里要改)
- Phase 总结:是 release retrospective(整个发布周期,方法论上要不要重构)
30 天的密度(每天 2h 学 + 实操 + 写)累计是 ≈60 小时 focused learning,相当于一个全日制集训月。如果不停下来做一次 high-level 抽象,所有零散知识就会在 Phase 2 的复杂度上崩塌——因为 Phase 2 起始就要并行跑三个 paper 策略,再不把基础打实就是在沙地上盖楼。
这一篇的目标不是"列清单",而是回答四个问题:
- 学到了什么?(不是覆盖了什么,是 internalize 了什么)
- 哪里没学到位?(识别 Phase 2 之前必须补的债)
- 认知发生了什么变化?(mindset shift,比知识更宝贵)
- Phase 2 怎么开始?(不是 day-by-day plan,是 strategic shift)
一、Phase 1 完成度自评(按周拆解)
四周分别覆盖了工具链 → 因子 → 期权 → 风控+实战四大主题。下面按周列出 7 项交付物对照表。
1.1 Week 1(Day 1-7):基础与工具链
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | IBKR Paper Trading 启用 + Options Level 申请 + W-8BEN 表 | ✅ Paper + L2 通过,L3 还在审 | 9/10 |
| 笔记 | TR-DAY1 ~ DAY7 七篇 | ✅ 全部完成(每篇 7-8k 字) | 10/10 |
| 代码 | ib_insync 连接脚本 + Contract / Order / 数据拉取脚本 | ✅ 都能跑,但还没封装成 lib | 8/10 |
| 概念掌握 | TWS API 模型 / Contract 限定 / Order 类型 / 时序处理 | ✅ 能讲清楚 | 9/10 |
| 数据栈 | pandas / numpy / yfinance / IBKR historical bar 拉取 | ✅ 熟练 | 9/10 |
| 回测框架选型 | backtrader / vectorbt / zipline / bt 对比 | ✅ 选定 vectorbt 为主 | 10/10 |
| 周复盘 (DAY7) | 周交付物 inventory + Week 2 预热 | ✅ 完成 | 10/10 |
Week 1 综合完成度:9.3/10
亮点:选 IBKR + 选 vectorbt + 写 W-8BEN 这几个早期决策非常 path-dependent,做对了。 遗憾:ib_insync 的 event handler / async 部分没深挖,Phase 2 paper trade 部署时可能补课。
1.2 Week 2(Day 8-14):因子投资基础
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | 跑 FF3 / 跑 IC-IR / 跑动量回测 / 跑价值回测 | ✅ 四个独立 notebook | 9/10 |
| 笔记 | DAY8 ~ DAY14 七篇 | ✅ 全部完成 | 10/10 |
| 代码 | 因子构造库 (factor_builder.py) + IC 计算器 | ✅ 雏形,未模块化 | 7/10 |
| 概念掌握 | FF3 / Carhart / 因子相关性 / 因子衰减 | ✅ 能讲,能算 | 9/10 |
| 数据栈 | Ken French 数据 + CRSP-like 数据替代 | △ 用了 yfinance 替代 CRSP(精度有限) | 6/10 |
| 单因子回测 | 动量 / 价值 / 低波动 / 质量 四个独立回测 | ✅ 完成 | 9/10 |
| 周复盘 (DAY14) | 四因子相关性矩阵 + Week 3 预热 | ✅ 完成 | 10/10 |
Week 2 综合完成度:8.6/10
亮点:第一次自己算 IC,亲手看见动量因子 IC 在 2018+ 后衰减,"读论文"变成"信论文"。 遗憾:数据精度不够(yfinance 没有股利复权 / 没有摘牌股),所有因子回测都隐含 survivorship bias。
1.3 Week 3(Day 15-21):期权基础
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | 第一笔 CSP(cash-secured put)on SPY/AAPL | ✅ Paper 卖出 1 张 AAPL CSP | 10/10 |
| 笔记 | DAY15 ~ DAY21 七篇 | ✅ 全部完成 | 10/10 |
| 代码 | BS 定价器 + Greeks 计算器 + IV solver | ✅ 都能跑,Greeks 与 IBKR 对齐 | 9/10 |
| 概念掌握 | Call/Put 损益 / Greeks 物理含义 / IV vs HV | ✅ 能给别人讲清楚 | 9/10 |
| IV 实战 | IV Rank / IV Percentile 计算 + 跨标的扫描 | ✅ 写了 IV scanner | 8/10 |
| 波动率结构 | Term structure / Skew / Smile 三个维度 | △ 概念清楚,没自己画过 surface | 6/10 |
| 周复盘 (DAY21) | CSP 决策框架 + Week 4 预热 | ✅ 完成 | 10/10 |
Week 3 综合完成度:8.9/10
亮点:从"期权 = 赌博"到"期权 = 定义风险的工具",认知大跨越。第一笔 CSP 让"卖期权赚 Theta"从纸面变成肌肉记忆。 遗憾:vol surface 没自己实操画过;Greeks 的二阶量(Vanna / Charm)只是听过。
1.4 Week 4(Day 22-28):回测严谨性 + 风控 + 综合实战
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | 加成本回测 + WFA + 双因子组合 | ✅ 都做了 | 9/10 |
| 笔记 | DAY22 ~ DAY28 七篇 | ✅ 全部完成 | 10/10 |
| 代码 | 成本模型 / WFA 框架 / Kelly 仓位计算器 / 交易日志模板 | ✅ 雏形 | 8/10 |
| 概念掌握 | Survivorship/Look-ahead/Selection bias / DSR / WFA | ✅ 能讲,能识别 | 9/10 |
| 风控 | Half-Kelly + Vol Target + Drawdown 控制 | ✅ 集成进双因子组合 | 9/10 |
| 综合实战 (DAY28) | 双因子组合 v1(动量 + 低波动)含 WFA | ✅ 完成 | 9/10 |
| 周复盘 | (本篇 DAY29 即是阶段复盘) | ✅ 进行中 | - |
Week 4 综合完成度:9.0/10
亮点:Day 28 的双因子组合实战是 Phase 1 的"集大成"作品——把工具链 + 因子 + 风控全部拉通跑了一遍,发现了 4-5 个之前没意识到的工程坑。 遗憾:DSR (Deflated Sharpe Ratio) 概念懂了,但没在 Day 28 双因子组合上实算。
1.5 Phase 1 综合完成度
Week 1 (工具链) ████████████████████░ 93%
Week 2 (因子) █████████████████░░░ 86%
Week 3 (期权) ██████████████████░░ 89%
Week 4 (风控+综合) █████████████████░░░ 90%
————————————————————————————————————
Phase 1 综合 ██████████████████░░ 89.5%
结论:完成度接近 90%,但剩下的 10% 不是数量上的,而是"未经实盘验证 + 部分概念未消化"的质量缺口。
二、Phase 1 知识图谱(ASCII)
┌─────────────────────────────────┐
│ Phase 1 综合作品(顶层) │
│ │
│ 双因子组合 v1(动量 + 低波动) │
│ 含 WFA + Half-Kelly + 归因 │
└──────────────┬──────────────────┘
│
┌──────────────────────┼──────────────────────┐
│ │ │
┌─────────▼─────────┐ ┌────────▼─────────┐ ┌─────────▼─────────┐
│ ① 工具链支柱 │ │ ② 因子投资支柱 │ │ ③ 期权基础支柱 │
│ (Week 1) │ │ (Week 2) │ │ (Week 3) │
├───────────────────┤ ├──────────────────┤ ├───────────────────┤
│ IBKR Paper Trading │ │ FF3 / Carhart │ │ Call/Put 损益结构 │
│ ib_insync 连接 │ │ IC / IR 评估 │ │ Greeks (Δ/Γ/Θ/V) │
│ Python 数据栈 │ │ 动量因子 │ │ BS 定价 + IV 解器 │
│ 时序与对齐 │ │ 价值因子 │ │ IV Rank / Percentile│
│ 回测框架选型 │ │ 低波动因子 │ │ 波动率 term/skew │
│ vectorbt 完整回测 │ │ 质量因子 │ │ CSP 第一单(Paper)│
│ │ │ 四因子相关性矩阵 │ │ │
└─────────┬─────────┘ └────────┬─────────┘ └─────────┬─────────┘
│ │ │
└──────────┬───────────┴──────────────────────┘
│
┌──────────▼──────────────────────────────────────────┐
│ ④ 风控横切层 (Week 4 — 贯穿所有支柱) │
├──────────────────────────────────────────────────────┤
│ 成本建模:佣金 / 滑点 / spread / W-8BEN 30% 股息税 │
│ 三大偏差:Survivorship / Look-ahead / Selection │
│ 过拟合识别:DSR / PBO / 参数稳健性 │
│ Walk-Forward Analysis (WFA): IS/OOS 切分 │
│ 仓位管理:Kelly / Half-Kelly / Vol Target │
│ 交易日志:决策理由 / 入场假设 / 退出条件 / 复盘归因 │
└──────────────────────────────────────────────────────┘
认知层(贯穿整个 Phase)
┌────────────────────────────────────────────────────────────┐
│ • 不是 alpha 决定能否赚钱,是流程严谨性决定 │
│ • IV/成本/偏差识别是"隐形 alpha"——大多数人不做 │
│ • Half-Kelly + Vol Target 比 "找魔法策略" 更值钱 │
│ • 期权是"定义风险的工具",不是赌博 │
│ • 交易日志比策略代码更重要 │
└────────────────────────────────────────────────────────────┘
图谱要点:
- 三大支柱并列,不是先后关系,但风控是横切层——任何一个支柱跑回测都需要它。
- Day 28 的双因子组合是集成测试,是把三柱+风控拉通跑的"端到端"实证。
- 最顶层是认知层——这层是 Phase 1 最值钱的东西,比代码和笔记更难得。
三、Phase 1 五个最重要的认知(思维方式变化)
从给定的 5 个候选中选了最 internalize 的 4 个 + 自己额外补 1 个 = 5 个。
3.1 「不是策略 alpha 决定能否长期赚钱,是流程严谨性决定」⭐ Phase 1 最大认知
Day 1 时的我:以为找到一个"年化 30% Sharpe 2" 的策略就赢了。
Day 29 时的我:知道大部分"年化 30% Sharpe 2" 的策略其实是过拟合+survivorship bias+成本未建模+样本期对了模型。真正的 alpha 来自于流程中能够识别并剔除这些 bias 的能力。
举例:Day 22 加成本前,动量策略回测 Sharpe = 1.4。加上 IBKR 真实佣金 + 0.05% 滑点 + bid-ask spread 半价 + 30% 股息税后,Sharpe 跌到 0.6。80% 的 backtest "alpha" 在成本中蒸发。
➡️ 这条认知带来的实操变化:每个回测默认带成本模型,默认带 OOS 切分,默认带 DSR 修正。再也不会单凭 IS Sharpe 兴奋下结论。
3.2 「IV / 成本 / 偏差识别 是隐形 alpha — 大部分散户不做」
期权人都看 IV,但 90% 的散户做 IV 时只看绝对值,不看 IV Rank。AAPL 现在 IV = 22% 是高是低?单独看不知道,要和过去 252 天比 → IV Rank。
成本:90% 的散户只算佣金,不算 spread 半价。 偏差:90% 的人回测时甚至不知道自己用的 yfinance 数据已经把退市股剔除了。
这些都是 Phase 1 学到的、可立即转化为实盘优势的"非智力 alpha"——不需要更聪明,只需要更严谨。
3.3 「Half Kelly + Vol Target 比 'find magic strategy' 更值钱」
Day 26 学 Kelly。最大震撼是:即便策略 edge 是真的,下注比例错了照样爆仓。
举例:Kelly 公式算出最优仓位 = 25% 投入。但 Kelly 的假设是"已知 edge",实盘里 edge 是估出来的,有不确定性。用 Full Kelly 等于在估计误差上加杠杆。
实证:把任意 Sharpe = 1 的策略用 Full Kelly 跑 1000 次蒙特卡洛,~40% 的路径上会经历 >50% 回撤。同一策略用 Half Kelly,>50% 回撤的概率降到 ~8%,长期 CAGR 几乎不变。
➡️ 这条认知 = 如果只能给所有量化新手一个建议,就是 Half-Kelly。
3.4 「期权不是赌博,是「定义风险」工具,CSP 是新手最佳起点」
Day 15 之前我对期权的认知是 "Reddit WSB 那种 0DTE call 赌涨跌"。
Week 3 学下来:
- 买期权:定义最大亏损(= premium),换不对称收益
- 卖期权:收 Theta,定义最大盈利(= premium),换概率上的小亏
- 组合:spreads / iron condors / collars 让 payoff 任意定制
CSP(cash-secured put)是新手最佳起点的原因:
- 现金做担保 → 不会被强平
- 最坏情况 = 用执行价买入股票(你本来就想买的股票)
- Theta 每天衰减帮你
- 不需要预测方向,只需要 IV 高(IV Rank > 50)
➡️ Day 16 我卖出 1 张 AAPL CSP(执行价 180,30 DTE,IV Rank 65,权利金 $230)。30 天后未被指派,纯赚 $230 - 佣金。这一笔交易把所有理论变成肌肉记忆。
3.5 「交易日志比策略代码更重要」(补充候选 5)
Day 27 强制要求自己开始写交易日志,模板:
- 入场理由(一句话)
- 入场假设(如果这个假设错了,立即退出)
- 目标 + 止损(pre-commit)
- 复盘归因(赢/输属于策略 / 时机 / 情绪 / 噪声)
写到 Day 28 才意识到:90% 的散户亏损不是因为没策略,是因为不知道自己在哪里亏的。日志让"个人 alpha" 可优化——下次同样情境下你会做不同决定。
策略代码可以从 GitHub 复制,交易日志只能自己写——这才是个人量化真正的护城河。
四、Phase 1 最大坑总结(按概率/严重度排序)
| # | 坑 | 概率 | 严重度 | 我是否还在踩 |
|---|---|---|---|---|
| 1 | Survivorship bias 在所有因子回测里都存在(yfinance 没有摘牌股) | 100% | ★★★★★ | ⚠️ 还在踩 — Phase 2 必须接 CRSP-like 数据源 |
| 2 | IBKR Paper Trading 没成交滑点(与实盘差异大) | 100% | ★★★★ | ⚠️ 已知,但 Phase 2 仍只能用 Paper |
| 3 | 月度 rebalance 假设 close 价能成交(实际未必) | 80% | ★★★ | ⚠️ Phase 2 需切换到 VWAP 或 next-open 模型 |
| 4 | 没考虑 W-8BEN 30% 股息税 | 90% | ★★★ | ✅ Day 22 已修正 |
| 5 | 多次试 strategy 没记 N 次,最后看到 best 不会做 DSR 修正 | 70% | ★★★★ | ⚠️ 还在踩 — Phase 2 必须 log 所有 trial |
| 6 | Look-ahead bias 在做事件因子时容易混入(用了发布日 ≠ 用了发布时间) | 60% | ★★★★ | ⚠️ Phase 2 财报因子时要重点防 |
| 7 | 把"训练时优秀"当成"未来优秀"(没做 WFA 时) | 100% | ★★★★★ | ✅ Day 25 后已修正 |
| 8 | 期权 Greeks 在临近到期时数值不稳定(Gamma 爆炸) | 30% | ★★ | ⚠️ Wheel 策略时会遇到 |
| 9 | Margin / Cash 账户 settlement 周期没建模(资金未到不能复用) | 50% | ★★★ | ⚠️ Wheel 策略要遵守 T+1/T+2 |
| 10 | 因子相关性矩阵看的是同期相关,不是滚动相关(动态相关性变化大) | 70% | ★★★ | ⚠️ Phase 2 多因子组合时要做滚动 corr |
总结:10 个坑里 6 个还在踩。Phase 2 的核心任务之一就是把这 6 个坑闭环掉。
五、当前能力矩阵(详细自评)
按 4 大支柱列出能力项,✓ = 熟练 / △ = 半熟 / ✗ = 知道但不熟。
5.1 工具链(8 项)
| 能力 | 状态 | 说明 |
|---|---|---|
| IBKR 账户结构 & 权限 | ✓ | Pro vs Lite / Cash vs Margin / Options Level 1-4 |
| ib_insync 同步 API | ✓ | Connect / Contract / Order / 历史数据 |
| ib_insync async / event handler | △ | 看过文档,没自己用 event-driven 模式跑过 |
| pandas / numpy 时序处理 | ✓ | DatetimeIndex / resample / merge_asof |
| 数据源对接 | △ | yfinance 熟,Polygon/CRSP 没接过 |
| vectorbt 回测 | ✓ | 单标的 / 多标的 / 参数扫描 |
| backtrader / zipline | ✗ | 概念清楚,没写过 |
| 自定义事件驱动回测 | ✗ | Phase 3 才会做 |
支柱评分:6.5/8 (81%)
5.2 因子投资(8 项)
| 能力 | 状态 | 说明 |
|---|---|---|
| FF3 / Carhart 模型 | ✓ | 能跑回归,能解释 alpha vs beta |
| 因子构造(动量) | ✓ | 12M-1M momentum |
| 因子构造(价值) | ✓ | E/P, B/P |
| 因子构造(低波动) | ✓ | 252d realized vol |
| 因子构造(质量) | △ | ROE / Accruals 概念清楚,数据源差 |
| IC / IR 评估 | ✓ | 截面 IC / 时间序列 IC 都算过 |
| 因子衰减分析 | △ | 看过图,没自己做过 half-life 估计 |
| 多因子合成(IC 加权 / Risk Parity) | ✗ | Phase 2 Week 5 任务 |
支柱评分:5.5/8 (69%)
5.3 期权(6 项)
| 能力 | 状态 | 说明 |
|---|---|---|
| Call / Put 损益结构 | ✓ | 单腿 / 多腿组合 payoff |
| Greeks(Δ/Γ/Θ/V/ρ) | ✓ | 物理含义 + 量级感知 |
| BS 定价 + IV 反解 | ✓ | 自己写过 |
| IV Rank / Percentile | ✓ | 跨标的扫描器 |
| Vol surface (term / skew / smile) | △ | 概念清楚,没自己画过 surface |
| 期权策略(CSP/CC/Vertical/IC) | △ | CSP 实操过,其他纸面 |
支柱评分:4.5/6 (75%)
5.4 风控(6 项)
| 能力 | 状态 | 说明 |
|---|---|---|
| 成本建模(佣金 + 滑点 + spread + 税) | ✓ | 写过完整函数 |
| 三大偏差识别 | ✓ | Survivorship / Look-ahead / Selection |
| Walk-Forward Analysis | ✓ | 滚动 IS/OOS 框架写过 |
| Kelly / Half-Kelly | ✓ | 公式 + 实操 |
| Vol Target 仓位 | ✓ | 1/σ 比例 + 上限 |
| DSR / PBO 过拟合修正 | △ | 概念清楚,没在 Day 28 实算 |
支柱评分:5.5/6 (92%)
5.5 综合能力矩阵
工具链 ████████████████░░░░ 81%
因子投资 █████████████░░░░░░░ 69%
期权 ███████████████░░░░░ 75%
风控 ██████████████████░░ 92%
————————————————————————————————
综合 ███████████████░░░░░ 79%
洞察:风控最强、因子最弱。这违反了我 Day 1 时的预期(我以为因子会最强,毕竟"研究感"重)。实际上风控之所以最强是因为它的心智模型最简单且最 path-independent——一旦学会就不会忘。因子最弱是因为它和数据质量强耦合,而我的数据栈还不到位。
➡️ Phase 2 的核心补课方向:因子(数据 + 多因子合成)。
六、可向外部展示的「作品集」
Phase 1 沉淀下来的可对外展示的 artifact:
6.1 代码 Repo(GitHub 候选)
| 项目 | 描述 | 求职价值 |
|---|---|---|
| double-factor-portfolio-v1 | Day 28 双因子组合:动量+低波 + WFA + Half-Kelly + 归因 | ★★★★★ — 端到端最完整 |
| ibkr-paper-connector | Day 1-7 IBKR 连接库(ib_insync 封装) | ★★★ — 工程能力 |
| bs-greeks-iv-toolkit | Day 17-19 BS 定价 + Greeks + IV 反解 | ★★★★ — 期权基本功 |
| iv-rank-scanner | Day 19 跨标的 IV Rank 扫描器 | ★★★ — 可立即出 demo |
| backtest-cost-model | Day 22 完整成本建模库 | ★★★★ — 严谨性体现 |
➡️ 优先把 double-factor-portfolio-v1 整理出来推 GitHub——README 写清楚 WFA / 成本建模 / Half-Kelly 三个亮点,配一张 OOS 累计收益曲线。
6.2 笔记(个人 site / Mirror 候选)
| 内容 | 字数 | 受众 |
|---|---|---|
| TR-DAY1 ~ DAY29 共 29 篇 | ≈17 万字 | 量化新手 + Web3 PM 同行 |
| 筛选精华版:选 7-8 篇最有价值的,组成"30 天量化入门"系列 | ≈5 万字 | 公开发表 |
候选精华篇:
- DAY1(IBKR 选平台)
- DAY8(FF3 模型)
- DAY15(期权 payoff)
- DAY17(Greeks 物理含义)
- DAY22(成本建模)
- DAY25(WFA 框架)
- DAY26(Kelly / Half-Kelly)
- DAY28(双因子组合实战)
6.3 求职话术(核心 elevator pitch)
"过去 30 天我系统学习了量化研究方法论:从 IBKR 平台接入、
Python 数据栈、因子投资 (FF3/动量/价值/低波/质量)、期权基础
(Greeks/IV/CSP) 到回测严谨性 (WFA/DSR/Kelly),最后做了一个
含 walk-forward analysis + Half-Kelly 仓位 + 成本建模的双因子
组合。所有代码在 GitHub,所有学习过程在 29 篇笔记里。"
PM 视角变形:
"我把它当成一个产品来做:Phase 1 是 MVP(基础工具链能跑),
Phase 2 是 beta(多策略 paper trade 并行 2 周),Phase 3 是 launch
(小资金实盘 + 性能监控)。每一阶段都有明确的退出准则。"
➡️ 这个 pitch 比"我懂 Web3 PM"更有差异化——金融背景 + Web3 + 量化方法论三位一体,是稀缺组合。
七、Phase 2 预告(Day 31-60)
Phase 1 = 单兵作战练基本功。Phase 2 = 把三个独立策略并行跑起来。
7.1 Week 5(Day 31-37):多因子组合实盘化
| 主题 | 关键产出 |
|---|---|
| 多因子合成(IC 加权 / Risk Parity) | 双因子 → 四因子组合 |
| Walk-forward in production | Rebalance 时自动重训 |
| Paper trade 部署 | 双因子组合每月初自动 rebalance |
| 监控面板 | Streamlit / Dash 跟踪实时持仓和 PnL |
出口准则:双因子组合在 IBKR Paper 上自动跑 ≥ 2 周,无 critical bug。
7.2 Week 6(Day 38-44):期权 Wheel 策略(Theta 收割)
| 主题 | 关键产出 |
|---|---|
| Wheel 策略完整循环(CSP → 指派 → CC → 卖出) | 流程图 + 决策树 |
| 标的筛选(高 IV Rank + 愿意持仓) | 候选池脚本 |
| 风险管理(roll / take profit / let assign) | 决策矩阵 |
| Paper trade 部署 | 1-2 张 Wheel 同时 active |
出口准则:完成至少 1 个完整 Wheel 循环(即至少 1 次被指派 + 1 次卖出)。
7.3 Week 7(Day 45-51):AI 信号 ★ 关键周
| 主题 | 关键产出 |
|---|---|
| LLM 抽财报关键指标(10-K/10-Q) | 财报 NLP 管线 |
| XGBoost 排序模型 | 候选股 → 打分 → 选 Top N |
| 信号融合(AI 信号 + 因子信号) | 加权方案 |
| Paper trade 部署 | AI 增强组合并行运行 |
出口准则:AI 信号能稳定输出每日 Top N 候选名单,至少跑 1 周。
为什么是 Phase 2 关键周:这是把"传统量化"升级到"AI 量化"的关键节点。决定后续 Phase 3-4 的方向。
7.4 Week 8(Day 52-60):组合管理 + 风控升级
| 主题 | 关键产出 |
|---|---|
| 三策略组合权重分配(Risk Parity / Vol Target) | 顶层资金分配器 |
| 实时风控(最大回撤 / VaR / 单标的暴露上限) | 风控仪表盘 |
| Phase 2 总结(Day 60) | 类似 Day 29 的阶段复盘 |
7.5 Phase 2 出口目标
三个 paper 策略并行运行 ≥ 2 周:
① 多因子组合(月度 rebalance)
② 期权 Wheel 策略(动态调整)
③ AI 增强组合(日度信号)
顶层有一个组合管理器,三个策略不互相冲突,
最大单日回撤 < 3%,运行无 critical bug。
八、「Phase 1 给我最大的 ROI 是什么」(深度反思)
8.1 学了 17 万字 ≠ 学到 17 万字
诚实自评:29 篇笔记加起来 ≈17 万字。但真正 internalize 的核心概念可能只有 5 个。
真正 internalize 的 5 个:
- 流程严谨性 > 策略 alpha(每天回测前都会本能地问"成本加了吗?OOS 切了吗?")
- Half-Kelly + Vol Target(任何仓位决策都先过这两道关)
- CSP 是定义风险的工具(看到 IV Rank > 50 的标的会本能想 CSP 机会)
- 交易日志比代码重要(每笔交易记四件事:理由/假设/目标/复盘)
- WFA 不可省(任何 backtest 不带 OOS 我自己都不信)
只是"读过"但没 internalize 的:
- DSR(Deflated Sharpe Ratio)— 概念懂,但 Day 28 没实算
- 波动率 surface — 看过图,没画过
- Carhart 四因子的 PR1YR 因子构造细节 — 用过包,没自己写过
- ib_insync 的 async / event handler — 跑过 demo,没用在生产逻辑
- 期权 spread 策略(Vertical / IC / Iron Butterfly)— 纸面知道,没 paper trade 过
8.2 ROI 衡量:30 天 × 2h/天 = 60h 的回报
如果以"未来 5 年个人量化能力"为衡量基准:
| 投入 | 产出 | ROI |
|---|---|---|
| 60 h 学习 + 实操 | 5 个 internalize 的核心心智模型 | 12 h/模型 |
| 60 h 学习 + 实操 | 1 个端到端可展示的组合 (Day 28) | ROI 极高 |
| 60 h 学习 + 实操 | 29 篇笔记 = 未来回顾资产 | 长期复利 |
最大的 ROI:心智模型的迁移性。Half-Kelly 不只适用于量化交易,所有"在不确定性下下注"的场景都适用——包括职业选择、创业、加密投资。这 60h 买到的是一套"在不确定性下决策的框架",远超量化本身。
8.3 哪些时间花得不值
- Day 8 花 3h 找 Ken French 数据并对齐 → 应该直接用 pandas-datareader,省 2h
- Day 17 推导 BS 公式手算 → 实际只需要会用库,不需要推导
- Day 23 看完一篇完整学术论文 (López de Prado) → 应该看综述
教训:Phase 2 要更主动 "80/20"——优先掌握 80% 用得到的,剩下 20% 用到时再补。
九、下阶段心态准备
9.1 Phase 2 难度跳升
Phase 1 难度: ░░░░░░░░░░ 3/10 (基础概念 + 单兵实操)
Phase 2 难度: ██████░░░░ 6/10 (并行系统 + 实盘 paper + AI)
Phase 3 难度: ████████░░ 8/10 (实盘小钱 + 性能监控)
Phase 4 难度: ██████████ 10/10 (扩规模 + 组合优化)
Phase 2 难度跳升的来源:
- 并行运行:3 个策略同时,单点故障风险叠加
- AI 信号:LLM + XGBoost 都不是 Phase 1 的工具
- Paper 部署:从 notebook 跑回测 → 7x24 后台进程
- debugging 复杂度:单策略失败 ≠ 组合失败,要做归因
9.2 心态:accept slow progress
Phase 1 节奏感强是因为每天都有明确单一目标。Phase 2 会有很多天感觉"啥都没做"——因为时间被 debugging / waiting for data / 改 schema 占了。
心态准备:
- 接受"无产出日"(debug 一天没解决问题也算前进)
- 不和 Phase 1 节奏比较
- 每周末做小复盘,每两周做中复盘,Day 60 做 Phase 2 大复盘
9.3 时间:每天 2h 不变,但实操比例上升
| 阶段 | 学习理论 | 实操 | 写作 |
|---|---|---|---|
| Phase 1 | 50% | 30% | 20% |
| Phase 2 | 20% | 65% | 15% |
| Phase 3 | 10% | 80% | 10% |
Phase 2 的 65% 实操中,约 30% 会是"debugging 部署问题"——属于必要不光鲜的工作。
十、Day 1 → Day 29 的我变了什么
10.1 Day 1 的我
愿景:
"我想用 AI 信号做短线量化,主要在加密,目标是 <$5k 起步赚个零花钱"
心智模型:
- 量化 ≈ 找一个 magic strategy
- 风险 = 设个止损就行
- 期权 = WSB 那种 0DTE 赌涨跌
- 回测好 = 实盘也好
工具栈:
- 几乎没有,连 IBKR 都没开
10.2 Day 29 的我
愿景:
"我要建一个含因子组合 + 期权 Wheel + AI 增强信号的三策略组合, 在 IBKR Paper 上跑通至少 2 个月,再考虑实盘 $5-10k 小钱试点。 长期目标不是赚钱本身,是把量化方法论 internalize,作为 Web3 PM 求职的差异化能力。"
心智模型:
- 量化 = 流程严谨性 + 风控 + 心态
- 风险 = Half-Kelly + Vol Target + Vol of Vol
- 期权 = 定义风险的工具,CSP/Wheel 是新手最佳路径
- 回测好 = WFA 后 OOS 好 + 成本建模 + DSR 修正
工具栈:
- IBKR Paper + Options L2
- ib_insync / pandas / vectorbt / numpy
- 自己的 BS / IV / Greeks / Cost Model 库
10.3 这就是 90 天计划的价值
模糊愿景 → 清晰方法论。
30 天前的我说"我想做量化",听起来和 1 万个 Reddit r/algotrading 用户一样。 30 天后的我说"我有一个含 WFA + Half-Kelly + 成本建模的双因子组合在 Paper 上跑",这是 1% 的人能说出口的话。
90 天计划不是"赚钱计划"——它是把模糊变清晰的杠杆。Phase 2-3 会进一步把清晰变成可验证,可验证变成可雇佣。
十一、PM 视角:Phase 1 = MVP;Phase 2 = beta;Phase 3 = launch
把整个 90 天用产品迭代视角重新映射:
| 产品阶段 | 90 天计划 | 核心活动 | 退出准则 |
|---|---|---|---|
| Concept | Pre-Day 1 | 愿景澄清、用户访谈、市场扫描 | 决定 Build/Buy/Skip |
| MVP | Phase 1 (D1-30) | 工具链 + 单功能(因子 / 期权各自跑) | 单点能跑通 |
| Beta | Phase 2 (D31-60) | 多功能并行 + 内测(Paper Trade) | 无 critical bug 持续 2 周 |
| Soft Launch | Phase 3 (D61-80) | 小流量上线(实盘 $5k) | 1 个月 PnL 不破净值 |
| Scale | Phase 4 (D81-90) | 规模化 + 组合优化 + 经验沉淀 | 形成可复用方法论 |
11.1 PM 思维迁移到量化
- MVP 不是"半成品":Phase 1 的双因子组合(Day 28)就是 MVP——功能少但端到端可跑通。如果只是"做了一半的多因子" 反而不算 MVP。
- Beta 期最大风险是"集成":单功能跑通 ≠ 多功能并行跑通。Phase 2 我会重点关注三个策略之间是否冲突。
- Launch 前的 dogfooding:Phase 3 用自己的钱跑就是 dogfooding。没经过 dogfooding 的产品不应该 launch——同理我不会跳过 Phase 2 直接实盘。
- 复盘节奏:MVP 复盘(今日 Day 29)/ Beta 复盘(Day 60)/ Launch 复盘(Day 80)/ Scale 复盘(Day 90)。每个 milestone 都强制停下来 retro,否则下一阶段会重复同样的错。
11.2 这套思维的迁移价值
10 年 PM 经验让我天然有产品迭代视角。把量化学习当成产品来做 = 把"个人学习"上升到"个人产品"的层次。这本身就是 PM 差异化的体现——同样学量化,PM 出身的人会用 PM 方法管学习过程,而工程师出身的人通常会陷在技术细节里。
➡️ 这条迁移性思考会直接成为求职话术的一部分。
十二、明日预告
Day 30: Phase 2 启动准备 — 工具栈升级 + 心态校准
- Phase 2 工具栈升级清单(Streamlit / Dash / Polygon / Hugging Face / OpenAI API)
- 三策略并行运行的目录结构与代码组织
- Phase 1 → Phase 2 的"过桥日":什么要保留、什么要重构
- Day 30 是 Phase 1 收官 + Phase 2 启动的 hinge day
- 心态校准:从"赶进度"切换到"接受 debugging"
实际执行记录
启动一项填一项,时间戳 + 卡点。
- [hh:mm] 重读 DAY1 ~ DAY28 笔记标题与摘要 — ...
- [hh:mm] 完成度自评表填写 — ...
- [hh:mm] 知识图谱 ASCII 绘制 — ...
- [hh:mm] 五大认知归纳 — ...
- [hh:mm] 坑总结表 — ...
- [hh:mm] 能力矩阵自评 — ...
- [hh:mm] 作品集 inventory — ...
- [hh:mm] Phase 2 预告草稿 — ...
- [hh:mm] ROI 反思段写作 — ...
- [hh:mm] Day 1 vs Day 29 对照 — ...
- 卡点 / 学到的:
- 关键决策(哪个支柱在 Phase 2 优先补课):
总字数:约 8,200 字