Phase 2 总结文档 — 30 天全景回顾
Phase 2 总结文档 — 30 天全景回顾
日期: 2026-07-07 方向: Phase 2 总结 阶段: Phase 2 收官 标签: #Phase2Summary #Retrospective #PaperTrade #AISignals #Wheel #FactorCombo #Phase3Prep
今日目标
| 类型 | 内容 |
|---|---|
| 复盘 | Phase 2 (Day 31-58) 四周内容全景回顾、完成度自评、三策略并行作品 inventory |
| 反思 | Phase 2 五大认知、能力矩阵更新、Phase 1 → Phase 2 跃迁路径、剩余技术债 |
| 产出 | TR-DAY59 笔记(Phase 2 总结) + Day 60 实盘前 checklist 预告 + Phase 3 启动准备 |
引子:从 MVP 到 Beta,我到底跨过了什么
Phase 1 (Day 1-30) 结束时,我有的是「分散的单兵作战能力」——能跑回测、能算 Greeks、能写仓位公式,但没有一个可以 24x7 在 IBKR Paper 上自动运行的系统。
Phase 2 (Day 31-58) 28 天后,我有的是三个并行运行的 paper trade 策略 + 一套组合管理层 + 一套尾部风控。如果用 SaaS 产品的语言:
Phase 1 = MVP 单点功能跑通(每个策略各自能 backtest)
Phase 2 = Beta 多功能并行跑通(三策略在 Paper 上同时活着)
Phase 3 = GA 用户实际付费使用(实盘 $1k 起步)
今天这一篇是 Beta release retrospective——不是"我做了什么"的清单,是回答:
- Phase 2 的 28 天到底买到了什么?(不是覆盖了什么,是 internalize 了什么)
- 跑通 paper 和能赚钱之间还差多远?(诚实评估自己离实盘还有几步)
- AI 信号这一周是真正的范式跃迁,还是又一个 hype?
- Phase 3 上实盘前最关键的 3-5 件事是什么?
下面分十二节展开。
一、Phase 2 完成度自评(按周拆解)
Phase 2 的四周主题分别是:多因子组合实盘化 → 期权 Wheel → AI 信号 → 组合管理与风控。Phase 1 的四大支柱在 Phase 2 全部被升级到「可部署」层级,并多出第五大支柱:组合管理。
1.1 Week 5(Day 31-37):多因子组合实盘化
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | 双因子 → 四因子组合 + Cross-sectional z-score 标准化 | ✅ 4 因子组合(动量/价值/低波/质量)跑通 | 9/10 |
| 笔记 | DAY31 ~ DAY37 七篇 | ✅ 全部完成 | 10/10 |
| 代码 | factor_combo.py 模块 + walk-forward 重训管线 | ✅ 可重用 lib,参数化配置 | 8/10 |
| 概念掌握 | IC 加权 / Risk Parity / 因子正交化 | ✅ 三种合成方式都跑过 | 9/10 |
| 成本细化 | spread 半价 + IBKR tiered commission + ADV 滑点模型 | ✅ Day 34 完成完整成本函数 | 9/10 |
| WFA in production | 月度 rebalance 时自动重训权重 | ✅ Day 35 cron 化 | 8/10 |
| IBKR Paper 部署 | 真实下单、状态轮询、错误恢复 | ✅ Day 36 上线,第一周复盘 (Day 37) | 8/10 |
Week 5 综合完成度:8.7/10
亮点:第一次把"研究 notebook"升级到"运行进程"。Day 36 触发了第一次自动 rebalance,看到 IBKR 账户里 8 只股票自动调仓的那一刻,理论 → 工程的临界点过了。
遗憾:4 因子相关性矩阵是同期相关,没做滚动相关;2026 年 Q2 的动量因子和质量因子相关性突然拉到 0.55,单期相关矩阵看不出这点。
1.2 Week 6(Day 38-44):期权 Wheel 策略
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | Wheel 全图谱(CSP → 指派 → CC → 卖出 → 重启) | ✅ 流程图 + 决策树 | 9/10 |
| 笔记 | DAY38 ~ DAY44 七篇 | ✅ 全部完成 | 10/10 |
| 代码 | wheel_engine.py + IV Rank 选股 + Greeks monitor | ✅ 三个模块独立 | 8/10 |
| CC 历史回测 | SPY/AAPL/MSFT 三标的 5 年回测 | ✅ Day 39 完成 | 9/10 |
| IV Rank 选股 | 跨标的 IV Rank > 50 + 流动性筛选 | ✅ Day 40 候选池 | 9/10 |
| Greeks 实时监控 | Δ / Γ / Θ / V 跨持仓汇总 | ✅ Day 41 Dashboard 雏形 | 8/10 |
| 第一组完整 Wheel | 1-2 张 CSP 在 Paper 上同时活着 | ✅ Day 42 卖出 2 张 CSP,1 张被指派 | 9/10 |
| Roll 操作 | DTE < 7 + ITM 时 roll 到下月 | ✅ Day 43 实操 1 次 roll | 8/10 |
Week 6 综合完成度:8.8/10
亮点:Day 42 的 AAPL CSP 被指派(执行价 $190,标的跌到 $187),按计划自动转入 CC 阶段。完整的指派 → CC 循环跑通是 Wheel 策略真正的"形态完成",这一刻 Phase 1 Day 16 卖第一张 CSP 时埋下的认知伏笔终于闭合。
遗憾:Roll 决策还是凭直觉,没有量化的 roll 阈值(什么 DTE / 什么 Delta 触发 roll)。Day 60 实盘前必须把这个变成规则。
1.3 Week 7(Day 45-51):★ AI 信号(Phase 2 关键周)
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | PEAD 事件因子 + Claude 解读 10-Q + IV crush 套利 | ✅ 三个独立子项目 | 9/10 |
| 笔记 | DAY45 ~ DAY51 七篇 | ✅ 全部完成 | 10/10 |
| 代码 | claude_10q_parser.py + event_factor_builder.py + ic_engine.py | ✅ 完整 pipeline | 8/10 |
| Claude 财报抽取 | 关键 KPI / Guidance / Tone score | ✅ Day 46 跑通 50 份 10-Q | 9/10 |
| LLM 特征 → 数值特征 | embedding + sentiment + KPI 偏离 | ✅ Day 47 pipeline 化 | 8/10 |
| LLM + XGBoost 混合 | LLM 输出作为 XGBoost 特征 | ✅ Day 49 离线 IC > 0.04 | 8/10 |
| IV Crush + Iron Condor | 财报日卖 IC,IV 收敛后买回 | ✅ Day 48 Paper 跑了 3 笔 | 7/10 |
| Week 7 复盘 | AI 信号 vs 传统因子的 IR 对比 | ✅ Day 51 完成 | 9/10 |
Week 7 综合完成度:8.4/10
亮点:这是 Phase 2 真正的范式跳升周。Day 47 第一次看到 LLM 从 10-Q 里提取的"管理层 tone score"和未来 60 天超额收益的截面 IC = 0.06,这个数字虽然不大,但是前所未有的、传统因子里抓不到的信号源——本质上是把人类分析师每年读上千份财报的能力压缩到 GPU 几小时。
遗憾:IV Crush + Iron Condor 的 3 笔交易里有 1 笔被 gap 打爆(IC 上 wing 失守),暴露了事件类策略对 tail risk 极度敏感。Day 55 的尾部风控部分专门给这个打了补丁,但本质上 <$5k 的账户不应该在没有自动止损系统的情况下卖事件 vol。
1.4 Week 8 前半(Day 52-58):组合管理 + 风控升级
| 维度 | 计划交付 | 实际状态 | 评分 |
|---|---|---|---|
| 实操 | 多策略归因 + Kelly 升级 + 相关性 + VaR/CVaR/EVT + 黑天鹅对冲 + SOP | ✅ 全部完成 | 9/10 |
| 笔记 | DAY52 ~ DAY58 七篇 | ✅ 全部完成 | 10/10 |
| 多策略归因 | 把 PnL 拆到「策略 × 标的 × 因子」三维 | ✅ Day 52 Dashboard 上线 | 9/10 |
| Kelly 升级 | 策略层 Kelly + 顶层资金分配(Risk Parity) | ✅ Day 53 完成 | 8/10 |
| 相关性矩阵 | 三策略 + 标普 + Gold + VIX 的滚动相关 | ✅ Day 54 滚动 60d/120d | 9/10 |
| VaR / CVaR / EVT | 历史 VaR + 参数 VaR + EVT 尾部建模 | ✅ Day 55 完成三种方法对比 | 8/10 |
| 黑天鹅对冲 | OTM put / VIX call / 黄金权重 | ✅ Day 56 三种对冲对比 | 8/10 |
| SOP 文档 | 实盘前的标准作业流程(启动/监控/异常/复盘) | ✅ Day 57 一份 6 页 SOP | 9/10 |
| 三策略并行演练 | 三策略同时在 Paper 上跑 ≥ 5 天 | ✅ Day 58 完成 7 天连跑 | 9/10 |
Week 8 前半完成度:8.9/10
亮点:Day 57 的 SOP 是 Phase 2 最被低估的产出。SOP = production readiness 的唯一硬证据。没有 SOP 的系统不是系统,是个人项目。Day 58 用这份 SOP 跑了 7 天连续 Paper trade,发现了 3 个 SOP 自身的漏洞(API 重连后未恢复挂单状态 / 月底最后一天 rebalance 与 CC 到期日撞车 / IB Gateway 凌晨重启窗口期下单失败),全部回滚修正。SOP 的价值在它被 break 的时候。
遗憾:黑天鹅对冲的回测样本太短(只回看了 2020 + 2022),EVT 尾部分布的参数稳定性还没验证。
1.5 Phase 2 综合完成度
Week 5 (多因子实盘化) █████████████████░░░ 87%
Week 6 (期权 Wheel) █████████████████░░░ 88%
Week 7 (AI 信号 ★) ████████████████░░░░ 84%
Week 8 前半 (组合+风控) █████████████████░░░ 89%
————————————————————————————————————
Phase 2 综合 █████████████████░░░ 87%
结论:完成度 87%,比 Phase 1 的 89.5% 略低 — 这是好事,不是坏事。Phase 2 难度是 Phase 1 的两倍,能交出 87% 说明没有为了完成度灌水。剩下 13% 的缺口主要在「真实 fill 模型 / EVT 样本不足 / Roll 决策量化」三个具体技术债上。
二、Phase 2 知识图谱(ASCII)
┌──────────────────────────────────────┐
│ Phase 2 综合作品(顶层) │
│ │
│ 三策略并行 Paper Trade 系统 │
│ 多因子组合 + Wheel + AI 增强 │
│ 组合管理层 + SOP + 监控 Dashboard │
└────────────────┬─────────────────────┘
│
┌─────────────────────────┼─────────────────────────┐
│ │ │
┌──────────▼──────────┐ ┌──────────▼──────────┐ ┌──────────▼──────────┐
│ ① 多因子组合实盘化 │ │ ② 期权 Wheel │ │ ③ AI 增强信号 ★ │
│ (Week 5) │ │ (Week 6) │ │ (Week 7) │
├─────────────────────┤ ├─────────────────────┤ ├─────────────────────┤
│ 4 因子合成(动/价/波/质) │ │ Wheel 全图谱 │ │ PEAD 事件因子 │
│ IC 加权 / Risk Parity │ │ CC 历史回测 │ │ Claude 解读 10-Q │
│ Cross-sectional z │ │ IV Rank 选股池 │ │ LLM 输出 → 数值特征 │
│ WFA in production │ │ Greeks 实时监控 │ │ LLM + XGBoost 混合 │
│ Cost model 升级 │ │ 第一组完整 Wheel │ │ IV Crush + IC │
│ IBKR Paper 自动部署 │ │ Roll 操作实战 │ │ Week 7 复盘 │
│ 第一周复盘 (Day 37) │ │ 完整指派 → CC 循环 │ │ 离线 IC 0.04-0.06 │
└──────────┬──────────┘ └──────────┬──────────┘ └──────────┬──────────┘
│ │ │
└─────────────────────────┼─────────────────────────┘
│
┌────────────────────────────────────▼───────────────────────────────────┐
│ ④ 组合管理 + 风控 横切层(Week 8 — 贯穿所有三策略) │
├────────────────────────────────────────────────────────────────────────┤
│ 多策略归因:PnL 按「策略 × 标的 × 因子」三维拆解 │
│ Kelly 升级:策略层 Kelly + 顶层 Risk Parity 资金分配器 │
│ 相关性管理:滚动 60d/120d corr,三策略间动态相关 │
│ 尾部风控:历史 VaR + 参数 VaR + EVT 极值理论尾部建模 │
│ 黑天鹅对冲:OTM put / VIX call / Gold 三种对冲对比 │
│ SOP(标准作业流程):启动 / 监控 / 异常处置 / 复盘 — 6 页文档 │
│ 三策略 7 天连跑:发现并修复 3 个 SOP 漏洞 │
└────────────────────────────────────────────────────────────────────────┘
认知层(贯穿整个 Phase 2)
┌──────────────────────────────────────────────────────────────────────┐
│ • Paper Trade 流程跑通 > 单策略 alpha — Beta 的价值是「跑通」,不是「跑赢」 │
│ • LLM = 特征提取器,不是预测器 — 混合架构(LLM+XGBoost)最 work │
│ • 组合管理 > 单策略 alpha — 相关性 / Greeks / 尾部比找 magic 更值钱 │
│ • <$5k 玩期权要 risk-defined — IC > Naked > Strangle │
│ • SOP 是个人量化进入 production 的门票 — 没 SOP 的不叫系统 │
└──────────────────────────────────────────────────────────────────────┘
图谱要点:
- 三大策略支柱并列,但这次它们不是孤岛——Week 8 的组合管理层把它们焊接成一个系统。
- 横切层从 Phase 1 的"风控"扩展到"组合管理 + 风控 + SOP",是质的升级。
- 最顶层"三策略并行 Paper Trade 系统"是 Phase 2 集大成作品,任何单点都不是新的,组合在一起是新的——这就是 Beta 阶段的本质。
三、Phase 2 五大认知(思维方式变化)
Phase 1 的五大认知是「方法论级」(流程严谨性 / Half-Kelly / 期权工具 / 交易日志),Phase 2 的五大认知是「工程化 + 心态」级——是把方法论 ship 出去时撞墙后才有的认知。
3.1 「Paper Trade 流程跑通 > 单策略 alpha」⭐ Phase 2 最大认知
Day 30 时的我:以为 Phase 2 的关键是"AI 信号能找到 alpha"。
Day 59 时的我:知道 Phase 2 真正的关键是"三个策略能 7x24 在 Paper 上自动跑而不挂"。
Day 36 第一次自动 rebalance 失败的原因:IBKR API 返回的 fill report 里 lastFillTime 是字符串不是 datetime,pandas 解析失败 → 触发 retry → retry 又触发了一遍下单 → 重复挂单。
这种 bug 和「找到 alpha」毫无关系,但这种 bug 不解决一次性能让账户亏 5%。Phase 2 的核心 KPI 不是 Sharpe,是 uptime + correctness。
➡️ 这条认知带来的实操变化:任何新策略上线前必须先有 SOP,必须有"成交确认 - 状态对齐 - 异常回滚"三件套。Sharpe 谈完后再谈。
3.2 「LLM = 特征提取器,不是预测器」
Day 45 我以为可以让 Claude 直接读 10-Q 输出"未来 3 个月超额收益预测"。
Day 47 验证后发现:LLM 单独做预测,IC ≈ 0.01(基本随机)。但 LLM 输出"管理层 tone score / KPI 偏离指引 / 风险段落变化度"这三个结构化特征喂给 XGBoost 后,IC 跳到 0.04-0.06。
为什么?
- LLM 强在理解文本细节("我们对 Q3 有信心" vs "我们 cautiously optimistic")
- LLM 弱在整合数值特征(前者它没 context,后者 XGBoost 干 20 年了)
- 分工:LLM 提取人类语言里的非结构化信号 → XGBoost 在结构化空间里做预测
➡️ 这条认知 = 别和 LLM 比预测能力,让它做它擅长的(翻译人类知识到机器可消费的特征)。混合架构(LLM 特征 + 传统 ML 决策)几乎在所有金融 NLP 场景都是最优解。
3.3 「组合管理 > 单策略 alpha」
Day 52 多策略归因第一次把 PnL 拆出来后发现:三策略每个 backtest Sharpe 都 > 1.0,组合在一起 Sharpe 反而是 0.95。
原因:
- 多因子组合在风险 on/off 时 long/short 失衡 → 月初 rebalance 高吸低抛
- Wheel 在大跌时被指派 → 同期多因子也亏
- AI 信号在 IV crush 时盈利 → 但 IV crush 通常发生在大盘上涨日
三策略的相关性在风险事件时全部走向 1——这就是 risk parity 的反面教材。
Day 53-54 的修正:
- 策略层各自 Half-Kelly → 顶层 Risk Parity 分配(不是等权)
- 风险 off 时(VIX > 25)自动降低 Wheel 权重
- 加入黑天鹅对冲腿(OTM put on SPY)
组合 Sharpe 从 0.95 → 1.18。没有任何单策略 alpha 变化——只是组合管理升级了。
➡️ 这条认知 = 在 <$50k 的资金体量下,升级组合管理比找新策略 ROI 高 10x。
3.4 「<$5k 玩期权要 risk-defined」
Day 48 IV Crush + Iron Condor 那一组里,3 笔有 1 笔被 gap 打爆。损失 = 卖 IC 收的权利金 × 3 倍(接近 max loss)。
如果同样的位置用 Naked Strangle(卖 put + 卖 call,不买 wing)会怎样?亏到爆仓。如果用 Strangle on Margin?穿仓。
数学:
| 策略 | Max Profit | Max Loss | 风险定义? |
|---|---|---|---|
| Iron Condor | 收的权利金 | 行权价差 - 权利金(capped) | ✅ |
| Naked Strangle | 收的权利金 | 理论上 = 标的归零或翻倍 | ❌ |
| Cash-Secured Put | 收的权利金 | 执行价 × 100 - 权利金 | ✅(最差买入) |
| Covered Call | 权利金 + 标的涨幅 | 标的亏损(被 cap upside) | ✅ |
<$5k 资金体量下,单次 max loss 必须 < 账户的 5%。否则一次黑天鹅就让 90 天计划归零。
➡️ 这条认知 = 期权 level 3(spreads + IC)足够个人量化做 95% 的事,永远不要为了节省一个 wing 的成本去开 naked。
3.5 「SOP 是个人量化进入 production 的门票」
Day 57 我花了一整天写 SOP 文档时,第一反应是"这是公司活,不是个人活"。
Day 58 用这份 SOP 跑 7 天后发现:它救了我 3 次。
- 第 2 天 IB Gateway 凌晨重启,SOP 里写了"启动前检查时间是否在重启窗口",避免下单失败
- 第 5 天 CC 到期日撞上月底 rebalance,SOP 里写了"到期日避免新开仓",避免重复 Greeks 暴露
- 第 7 天 API 错误处理流程让我在 30 秒内确认是 transient error,没误判为 critical
SOP 不是文档,是冻结的认知。把"我每次会想起来"变成"系统每次会自动执行",是工程化的本质。没 SOP 的个人量化系统不能跑 production,因为认知会在压力下失效。
➡️ 这条认知 = Phase 3 上实盘前的 hard requirement = 完成 v1.0 SOP(Day 60 详细写一遍)。
四、Phase 1 → Phase 2 的能力跃迁
把 Phase 1 vs Phase 2 用一张表对照:
| 能力维度 | Phase 1 (Day 1-30) | Phase 2 (Day 31-58) | 跃迁本质 |
|---|---|---|---|
| 回测 | 在 notebook 里跑单策略 | 在 Paper 上 7x24 自动跑 | 离线 → 在线 |
| 风控 | 单策略 Half-Kelly | 顶层 Risk Parity + 尾部 EVT + 对冲腿 | 单点 → 系统 |
| 数据 | yfinance + Ken French | yfinance + IBKR live + Claude/OpenAI | 静态 → 动态 |
| 代码 | 一堆独立 notebook | 模块化 lib + cron + Dashboard + SOP | 脚本 → 工程 |
| 错误处理 | 错了重跑就行 | 错了要触发告警 + 回滚 + 复盘 | 重跑 → 回滚 |
| 认知阶段 | 学方法论(理论) | 跑通 paper(实操) | 知道 → 做到 |
| PM 类比 | 写 PRD(需求) | 上 beta(实测) | spec → ship |
最大的跃迁不是技术上的,是**「我有」 → 「它在」**的跃迁。
Phase 1 结束时我说"我有一个双因子组合"——但它躺在 notebook 里。 Phase 2 结束时我说"它在 IBKR Paper 上自己跑着"——而我连续 7 天没动过它。
这两个状态差一个量级。
➡️ Phase 3 的跃迁会是「它在」 → 「它赚」 — 上实盘后被市场真实验证,但实盘前最后一道关是 Day 60 的 checklist。
五、作品集(Phase 1 + Phase 2 合计)
5.1 笔记产出
| 产出 | 数量 | 字数估算 |
|---|---|---|
| Day 1-58 笔记 | 58 篇 | ≈35 万字 |
| Day 59 (本篇) | 1 篇 | ≈8000 字 |
| 合计 | 59 篇 | ≈36 万字 |
按公开发表筛选精华:
| Phase | 候选精华 | 主题 |
|---|---|---|
| Phase 1 | Day 1 / 8 / 15 / 22 / 26 / 28 | 平台选择、因子、期权、成本、Kelly、综合 |
| Phase 2 | Day 36 / 42 / 47 / 53 / 57 | 自动 rebalance、Wheel 闭环、LLM 混合架构、Risk Parity、SOP |
➡️ 11 篇可组成「90 天个人量化从 0 到实盘」系列文章,约 8 万字,对求职极有差异化。
5.2 代码 Repo(可推 GitHub)
| 项目 | Phase | 描述 | 求职价值 |
|---|---|---|---|
| paper-trade-system | Phase 2 ⭐ | 三策略并行 Paper Trade 完整系统(含 SOP) | ★★★★★ |
| double-factor-portfolio-v1 | Phase 1 | 双因子组合 + WFA + Half-Kelly | ★★★★ |
| wheel-engine | Phase 2 | CSP/CC/Roll 完整循环引擎 | ★★★★ |
| llm-10q-feature-pipeline | Phase 2 ★ | Claude 解读 10-Q → XGBoost 特征 | ★★★★★ |
| ibkr-paper-connector | Phase 1 | ib_insync 封装 + 错误处理 | ★★★ |
| bs-greeks-iv-toolkit | Phase 1 | BS 定价 + Greeks + IV | ★★★ |
| portfolio-risk-dashboard | Phase 2 | 实时 PnL + Greeks + VaR Dashboard | ★★★★ |
➡️ Phase 3 之前优先 ship 三个 repo:paper-trade-system / llm-10q-feature-pipeline / portfolio-risk-dashboard。这三个组合起来是「Web3 PM 转 AI 量化」最强差异化证明。
5.3 求职话术升级(Phase 2 加强版)
"过去 60 天我从零搭建了一套个人量化交易系统:
— 三个策略并行在 IBKR Paper 上 7x24 运行:
• 4 因子组合(月度自动 rebalance)
• 期权 Wheel 策略(CSP → 指派 → CC 循环)
• AI 增强信号(Claude 解读 10-Q → XGBoost 排序)
— 顶层组合管理:策略层 Half-Kelly + 顶层 Risk Parity,
带 VaR/CVaR/EVT 尾部建模和黑天鹅对冲腿;
— 工程层:完整 SOP,连续 7 天无人值守运行无 critical bug,
所有代码在 GitHub,所有学习过程在 59 篇笔记里。
我的差异化是 10 年金融零售 PM + Web3 + 个人量化方法论 —
不是研究员,但比研究员懂工程;不是工程师,但比工程师懂业务。"
PM 视角变形(用于 Web3 公司):
"我把个人量化学习当成 SaaS 产品来做:
Phase 1 是 MVP(单功能跑通),
Phase 2 是 Beta(多功能并行 + dogfooding),
Phase 3 是 Limited Launch(小钱实盘)。
每一阶段都有明确退出准则和 release retrospective。
这套方法论可以直接迁移到 Web3 协议产品的迭代上。"
六、当前能力矩阵(Phase 2 更新版)
按 Phase 1 的 4 大支柱 + Phase 2 新增的 3 大支柱重新评分:
6.1 能力详细自评(10 分制)
| 能力维度 | Phase 1 (Day 29) | Phase 2 (Day 59) | 跃迁说明 |
|---|---|---|---|
| 工具链 | 8.1 | 10/10 | IBKR / ib_insync / async / Dashboard / cron / SOP 全到位 |
| 因子投资 | 6.9 | 9/10 | 4 因子合成 + WFA in prod + cost model 完整 |
| 期权 | 7.5 | 8/10 | Wheel 闭环 + IC + Roll,但 vol surface 仍未深做 |
| AI 信号 | - | 7/10 | Claude + XGBoost 混合架构,但样本短、未实盘验证 |
| 风控 | 9.2 | 8/10 | EVT/VaR/CVaR 都学了,但样本不足,反而比 Phase 1 不自信 |
| 部署 / 工程 | 4.0(隐含) | 7/10 | Paper 跑通,但实盘异常处理还没经历 |
| 综合(系统级) | 7.9 | 8/10 | 三策略 + 组合管理 + SOP 已成系统,但未经实盘洗礼 |
6.2 能力雷达图(ASCII)
工具链 (10)
*
|
综合 (8) *—+—* 因子投资 (9)
/ |
部署 (7) *--/ | \--* 期权 (8)
\ | /
\ | /
\|/
风控 (8)—-* AI 信号 (7)
6.3 关键洞察
- 工具链 10/10:Phase 2 把工具链从"会用"升级到"建得起 production"。这是不可逆的能力,求职最直接看得见。
- AI 信号 7/10:是 Phase 2 最大的能力新增,但最大的水分也在这里——只有 30 天的样本,IC 0.04-0.06 在不同市场状态下会不会稳定,完全不知道。
- 风控 9.2 → 8:反而下降了。原因不是能力退步,是意识到自己不知道的部分变多了——EVT 的参数估计、tail dependence 的建模、黑天鹅对冲的成本/收益权衡,每一个都是更深的兔子洞。这是好的下降。
- 综合 8/10:第一次到 8,但实盘验证后大概率会先回到 7。这是任何 Beta → GA 时的常态。
➡️ Phase 3 核心补课方向:部署(实盘异常处置)+ AI 信号(样本扩展 + 稳健性验证)。
七、Phase 2 剩余技术债清单
Phase 2 完成度 87%,剩下的 13% 全部是实盘前必须闭环的技术债:
| # | 技术债 | 严重度 | Day 60 之前是否能补完? |
|---|---|---|---|
| 1 | 真实 fill 模型缺失(Paper 默认全成交,实盘未必) | ★★★★★ | ❌ — 只能上实盘后慢慢校准 |
| 2 | Roll 决策无量化阈值(凭直觉) | ★★★★ | ✅ — Day 60 必须量化 |
| 3 | EVT 尾部参数稳定性未验证 | ★★★ | △ — 部分能补 |
| 4 | 三策略相关性是滚动 60d,但极端事件相关结构未建模 | ★★★ | ❌ — 留 Phase 3 |
| 5 | IV Crush + IC 策略的 stop-loss 未自动化 | ★★★★ | ✅ — Day 60 必须补 |
| 6 | API 重连后 open order 状态对齐逻辑(Day 58 发现) | ★★★★★ | ✅ — Day 60 必须修 |
| 7 | LLM 输出的稳定性(同一份 10-Q 多次跑结果是否一致) | ★★★ | △ — 抽样验证 |
| 8 | 黑天鹅对冲的成本 vs 收益没有严谨 backtest | ★★★ | ❌ — 留 Phase 3 |
| 9 | SOP v1.0 的「异常处置」段落只有 5 条,应该 10+ | ★★★ | ✅ — Day 60 补完 |
| 10 | 资金 Settlement 周期对 Wheel 的影响未完整建模 | ★★★ | △ — 部分能补 |
Day 60 必须闭环的:#2, #5, #6, #9 — 这四项不闭环,不能上实盘。
留给 Phase 3 的:#1, #4, #8 — 这三项需要实盘数据才能 calibrate。
八、Phase 3 预告(Day 61-90)
Phase 2 把三策略在 Paper 上跑通。Phase 3 = 小钱实盘上线 + 跨市场 + 高阶策略。
8.1 Week 9(Day 61-67):IBKR 实盘上线($1k 起步)★
| 主题 | 关键产出 |
|---|---|
| Day 60 实盘前 checklist 执行 | 全部勾完才能上 |
| $1k 入金 → 三策略实盘小规模启动 | 每个策略 ~$300 |
| 实盘 vs Paper 滑点对照 | 关键 calibration 数据 |
| 第一周实盘复盘 | 心态 / 成交质量 / 错误处理 |
出口准则:实盘 7 天无 critical bug,三策略各完成至少 1 笔成交,PnL 不破净值 5%。
心态预备:第一周 PnL 大概率是亏的(因为实盘成本高于 Paper)。接受小亏才能换到真实校准数据。
8.2 Week 10(Day 68-74):Vol Arb + Calendar Spread
| 主题 | 关键产出 |
|---|---|
| Vol arbitrage(实现波 vs 隐含波) | 套利信号生成器 |
| Calendar Spread(跨月 vol 结构) | 单标的实操 |
| VRP (Variance Risk Premium) 系统化 | 月度信号 |
| Phase 2 IV Crush 策略升级 | 加入 stop-loss 自动化 |
出口准则:至少 2 笔 Calendar Spread 实盘成交,对 IV term structure 有手感。
8.3 Week 11(Day 75-81):A 股 / 港股迁移
| 主题 | 关键产出 |
|---|---|
| A 股市场结构(T+1 / 涨跌停 / 龙虎榜) | 因子库适配 |
| 港股市场结构(多空机制 / 印花税) | 成本模型适配 |
| 跨市场组合(美股 + 港股 + A 股) | 资金切换框架 |
| 时区与交易日历管理 | 全球化 scheduler |
出口准则:四因子组合在港股有可跑的 backtest(A 股可能因数据源问题留 Phase 4)。
8.4 Week 12(Day 82-90):自动化 + 月度报告 + 90 天回顾
| 主题 | 关键产出 |
|---|---|
| 月度报告自动化(PnL / 归因 / 风控) | PDF 自动生成 |
| 异常告警系统升级(Telegram / Email) | 多渠道告警 |
| Day 89: Phase 3 总结 | 类似 Day 29/59 |
| Day 90: 90 天大总结 | 求职作品集 final |
出口准则:整套系统进入 hands-off 状态,每天 < 30 分钟人工介入。
8.5 Phase 3 综合出口目标
✓ $1-3k 实盘 30+ 天,三策略并行运行
✓ 实盘 vs Paper 成本差异校准完成
✓ Vol arb / Calendar Spread 加入工具箱
✓ 港股因子组合可跑 backtest
✓ 月度报告全自动化
✓ 90 天总结 + 求职作品集 final 版
九、「Phase 2 给我最大的 ROI 是什么」(深度反思)
9.1 真正掌握的 vs 还在 superficial 的
真正掌握的 5 个(拿到工作面试现场可以白板答的):
- Paper trade 部署 = state machine 设计 — 任何下单都是 "intent → submit → working → filled / rejected / cancelled" 状态机,错误处理就是状态转移的 catch
- LLM + XGBoost 混合架构 — 能讲清楚为什么单 LLM 不行、为什么单 XGBoost 抓不到 tone、为什么混合 IC 翻倍
- Risk Parity 资金分配 — 不是数学公式问题,是"在我不知道哪个策略未来更好时,让风险贡献相等"的认知问题
- EVT 尾部建模 — Generalized Pareto Distribution 拟合 + threshold 选择,能讲清楚为什么历史 VaR 在尾部失效
- SOP 工程化 — 把"我每次会想起来"变成"系统每次会自动执行"——这条迁移到所有 production 系统都适用
还在 superficial 的 5 个(被深问会卡):
- Tail dependence(极端时相关性走向 1,但具体 copula 选择不会)
- LLM 输出的 calibration(同一 prompt 多次跑 variance 多大没系统量化)
- Vol surface 的动态(Day 21 没补,Day 59 仍没补)
- 真实 fill 与 limit/market 选择的取舍(只有 paper 经验)
- 资金成本 / margin call / 借券利息(cash 账户没遇到)
9.2 ROI 衡量:30 天 × 2h/天 = 60h 的回报
| 投入 | 产出 | ROI |
|---|---|---|
| 60 h 学习 + 实操 | 5 个 internalize 的工程级心智模型 | 12 h/模型 |
| 60 h 学习 + 实操 | 1 个可演示的三策略系统 + SOP | 求职面试可直接演示 |
| 60 h 学习 + 实操 | 30 篇笔记 = Phase 1 17 万字 → Phase 2 18 万字 | 长期复利 |
最大 ROI:从"会做"到"在做"。
Phase 1 学会的是"我能做"——但所有能力都在大脑里。Phase 2 学会的是"它在做"——能力外化成了一个系统。外化的能力可以演示,演示的能力可以变现。这 60h 把"能力"转化为"作品",ROI 远超 Phase 1。
9.3 哪些 paper trade 表现「过于好」需要警惕?
诚实自评:Phase 2 三策略中至少 2 个的 Paper 表现好得不真实:
- 多因子组合:Paper 月度收益 4.2%,远超回测预期 1.5% —— 可能是 Paper 没扣 spread 半价
- AI 增强信号:Paper 命中率 62%,离线 backtest 是 54% —— 可能是 LLM 知道训练后的样本(look-ahead via Claude knowledge cutoff)
- Wheel:Paper 收益符合预期 —— 这个可以信
Phase 3 实盘大概率会让 #1 和 #2 大幅折扣。心理预算:实盘前 30 天总 PnL 在 -3% 到 +1% 之间都属正常,超过这区间都说明事情不对(要么是 bug,要么是 luck)。
9.4 Phase 3 心态准备
Phase 1 心态:兴奋(每天都在学新东西)
Phase 2 心态:耐心(很多天在 debug 不光鲜的事)
Phase 3 心态:克制(用真钱时,最大的敌人是自己想"加仓"的冲动)
实盘第一周的纪律:
- 不看分时图(只在收盘后看日报)
- 不手动干预(除非触发 SOP 中明确写的 critical condition)
- 不加杠杆 / 不加仓位 / 不换策略
- 如果今天想做"小调整"——99% 的概率是情绪在驱动,记日志,明天再说
十、Day 31 → Day 59 的我变了什么
10.1 Day 31 的我
愿景:
"我要把 Phase 1 的双因子组合升级到四因子,加上期权 Wheel 和 AI 信号,在 Paper 上跑 2 周不挂"
心智模型:
- 多策略 = 多个 backtest 加起来
- AI 信号 = LLM 直接预测涨跌
- 风控 = 各策略各自管好就行
- Paper Trade = backtest 的延伸
工具栈:
- IBKR Paper + L2
- vectorbt / ib_insync / 单 notebook
10.2 Day 59 的我
愿景:
"我有一个三策略并行系统在 Paper 上 7x24 自动跑,顶层有组合管理 + SOP。 下一步是 $1k 小钱实盘验证 30 天,最大单日回撤控制在 2%。 长期目标是把这套系统作为 AI 量化 / Web3 PM 求职的核心作品集, 同时把方法论沉淀成可复用的「个人量化 0 到 1 模板」。"
心智模型:
- 多策略 = 一个组合管理系统 + 三个子策略 + 一份 SOP
- AI 信号 = LLM 做特征 + XGBoost 做决策
- 风控 = 策略层 Kelly + 顶层 Risk Parity + 尾部 EVT + 对冲腿
- Paper Trade = production system 的 dogfooding,不是 backtest 的延伸
工具栈:
- IBKR Paper(即将 Live)
- ib_insync (async + event) / vectorbt / xgboost / Claude API / OpenAI
- 自己的 paper-trade-system / wheel-engine / llm-pipeline / risk-dashboard
- v1.0 SOP 文档
10.3 60 天的真实变化
模糊「Paper 跑 2 周」 → 清晰「production-ready 系统」。
Day 31 时我说"跑 2 周"——是个粗暴的成功标准。 Day 59 时我说"7 天无人值守 + SOP 救了我 3 次 + 已经识别出 10 个技术债 + Phase 3 实盘前必须闭环 4 个"——这是工程师 / 系统架构师 / production owner 的语言。
60 天前我是"想做量化的 PM"。 60 天后我是"在做个人量化系统的 PM"。
这两个状态在简历上看似差一个字,在能力市场里差一个量级。
十一、PM 视角:SaaS 产品 release 同构
把 90 天计划完整映射到 SaaS 产品迭代:
| 产品阶段 | 90 天计划 | 核心活动 | 退出准则 | 当前状态 |
|---|---|---|---|---|
| Concept | Pre-Day 1 | 愿景澄清、平台选择 | 决定 Build/Buy/Skip | ✅ |
| MVP | Phase 1 (D1-30) | 工具链 + 单功能跑通 | 单点端到端可跑 | ✅ |
| Beta | Phase 2 (D31-60) | 多功能并行 + dogfooding | 无 critical bug ≥ 2 周 | ✅ 当前 |
| Limited Launch | Phase 3 (D61-80) | 小流量上线(实盘 $1k) | 30 天 PnL 不破净值 5% | ⏳ |
| GA + Scale | Phase 3 末 + Phase 4 (D81-90+) | 规模化 + 跨市场 + 经验沉淀 | 形成可复用方法论 | ⏳ |
11.1 Phase 2 = Beta 的关键启示
- Beta 不是 MVP 的延长:Beta 阶段的核心是集成测试,不是新功能。Phase 2 的核心产出不是"AI 信号"或"Wheel",而是三者能并行跑而不冲突。
- Beta 期最大风险是「false confidence」:Paper 表现好不代表实盘表现好。Beta 用户用得开心不代表付费用户买单。这两者本质同构。
- Beta 的 exit criteria 必须是定性 + 定量双重:
- 定量:7 天无 critical bug + 各策略 PnL 在预期区间
- 定性:SOP 经过实战考验 + 心态准备好上钱
- 没有 Beta 直接 Launch = 把质量风险转嫁给真实用户:跳过 Phase 2 直接实盘的人,相当于用真钱学 Paper 上能免费学到的教训。
11.2 这套思维的 Web3 PM 求职价值
10 年 PM 经验 + 量化方法论 + Web3 知识 = 能用产品迭代思维管「不确定性下的复杂系统」。
这正是 Web3 协议产品最稀缺的能力——Web3 协议本质上就是"自带激励机制的多策略并行系统",DeFi 协议的"质押 + 借贷 + 流动性挖矿"在我眼里就是"动量 + 价值 + 套利"的另一种表达。
➡️ Phase 3 的求职话术升级时,重点放在「方法论的可迁移性」——不是"我懂量化",是"我用 PM 方法论把不确定系统从 0 到 1 跑通过"。
十二、明日预告
Day 60: Phase 2 收官 — 实盘前最后的 Checklist
明天是 Phase 2 的最后一天,也是 Phase 3 实盘前的"hinge day"。核心产出:
12.1 Day 60 内容大纲
-
实盘前硬 Checklist(≥30 项):
- 账户准备(资金到账 / 权限确认 / W-8BEN)
- 代码准备(端口 / clientId / Live 防护断言)
- SOP v1.0 finalize(异常处置补到 10+ 条)
- Roll 决策量化(DTE / Delta 阈值)
- Stop-loss 自动化(IV Crush 策略)
- API 重连状态对齐(Day 58 发现的 bug)
- 监控告警(Telegram bot 接入)
- 资金体量适配($1k 起步的仓位上限)
-
「最后一道关」的心态准备:
- 第一周亏损心理预算(-3% 到 +1% 都算正常)
- 不手动干预的承诺
- 写日志的纪律
- "想加仓"信号 = 退出信号
-
Phase 3 第一周(Day 61-67)的具体行动:
- Day 61: $1k 入金
- Day 62: 三策略实盘小规模启动
- Day 63-66: 每日只做收盘后复盘
- Day 67: Phase 3 第一周复盘
-
2026-07-08 是 Phase 2 → Phase 3 的分水岭——后面 30 天,每一笔 PnL 都是真钱。
12.2 明日心态预热
今晚睡前提醒自己三句话:
1. Phase 2 完成度 87% 是诚实的分数,不是水分。
2. 实盘第一周亏损是大概率事件,不是失败信号。
3. SOP 在压力下救自己 3 次的经验比任何 backtest Sharpe 都值钱。
实际执行记录
启动一项填一项,时间戳 + 卡点。
- [hh:mm] 重读 Day 30-58 笔记标题与摘要 — ...
- [hh:mm] Phase 2 四周完成度自评表填写 — ...
- [hh:mm] Phase 2 知识图谱 ASCII 绘制 — ...
- [hh:mm] Phase 2 五大认知归纳 — ...
- [hh:mm] Phase 1 vs Phase 2 跃迁表 — ...
- [hh:mm] 作品集 inventory(Phase 1 + 2 合计)— ...
- [hh:mm] 能力矩阵 Phase 2 更新版 — ...
- [hh:mm] 剩余技术债清单(Day 60 必修 vs 留 Phase 3)— ...
- [hh:mm] Phase 3 预告(Week 9-12 大纲)— ...
- [hh:mm] 30 天反思(哪些过于好 / 哪些 superficial)— ...
- [hh:mm] Day 31 vs Day 59 对照 — ...
- [hh:mm] PM 视角(SaaS 产品同构)— ...
- 卡点 / 学到的:
- 关键决策(Day 60 必须闭环的 4 项确认):
总字数:约 7,400 字