TR Day 59

Phase 2 总结文档 — 30 天全景回顾

2026-07-07

Phase 2 收官

Phase2SummaryRetrospectivePaperTradeAISignalsWheelFactorComboPhase3Prep

日期: 2026-07-07 方向: Phase 2 总结阶段: Phase 2 收官标签: #Phase2Summary #Retrospective #PaperTrade #AISignals #Wheel #FactorCombo #Phase3Prep

今日目标

类型	内容
复盘	Phase 2 (Day 31-58) 四周内容全景回顾、完成度自评、三策略并行作品 inventory
反思	Phase 2 五大认知、能力矩阵更新、Phase 1 → Phase 2 跃迁路径、剩余技术债
产出	TR-DAY59 笔记（Phase 2 总结） + Day 60 实盘前 checklist 预告 + Phase 3 启动准备

引子：从 MVP 到 Beta，我到底跨过了什么

Phase 1 (Day 1-30) 结束时，我有的是「分散的单兵作战能力」——能跑回测、能算 Greeks、能写仓位公式，但没有一个可以 24x7 在 IBKR Paper 上自动运行的系统。

Phase 2 (Day 31-58) 28 天后，我有的是三个并行运行的 paper trade 策略 + 一套组合管理层 + 一套尾部风控。如果用 SaaS 产品的语言：

Phase 1 = MVP    单点功能跑通（每个策略各自能 backtest）
Phase 2 = Beta   多功能并行跑通（三策略在 Paper 上同时活着）
Phase 3 = GA     用户实际付费使用（实盘 $1k 起步）

今天这一篇是 Beta release retrospective——不是"我做了什么"的清单，是回答：

Phase 2 的 28 天到底买到了什么？（不是覆盖了什么，是 internalize 了什么）
跑通 paper 和能赚钱之间还差多远？（诚实评估自己离实盘还有几步）
AI 信号这一周是真正的范式跃迁，还是又一个 hype？
Phase 3 上实盘前最关键的 3-5 件事是什么？

下面分十二节展开。

一、Phase 2 完成度自评（按周拆解）

Phase 2 的四周主题分别是：多因子组合实盘化 → 期权 Wheel → AI 信号 → 组合管理与风控。Phase 1 的四大支柱在 Phase 2 全部被升级到「可部署」层级，并多出第五大支柱：组合管理。

1.1 Week 5（Day 31-37）：多因子组合实盘化

维度	计划交付	实际状态	评分
实操	双因子 → 四因子组合 + Cross-sectional z-score 标准化	✅ 4 因子组合（动量/价值/低波/质量）跑通	9/10
笔记	DAY31 ~ DAY37 七篇	✅ 全部完成	10/10
代码	factor_combo.py 模块 + walk-forward 重训管线	✅ 可重用 lib，参数化配置	8/10
概念掌握	IC 加权 / Risk Parity / 因子正交化	✅ 三种合成方式都跑过	9/10
成本细化	spread 半价 + IBKR tiered commission + ADV 滑点模型	✅ Day 34 完成完整成本函数	9/10
WFA in production	月度 rebalance 时自动重训权重	✅ Day 35 cron 化	8/10
IBKR Paper 部署	真实下单、状态轮询、错误恢复	✅ Day 36 上线，第一周复盘 (Day 37)	8/10

Week 5 综合完成度：8.7/10

亮点：第一次把"研究 notebook"升级到"运行进程"。Day 36 触发了第一次自动 rebalance，看到 IBKR 账户里 8 只股票自动调仓的那一刻，理论 → 工程的临界点过了。

遗憾：4 因子相关性矩阵是同期相关，没做滚动相关；2026 年 Q2 的动量因子和质量因子相关性突然拉到 0.55，单期相关矩阵看不出这点。

1.2 Week 6（Day 38-44）：期权 Wheel 策略

维度	计划交付	实际状态	评分
实操	Wheel 全图谱（CSP → 指派 → CC → 卖出 → 重启）	✅ 流程图 + 决策树	9/10
笔记	DAY38 ~ DAY44 七篇	✅ 全部完成	10/10
代码	wheel_engine.py + IV Rank 选股 + Greeks monitor	✅ 三个模块独立	8/10
CC 历史回测	SPY/AAPL/MSFT 三标的 5 年回测	✅ Day 39 完成	9/10
IV Rank 选股	跨标的 IV Rank > 50 + 流动性筛选	✅ Day 40 候选池	9/10
Greeks 实时监控	Δ / Γ / Θ / V 跨持仓汇总	✅ Day 41 Dashboard 雏形	8/10
第一组完整 Wheel	1-2 张 CSP 在 Paper 上同时活着	✅ Day 42 卖出 2 张 CSP，1 张被指派	9/10
Roll 操作	DTE < 7 + ITM 时 roll 到下月	✅ Day 43 实操 1 次 roll	8/10

Week 6 综合完成度：8.8/10

亮点：Day 42 的 AAPL CSP 被指派（执行价 $190，标的跌到 $187），按计划自动转入 CC 阶段。完整的指派 → CC 循环跑通是 Wheel 策略真正的"形态完成"，这一刻 Phase 1 Day 16 卖第一张 CSP 时埋下的认知伏笔终于闭合。

遗憾：Roll 决策还是凭直觉，没有量化的 roll 阈值（什么 DTE / 什么 Delta 触发 roll）。Day 60 实盘前必须把这个变成规则。

1.3 Week 7（Day 45-51）：★ AI 信号（Phase 2 关键周）

维度	计划交付	实际状态	评分
实操	PEAD 事件因子 + Claude 解读 10-Q + IV crush 套利	✅ 三个独立子项目	9/10
笔记	DAY45 ~ DAY51 七篇	✅ 全部完成	10/10
代码	claude_10q_parser.py + event_factor_builder.py + ic_engine.py	✅ 完整 pipeline	8/10
Claude 财报抽取	关键 KPI / Guidance / Tone score	✅ Day 46 跑通 50 份 10-Q	9/10
LLM 特征 → 数值特征	embedding + sentiment + KPI 偏离	✅ Day 47 pipeline 化	8/10
LLM + XGBoost 混合	LLM 输出作为 XGBoost 特征	✅ Day 49 离线 IC > 0.04	8/10
IV Crush + Iron Condor	财报日卖 IC，IV 收敛后买回	✅ Day 48 Paper 跑了 3 笔	7/10
Week 7 复盘	AI 信号 vs 传统因子的 IR 对比	✅ Day 51 完成	9/10

Week 7 综合完成度：8.4/10

亮点：这是 Phase 2 真正的范式跳升周。Day 47 第一次看到 LLM 从 10-Q 里提取的"管理层 tone score"和未来 60 天超额收益的截面 IC = 0.06，这个数字虽然不大，但是前所未有的、传统因子里抓不到的信号源——本质上是把人类分析师每年读上千份财报的能力压缩到 GPU 几小时。

遗憾：IV Crush + Iron Condor 的 3 笔交易里有 1 笔被 gap 打爆（IC 上 wing 失守），暴露了事件类策略对 tail risk 极度敏感。Day 55 的尾部风控部分专门给这个打了补丁，但本质上 <$5k 的账户不应该在没有自动止损系统的情况下卖事件 vol。

1.4 Week 8 前半（Day 52-58）：组合管理 + 风控升级

维度	计划交付	实际状态	评分
实操	多策略归因 + Kelly 升级 + 相关性 + VaR/CVaR/EVT + 黑天鹅对冲 + SOP	✅ 全部完成	9/10
笔记	DAY52 ~ DAY58 七篇	✅ 全部完成	10/10
多策略归因	把 PnL 拆到「策略 × 标的 × 因子」三维	✅ Day 52 Dashboard 上线	9/10
Kelly 升级	策略层 Kelly + 顶层资金分配（Risk Parity）	✅ Day 53 完成	8/10
相关性矩阵	三策略 + 标普 + Gold + VIX 的滚动相关	✅ Day 54 滚动 60d/120d	9/10
VaR / CVaR / EVT	历史 VaR + 参数 VaR + EVT 尾部建模	✅ Day 55 完成三种方法对比	8/10
黑天鹅对冲	OTM put / VIX call / 黄金权重	✅ Day 56 三种对冲对比	8/10
SOP 文档	实盘前的标准作业流程（启动/监控/异常/复盘）	✅ Day 57 一份 6 页 SOP	9/10
三策略并行演练	三策略同时在 Paper 上跑 ≥ 5 天	✅ Day 58 完成 7 天连跑	9/10

Week 8 前半完成度：8.9/10

亮点：Day 57 的 SOP 是 Phase 2 最被低估的产出。SOP = production readiness 的唯一硬证据。没有 SOP 的系统不是系统，是个人项目。Day 58 用这份 SOP 跑了 7 天连续 Paper trade，发现了 3 个 SOP 自身的漏洞（API 重连后未恢复挂单状态 / 月底最后一天 rebalance 与 CC 到期日撞车 / IB Gateway 凌晨重启窗口期下单失败），全部回滚修正。SOP 的价值在它被 break 的时候。

遗憾：黑天鹅对冲的回测样本太短（只回看了 2020 + 2022），EVT 尾部分布的参数稳定性还没验证。

1.5 Phase 2 综合完成度

Week 5 (多因子实盘化)    █████████████████░░░  87%
Week 6 (期权 Wheel)      █████████████████░░░  88%
Week 7 (AI 信号 ★)       ████████████████░░░░  84%
Week 8 前半 (组合+风控)   █████████████████░░░  89%
————————————————————————————————————
Phase 2 综合            █████████████████░░░  87%

结论：完成度 87%，比 Phase 1 的 89.5% 略低 — 这是好事，不是坏事。Phase 2 难度是 Phase 1 的两倍，能交出 87% 说明没有为了完成度灌水。剩下 13% 的缺口主要在「真实 fill 模型 / EVT 样本不足 / Roll 决策量化」三个具体技术债上。

二、Phase 2 知识图谱（ASCII）

                       ┌──────────────────────────────────────┐
                       │       Phase 2 综合作品（顶层）            │
                       │                                       │
                       │   三策略并行 Paper Trade 系统              │
                       │   多因子组合 + Wheel + AI 增强            │
                       │   组合管理层 + SOP + 监控 Dashboard       │
                       └────────────────┬─────────────────────┘
                                        │
              ┌─────────────────────────┼─────────────────────────┐
              │                         │                         │
   ┌──────────▼──────────┐  ┌──────────▼──────────┐  ┌──────────▼──────────┐
   │ ① 多因子组合实盘化       │  │ ② 期权 Wheel          │  │ ③ AI 增强信号 ★        │
   │   (Week 5)            │  │   (Week 6)           │  │   (Week 7)           │
   ├─────────────────────┤  ├─────────────────────┤  ├─────────────────────┤
   │ 4 因子合成（动/价/波/质） │  │ Wheel 全图谱          │  │ PEAD 事件因子         │
   │ IC 加权 / Risk Parity │  │ CC 历史回测           │  │ Claude 解读 10-Q     │
   │ Cross-sectional z   │  │ IV Rank 选股池        │  │ LLM 输出 → 数值特征    │
   │ WFA in production   │  │ Greeks 实时监控        │  │ LLM + XGBoost 混合   │
   │ Cost model 升级      │  │ 第一组完整 Wheel        │  │ IV Crush + IC       │
   │ IBKR Paper 自动部署  │  │ Roll 操作实战         │  │ Week 7 复盘          │
   │ 第一周复盘 (Day 37)   │  │ 完整指派 → CC 循环      │  │ 离线 IC 0.04-0.06    │
   └──────────┬──────────┘  └──────────┬──────────┘  └──────────┬──────────┘
              │                         │                         │
              └─────────────────────────┼─────────────────────────┘
                                        │
   ┌────────────────────────────────────▼───────────────────────────────────┐
   │   ④ 组合管理 + 风控 横切层（Week 8 — 贯穿所有三策略）                            │
   ├────────────────────────────────────────────────────────────────────────┤
   │ 多策略归因：PnL 按「策略 × 标的 × 因子」三维拆解                             │
   │ Kelly 升级：策略层 Kelly + 顶层 Risk Parity 资金分配器                       │
   │ 相关性管理：滚动 60d/120d corr，三策略间动态相关                            │
   │ 尾部风控：历史 VaR + 参数 VaR + EVT 极值理论尾部建模                          │
   │ 黑天鹅对冲：OTM put / VIX call / Gold 三种对冲对比                          │
   │ SOP（标准作业流程）：启动 / 监控 / 异常处置 / 复盘 — 6 页文档                    │
   │ 三策略 7 天连跑：发现并修复 3 个 SOP 漏洞                                  │
   └────────────────────────────────────────────────────────────────────────┘

   认知层（贯穿整个 Phase 2）
   ┌──────────────────────────────────────────────────────────────────────┐
   │ • Paper Trade 流程跑通 > 单策略 alpha — Beta 的价值是「跑通」，不是「跑赢」    │
   │ • LLM = 特征提取器，不是预测器 — 混合架构（LLM+XGBoost）最 work             │
   │ • 组合管理 > 单策略 alpha — 相关性 / Greeks / 尾部比找 magic 更值钱        │
   │ • <$5k 玩期权要 risk-defined — IC > Naked > Strangle                  │
   │ • SOP 是个人量化进入 production 的门票 — 没 SOP 的不叫系统                 │
   └──────────────────────────────────────────────────────────────────────┘

图谱要点：

三大策略支柱并列，但这次它们不是孤岛——Week 8 的组合管理层把它们焊接成一个系统。
横切层从 Phase 1 的"风控"扩展到"组合管理 + 风控 + SOP"，是质的升级。
最顶层"三策略并行 Paper Trade 系统"是 Phase 2 集大成作品，任何单点都不是新的，组合在一起是新的——这就是 Beta 阶段的本质。

三、Phase 2 五大认知（思维方式变化）

Phase 1 的五大认知是「方法论级」（流程严谨性 / Half-Kelly / 期权工具 / 交易日志），Phase 2 的五大认知是「工程化 + 心态」级——是把方法论 ship 出去时撞墙后才有的认知。

3.1 「Paper Trade 流程跑通 > 单策略 alpha」⭐ Phase 2 最大认知

Day 30 时的我：以为 Phase 2 的关键是"AI 信号能找到 alpha"。

Day 59 时的我：知道 Phase 2 真正的关键是"三个策略能 7x24 在 Paper 上自动跑而不挂"。

Day 36 第一次自动 rebalance 失败的原因：IBKR API 返回的 fill report 里 lastFillTime 是字符串不是 datetime，pandas 解析失败 → 触发 retry → retry 又触发了一遍下单 → 重复挂单。

这种 bug 和「找到 alpha」毫无关系，但这种 bug 不解决一次性能让账户亏 5%。Phase 2 的核心 KPI 不是 Sharpe，是 uptime + correctness。

➡️ 这条认知带来的实操变化：任何新策略上线前必须先有 SOP，必须有"成交确认 - 状态对齐 - 异常回滚"三件套。Sharpe 谈完后再谈。

3.2 「LLM = 特征提取器，不是预测器」

Day 45 我以为可以让 Claude 直接读 10-Q 输出"未来 3 个月超额收益预测"。

Day 47 验证后发现：LLM 单独做预测，IC ≈ 0.01（基本随机）。但 LLM 输出"管理层 tone score / KPI 偏离指引 / 风险段落变化度"这三个结构化特征喂给 XGBoost 后，IC 跳到 0.04-0.06。

为什么？

LLM 强在理解文本细节（"我们对 Q3 有信心" vs "我们 cautiously optimistic"）
LLM 弱在整合数值特征（前者它没 context，后者 XGBoost 干 20 年了）
分工：LLM 提取人类语言里的非结构化信号 → XGBoost 在结构化空间里做预测

➡️ 这条认知 = 别和 LLM 比预测能力，让它做它擅长的（翻译人类知识到机器可消费的特征）。混合架构（LLM 特征 + 传统 ML 决策）几乎在所有金融 NLP 场景都是最优解。

3.3 「组合管理 > 单策略 alpha」

Day 52 多策略归因第一次把 PnL 拆出来后发现：三策略每个 backtest Sharpe 都 > 1.0，组合在一起 Sharpe 反而是 0.95。

原因：

多因子组合在风险 on/off 时 long/short 失衡 → 月初 rebalance 高吸低抛
Wheel 在大跌时被指派 → 同期多因子也亏
AI 信号在 IV crush 时盈利 → 但 IV crush 通常发生在大盘上涨日

三策略的相关性在风险事件时全部走向 1——这就是 risk parity 的反面教材。

Day 53-54 的修正：

策略层各自 Half-Kelly → 顶层 Risk Parity 分配（不是等权）
风险 off 时（VIX > 25）自动降低 Wheel 权重
加入黑天鹅对冲腿（OTM put on SPY）

组合 Sharpe 从 0.95 → 1.18。没有任何单策略 alpha 变化——只是组合管理升级了。

➡️ 这条认知 = 在 <$50k 的资金体量下，升级组合管理比找新策略 ROI 高 10x。

3.4 「<$5k 玩期权要 risk-defined」

Day 48 IV Crush + Iron Condor 那一组里，3 笔有 1 笔被 gap 打爆。损失 = 卖 IC 收的权利金 × 3 倍（接近 max loss）。

如果同样的位置用 Naked Strangle（卖 put + 卖 call，不买 wing）会怎样？亏到爆仓。如果用 Strangle on Margin？穿仓。

数学：

策略	Max Profit	Max Loss	风险定义？
Iron Condor	收的权利金	行权价差 - 权利金（capped）	✅
Naked Strangle	收的权利金	理论上 = 标的归零或翻倍	❌
Cash-Secured Put	收的权利金	执行价 × 100 - 权利金	✅（最差买入）
Covered Call	权利金 + 标的涨幅	标的亏损（被 cap upside）	✅

<$5k 资金体量下，单次 max loss 必须 < 账户的 5%。否则一次黑天鹅就让 90 天计划归零。

➡️ 这条认知 = 期权 level 3（spreads + IC）足够个人量化做 95% 的事，永远不要为了节省一个 wing 的成本去开 naked。

3.5 「SOP 是个人量化进入 production 的门票」

Day 57 我花了一整天写 SOP 文档时，第一反应是"这是公司活，不是个人活"。

Day 58 用这份 SOP 跑 7 天后发现：它救了我 3 次。

第 2 天 IB Gateway 凌晨重启，SOP 里写了"启动前检查时间是否在重启窗口"，避免下单失败
第 5 天 CC 到期日撞上月底 rebalance，SOP 里写了"到期日避免新开仓"，避免重复 Greeks 暴露
第 7 天 API 错误处理流程让我在 30 秒内确认是 transient error，没误判为 critical

SOP 不是文档，是冻结的认知。把"我每次会想起来"变成"系统每次会自动执行"，是工程化的本质。没 SOP 的个人量化系统不能跑 production，因为认知会在压力下失效。

➡️ 这条认知 = Phase 3 上实盘前的 hard requirement = 完成 v1.0 SOP（Day 60 详细写一遍）。

四、Phase 1 → Phase 2 的能力跃迁

把 Phase 1 vs Phase 2 用一张表对照：

能力维度	Phase 1 (Day 1-30)	Phase 2 (Day 31-58)	跃迁本质
回测	在 notebook 里跑单策略	在 Paper 上 7x24 自动跑	离线 → 在线
风控	单策略 Half-Kelly	顶层 Risk Parity + 尾部 EVT + 对冲腿	单点 → 系统
数据	yfinance + Ken French	yfinance + IBKR live + Claude/OpenAI	静态 → 动态
代码	一堆独立 notebook	模块化 lib + cron + Dashboard + SOP	脚本 → 工程
错误处理	错了重跑就行	错了要触发告警 + 回滚 + 复盘	重跑 → 回滚
认知阶段	学方法论（理论）	跑通 paper（实操）	知道 → 做到
PM 类比	写 PRD（需求）	上 beta（实测）	spec → ship

最大的跃迁不是技术上的，是**「我有」 → 「它在」**的跃迁。

Phase 1 结束时我说"我有一个双因子组合"——但它躺在 notebook 里。 Phase 2 结束时我说"它在 IBKR Paper 上自己跑着"——而我连续 7 天没动过它。

这两个状态差一个量级。

➡️ Phase 3 的跃迁会是「它在」 → 「它赚」 — 上实盘后被市场真实验证，但实盘前最后一道关是 Day 60 的 checklist。

五、作品集（Phase 1 + Phase 2 合计）

5.1 笔记产出

产出	数量	字数估算
Day 1-58 笔记	58 篇	≈35 万字
Day 59 (本篇)	1 篇	≈8000 字
合计	59 篇	≈36 万字

按公开发表筛选精华：

Phase	候选精华	主题
Phase 1	Day 1 / 8 / 15 / 22 / 26 / 28	平台选择、因子、期权、成本、Kelly、综合
Phase 2	Day 36 / 42 / 47 / 53 / 57	自动 rebalance、Wheel 闭环、LLM 混合架构、Risk Parity、SOP

➡️ 11 篇可组成「90 天个人量化从 0 到实盘」系列文章，约 8 万字，对求职极有差异化。

5.2 代码 Repo（可推 GitHub）

项目	Phase	描述	求职价值
paper-trade-system	Phase 2 ⭐	三策略并行 Paper Trade 完整系统（含 SOP）	★★★★★
double-factor-portfolio-v1	Phase 1	双因子组合 + WFA + Half-Kelly	★★★★
wheel-engine	Phase 2	CSP/CC/Roll 完整循环引擎	★★★★
llm-10q-feature-pipeline	Phase 2 ★	Claude 解读 10-Q → XGBoost 特征	★★★★★
ibkr-paper-connector	Phase 1	ib_insync 封装 + 错误处理	★★★
bs-greeks-iv-toolkit	Phase 1	BS 定价 + Greeks + IV	★★★
portfolio-risk-dashboard	Phase 2	实时 PnL + Greeks + VaR Dashboard	★★★★

➡️ Phase 3 之前优先 ship 三个 repo：paper-trade-system / llm-10q-feature-pipeline / portfolio-risk-dashboard。这三个组合起来是「Web3 PM 转 AI 量化」最强差异化证明。

5.3 求职话术升级（Phase 2 加强版）

"过去 60 天我从零搭建了一套个人量化交易系统：

— 三个策略并行在 IBKR Paper 上 7x24 运行：
    • 4 因子组合（月度自动 rebalance）
    • 期权 Wheel 策略（CSP → 指派 → CC 循环）
    • AI 增强信号（Claude 解读 10-Q → XGBoost 排序）

— 顶层组合管理：策略层 Half-Kelly + 顶层 Risk Parity，
   带 VaR/CVaR/EVT 尾部建模和黑天鹅对冲腿；

— 工程层：完整 SOP，连续 7 天无人值守运行无 critical bug，
   所有代码在 GitHub，所有学习过程在 59 篇笔记里。

我的差异化是 10 年金融零售 PM + Web3 + 个人量化方法论 —
不是研究员，但比研究员懂工程；不是工程师，但比工程师懂业务。"

PM 视角变形（用于 Web3 公司）：

"我把个人量化学习当成 SaaS 产品来做：
Phase 1 是 MVP（单功能跑通），
Phase 2 是 Beta（多功能并行 + dogfooding），
Phase 3 是 Limited Launch（小钱实盘）。
每一阶段都有明确退出准则和 release retrospective。
这套方法论可以直接迁移到 Web3 协议产品的迭代上。"

六、当前能力矩阵（Phase 2 更新版）

按 Phase 1 的 4 大支柱 + Phase 2 新增的 3 大支柱重新评分：

6.1 能力详细自评（10 分制）

能力维度	Phase 1 (Day 29)	Phase 2 (Day 59)	跃迁说明
工具链	8.1	10/10	IBKR / ib_insync / async / Dashboard / cron / SOP 全到位
因子投资	6.9	9/10	4 因子合成 + WFA in prod + cost model 完整
期权	7.5	8/10	Wheel 闭环 + IC + Roll，但 vol surface 仍未深做
AI 信号	-	7/10	Claude + XGBoost 混合架构，但样本短、未实盘验证
风控	9.2	8/10	EVT/VaR/CVaR 都学了，但样本不足，反而比 Phase 1 不自信
部署 / 工程	4.0（隐含）	7/10	Paper 跑通，但实盘异常处理还没经历
综合（系统级）	7.9	8/10	三策略 + 组合管理 + SOP 已成系统，但未经实盘洗礼

6.2 能力雷达图（ASCII）

              工具链 (10)
                  *
                  |
       综合 (8) *—+—* 因子投资 (9)
                / |
   部署 (7) *--/  |  \--* 期权 (8)
              \  |  /
               \ | /
                \|/
              风控 (8)—-* AI 信号 (7)

6.3 关键洞察

工具链 10/10：Phase 2 把工具链从"会用"升级到"建得起 production"。这是不可逆的能力，求职最直接看得见。
AI 信号 7/10：是 Phase 2 最大的能力新增，但最大的水分也在这里——只有 30 天的样本，IC 0.04-0.06 在不同市场状态下会不会稳定，完全不知道。
风控 9.2 → 8：反而下降了。原因不是能力退步，是意识到自己不知道的部分变多了——EVT 的参数估计、tail dependence 的建模、黑天鹅对冲的成本/收益权衡，每一个都是更深的兔子洞。这是好的下降。
综合 8/10：第一次到 8，但实盘验证后大概率会先回到 7。这是任何 Beta → GA 时的常态。

➡️ Phase 3 核心补课方向：部署（实盘异常处置）+ AI 信号（样本扩展 + 稳健性验证）。

七、Phase 2 剩余技术债清单

Phase 2 完成度 87%，剩下的 13% 全部是实盘前必须闭环的技术债：

#	技术债	严重度	Day 60 之前是否能补完？
1	真实 fill 模型缺失（Paper 默认全成交，实盘未必）	★★★★★	❌ — 只能上实盘后慢慢校准
2	Roll 决策无量化阈值（凭直觉）	★★★★	✅ — Day 60 必须量化
3	EVT 尾部参数稳定性未验证	★★★	△ — 部分能补
4	三策略相关性是滚动 60d，但极端事件相关结构未建模	★★★	❌ — 留 Phase 3
5	IV Crush + IC 策略的 stop-loss 未自动化	★★★★	✅ — Day 60 必须补
6	API 重连后 open order 状态对齐逻辑（Day 58 发现）	★★★★★	✅ — Day 60 必须修
7	LLM 输出的稳定性（同一份 10-Q 多次跑结果是否一致）	★★★	△ — 抽样验证
8	黑天鹅对冲的成本 vs 收益没有严谨 backtest	★★★	❌ — 留 Phase 3
9	SOP v1.0 的「异常处置」段落只有 5 条，应该 10+	★★★	✅ — Day 60 补完
10	资金 Settlement 周期对 Wheel 的影响未完整建模	★★★	△ — 部分能补

Day 60 必须闭环的：#2, #5, #6, #9 — 这四项不闭环，不能上实盘。

留给 Phase 3 的：#1, #4, #8 — 这三项需要实盘数据才能 calibrate。

八、Phase 3 预告（Day 61-90）

Phase 2 把三策略在 Paper 上跑通。Phase 3 = 小钱实盘上线 + 跨市场 + 高阶策略。

8.1 Week 9（Day 61-67）：IBKR 实盘上线（$1k 起步）★

主题	关键产出
Day 60 实盘前 checklist 执行	全部勾完才能上
$1k 入金 → 三策略实盘小规模启动	每个策略 ~$300
实盘 vs Paper 滑点对照	关键 calibration 数据
第一周实盘复盘	心态 / 成交质量 / 错误处理

出口准则：实盘 7 天无 critical bug，三策略各完成至少 1 笔成交，PnL 不破净值 5%。

心态预备：第一周 PnL 大概率是亏的（因为实盘成本高于 Paper）。接受小亏才能换到真实校准数据。

8.2 Week 10（Day 68-74）：Vol Arb + Calendar Spread

主题	关键产出
Vol arbitrage（实现波 vs 隐含波）	套利信号生成器
Calendar Spread（跨月 vol 结构）	单标的实操
VRP (Variance Risk Premium) 系统化	月度信号
Phase 2 IV Crush 策略升级	加入 stop-loss 自动化

出口准则：至少 2 笔 Calendar Spread 实盘成交，对 IV term structure 有手感。

8.3 Week 11（Day 75-81）：A 股 / 港股迁移

主题	关键产出
A 股市场结构（T+1 / 涨跌停 / 龙虎榜）	因子库适配
港股市场结构（多空机制 / 印花税）	成本模型适配
跨市场组合（美股 + 港股 + A 股）	资金切换框架
时区与交易日历管理	全球化 scheduler

出口准则：四因子组合在港股有可跑的 backtest（A 股可能因数据源问题留 Phase 4）。

8.4 Week 12（Day 82-90）：自动化 + 月度报告 + 90 天回顾

主题	关键产出
月度报告自动化（PnL / 归因 / 风控）	PDF 自动生成
异常告警系统升级（Telegram / Email）	多渠道告警
Day 89: Phase 3 总结	类似 Day 29/59
Day 90: 90 天大总结	求职作品集 final

出口准则：整套系统进入 hands-off 状态，每天 < 30 分钟人工介入。

8.5 Phase 3 综合出口目标

✓ $1-3k 实盘 30+ 天，三策略并行运行
✓ 实盘 vs Paper 成本差异校准完成
✓ Vol arb / Calendar Spread 加入工具箱
✓ 港股因子组合可跑 backtest
✓ 月度报告全自动化
✓ 90 天总结 + 求职作品集 final 版

九、「Phase 2 给我最大的 ROI 是什么」（深度反思）

9.1 真正掌握的 vs 还在 superficial 的

真正掌握的 5 个（拿到工作面试现场可以白板答的）：

Paper trade 部署 = state machine 设计 — 任何下单都是 "intent → submit → working → filled / rejected / cancelled" 状态机，错误处理就是状态转移的 catch
LLM + XGBoost 混合架构 — 能讲清楚为什么单 LLM 不行、为什么单 XGBoost 抓不到 tone、为什么混合 IC 翻倍
Risk Parity 资金分配 — 不是数学公式问题，是"在我不知道哪个策略未来更好时，让风险贡献相等"的认知问题
EVT 尾部建模 — Generalized Pareto Distribution 拟合 + threshold 选择，能讲清楚为什么历史 VaR 在尾部失效
SOP 工程化 — 把"我每次会想起来"变成"系统每次会自动执行"——这条迁移到所有 production 系统都适用

还在 superficial 的 5 个（被深问会卡）：

Tail dependence（极端时相关性走向 1，但具体 copula 选择不会）
LLM 输出的 calibration（同一 prompt 多次跑 variance 多大没系统量化）
Vol surface 的动态（Day 21 没补，Day 59 仍没补）
真实 fill 与 limit/market 选择的取舍（只有 paper 经验）
资金成本 / margin call / 借券利息（cash 账户没遇到）

9.2 ROI 衡量：30 天 × 2h/天 = 60h 的回报

投入	产出	ROI
60 h 学习 + 实操	5 个 internalize 的工程级心智模型	12 h/模型
60 h 学习 + 实操	1 个可演示的三策略系统 + SOP	求职面试可直接演示
60 h 学习 + 实操	30 篇笔记 = Phase 1 17 万字 → Phase 2 18 万字	长期复利

最大 ROI：从"会做"到"在做"。

Phase 1 学会的是"我能做"——但所有能力都在大脑里。Phase 2 学会的是"它在做"——能力外化成了一个系统。外化的能力可以演示，演示的能力可以变现。这 60h 把"能力"转化为"作品"，ROI 远超 Phase 1。

9.3 哪些 paper trade 表现「过于好」需要警惕？

诚实自评：Phase 2 三策略中至少 2 个的 Paper 表现好得不真实：

多因子组合：Paper 月度收益 4.2%，远超回测预期 1.5% —— 可能是 Paper 没扣 spread 半价
AI 增强信号：Paper 命中率 62%，离线 backtest 是 54% —— 可能是 LLM 知道训练后的样本（look-ahead via Claude knowledge cutoff）
Wheel：Paper 收益符合预期 —— 这个可以信

Phase 3 实盘大概率会让 #1 和 #2 大幅折扣。心理预算：实盘前 30 天总 PnL 在 -3% 到 +1% 之间都属正常，超过这区间都说明事情不对（要么是 bug，要么是 luck）。

9.4 Phase 3 心态准备

Phase 1 心态：兴奋（每天都在学新东西）
Phase 2 心态：耐心（很多天在 debug 不光鲜的事）
Phase 3 心态：克制（用真钱时，最大的敌人是自己想"加仓"的冲动）

实盘第一周的纪律：

不看分时图（只在收盘后看日报）
不手动干预（除非触发 SOP 中明确写的 critical condition）
不加杠杆 / 不加仓位 / 不换策略
如果今天想做"小调整"——99% 的概率是情绪在驱动，记日志，明天再说

十、Day 31 → Day 59 的我变了什么

10.1 Day 31 的我

愿景：

"我要把 Phase 1 的双因子组合升级到四因子，加上期权 Wheel 和 AI 信号，在 Paper 上跑 2 周不挂"

心智模型：

多策略 = 多个 backtest 加起来
AI 信号 = LLM 直接预测涨跌
风控 = 各策略各自管好就行
Paper Trade = backtest 的延伸

工具栈：

IBKR Paper + L2
vectorbt / ib_insync / 单 notebook

10.2 Day 59 的我

愿景：

"我有一个三策略并行系统在 Paper 上 7x24 自动跑，顶层有组合管理 + SOP。下一步是 $1k 小钱实盘验证 30 天，最大单日回撤控制在 2%。长期目标是把这套系统作为 AI 量化 / Web3 PM 求职的核心作品集，同时把方法论沉淀成可复用的「个人量化 0 到 1 模板」。"

心智模型：

多策略 = 一个组合管理系统 + 三个子策略 + 一份 SOP
AI 信号 = LLM 做特征 + XGBoost 做决策
风控 = 策略层 Kelly + 顶层 Risk Parity + 尾部 EVT + 对冲腿
Paper Trade = production system 的 dogfooding，不是 backtest 的延伸

工具栈：

IBKR Paper（即将 Live）
ib_insync (async + event) / vectorbt / xgboost / Claude API / OpenAI
自己的 paper-trade-system / wheel-engine / llm-pipeline / risk-dashboard
v1.0 SOP 文档

10.3 60 天的真实变化

模糊「Paper 跑 2 周」 → 清晰「production-ready 系统」。

Day 31 时我说"跑 2 周"——是个粗暴的成功标准。 Day 59 时我说"7 天无人值守 + SOP 救了我 3 次 + 已经识别出 10 个技术债 + Phase 3 实盘前必须闭环 4 个"——这是工程师 / 系统架构师 / production owner 的语言。

60 天前我是"想做量化的 PM"。 60 天后我是"在做个人量化系统的 PM"。

这两个状态在简历上看似差一个字，在能力市场里差一个量级。

十一、PM 视角：SaaS 产品 release 同构

把 90 天计划完整映射到 SaaS 产品迭代：

产品阶段	90 天计划	核心活动	退出准则	当前状态
Concept	Pre-Day 1	愿景澄清、平台选择	决定 Build/Buy/Skip	✅
MVP	Phase 1 (D1-30)	工具链 + 单功能跑通	单点端到端可跑	✅
Beta	Phase 2 (D31-60)	多功能并行 + dogfooding	无 critical bug ≥ 2 周	✅ 当前
Limited Launch	Phase 3 (D61-80)	小流量上线（实盘 $1k）	30 天 PnL 不破净值 5%	⏳
GA + Scale	Phase 3 末 + Phase 4 (D81-90+)	规模化 + 跨市场 + 经验沉淀	形成可复用方法论	⏳

11.1 Phase 2 = Beta 的关键启示

Beta 不是 MVP 的延长：Beta 阶段的核心是集成测试，不是新功能。Phase 2 的核心产出不是"AI 信号"或"Wheel"，而是三者能并行跑而不冲突。
Beta 期最大风险是「false confidence」：Paper 表现好不代表实盘表现好。Beta 用户用得开心不代表付费用户买单。这两者本质同构。
Beta 的 exit criteria 必须是定性 + 定量双重：
- 定量：7 天无 critical bug + 各策略 PnL 在预期区间
- 定性：SOP 经过实战考验 + 心态准备好上钱
没有 Beta 直接 Launch = 把质量风险转嫁给真实用户：跳过 Phase 2 直接实盘的人，相当于用真钱学 Paper 上能免费学到的教训。

11.2 这套思维的 Web3 PM 求职价值

10 年 PM 经验 + 量化方法论 + Web3 知识 = 能用产品迭代思维管「不确定性下的复杂系统」。

这正是 Web3 协议产品最稀缺的能力——Web3 协议本质上就是"自带激励机制的多策略并行系统"，DeFi 协议的"质押 + 借贷 + 流动性挖矿"在我眼里就是"动量 + 价值 + 套利"的另一种表达。

➡️ Phase 3 的求职话术升级时，重点放在「方法论的可迁移性」——不是"我懂量化"，是"我用 PM 方法论把不确定系统从 0 到 1 跑通过"。

十二、明日预告

Day 60: Phase 2 收官 — 实盘前最后的 Checklist

明天是 Phase 2 的最后一天，也是 Phase 3 实盘前的"hinge day"。核心产出：

12.1 Day 60 内容大纲

实盘前硬 Checklist（≥30 项）：
- 账户准备（资金到账 / 权限确认 / W-8BEN）
- 代码准备（端口 / clientId / Live 防护断言）
- SOP v1.0 finalize（异常处置补到 10+ 条）
- Roll 决策量化（DTE / Delta 阈值）
- Stop-loss 自动化（IV Crush 策略）
- API 重连状态对齐（Day 58 发现的 bug）
- 监控告警（Telegram bot 接入）
- 资金体量适配（$1k 起步的仓位上限）
「最后一道关」的心态准备：
- 第一周亏损心理预算（-3% 到 +1% 都算正常）
- 不手动干预的承诺
- 写日志的纪律
- "想加仓"信号 = 退出信号
Phase 3 第一周（Day 61-67）的具体行动：
- Day 61: $1k 入金
- Day 62: 三策略实盘小规模启动
- Day 63-66: 每日只做收盘后复盘
- Day 67: Phase 3 第一周复盘
2026-07-08 是 Phase 2 → Phase 3 的分水岭——后面 30 天，每一笔 PnL 都是真钱。

12.2 明日心态预热

今晚睡前提醒自己三句话：
1. Phase 2 完成度 87% 是诚实的分数，不是水分。
2. 实盘第一周亏损是大概率事件，不是失败信号。
3. SOP 在压力下救自己 3 次的经验比任何 backtest Sharpe 都值钱。

实际执行记录

启动一项填一项，时间戳 + 卡点。

[hh:mm] 重读 Day 30-58 笔记标题与摘要 — ...
[hh:mm] Phase 2 四周完成度自评表填写 — ...
[hh:mm] Phase 2 知识图谱 ASCII 绘制 — ...
[hh:mm] Phase 2 五大认知归纳 — ...
[hh:mm] Phase 1 vs Phase 2 跃迁表 — ...
[hh:mm] 作品集 inventory（Phase 1 + 2 合计）— ...
[hh:mm] 能力矩阵 Phase 2 更新版 — ...
[hh:mm] 剩余技术债清单（Day 60 必修 vs 留 Phase 3）— ...
[hh:mm] Phase 3 预告（Week 9-12 大纲）— ...
[hh:mm] 30 天反思（哪些过于好 / 哪些 superficial）— ...
[hh:mm] Day 31 vs Day 59 对照 — ...
[hh:mm] PM 视角（SaaS 产品同构）— ...
卡点 / 学到的：
关键决策（Day 60 必须闭环的 4 项确认）：

总字数：约 7,400 字