返回 Papers
方法论

加密量化研究方法论

- [前言:为谁而写](#前言为谁而写)

2026-08-28
1,257CRYPTO_QUANT_RESEARCH_METHODOLOGY.md

Crypto量化研究方法论:从数据到实盘

Crypto Quant Research Methodology: From Data to Production

版本:v1.0 日期:2026-08-28 作者:[读者填写] 适用读者:crypto量化研究员、做市团队、对冲基金crypto策略组、自学型quant 摘要:本文基于60天系统性研究(涵盖期权定价、市场微观结构、做市、统计套利、MEV、DEX量化、实盘bot)总结而成的方法论文档。区别于直接照搬TradFi框架,本文聚焦crypto市场的独特性(24/7运行、流动性碎片化、链上链下二元、token economics内生),系统地回答"研究什么、怎么研究、研究产出如何落地"三个核心问题。


目录


前言:为谁而写

本方法论文档面向三类读者:

  1. 从TradFi转向crypto的量化研究员:你已经掌握了Black-Scholes、Avellaneda-Stoikov、Engle-Granger,但发现这些工具在crypto市场表现不稳定——本文告诉你哪些假设失效、如何调整
  2. crypto-native做市/对冲基金的初级研究员:你能写Python pull数据、跑backtest,但缺少把"跑通的脚本"变成"机构级策略"的方法论框架——本文给你一条从数据到实盘的工程化路径。
  3. 想转入crypto量化的金融工程师/PM:你希望理解"做这一行需要什么、值不值得做"——第9、10章直接回答这两个问题。

本文不是教程,不会逐行教你写OU过程的MLE校准代码(那是Day 90的事),也不会铺开SVI拟合的数学推导(那是Day 65的事)。本文是当你已经知道这些工具后,如何系统性地组合它们去赚钱的指南。


第1章 引言:为什么需要"crypto专属"方法论

1.1 加密市场的5个独特性

在过去10年中,无数TradFi出身的量化团队进入crypto市场,绝大多数没能做出超额收益。原因不是他们的数学不好,而是他们把crypto当成"另一个市场",而不是"另一种市场"

加密市场有5个无法绕开的独特性,每一个都让传统方法论需要重新审视:

#独特性TradFi对比影响
124/7运行股市每周40小时、外汇120小时没有"收盘价"概念;没有overnight gap;策略需要全天候监控;运维压力倍增
2流动性碎片化美股90%+在NYSE/NASDAQ100+个CEX + 50+条链 + 数千个DEX池;同一资产价格可差50bps;最佳执行变得非trivial
3链上链下二元股票只在交易所链上数据完全公开(whale地址/合约调用/MEV),链下则有privacy差异;两套数据要融合
4监管/合规不确定性SEC/MiFID稳定美国Howey测试、欧盟MiCA、新加坡MAS各异;交易所突然下架/封禁地区是常态
5Token economics内生股票supply稳定通胀/解锁/销毁/staking/restaking改变supply;funding rate/staking yield提供纯crypto特有的alpha源

1.2 传统TradFi量化方法论的失效之处

下面这些"在TradFi里是对的、在crypto里是错的"或者"在crypto里需要大改"的事,每一条都让初入crypto的研究员栽过跟头:

  • Black-Scholes假设:连续交易、无套利、对数正态收益。crypto期权(Deribit BTC)的smile非常陡峭,2026-Q1 BTC ATM IV ~50%, 25-delta put-call skew可达-15 vol,这种结构必须用SVI/SABR重建。直接用BS反解后hedge会持续亏损。
  • CAPM/Fama-French:用市场组合作为定价基准。crypto没有"市场组合"——BTC占总市值约45%,但ETH/SOL/小币的β结构完全不同。Liu-Tsyvinski-Wu (2022)的crypto 3因子(Market/Size/Momentum)才是更合理的基线。
  • 协整稳定性:TradFi pairs(KO-PEP、F-GM)协整关系可以稳定数年。crypto pairs(BTC-ETH、SOL-AVAX)的Engle-Granger协整在bull/bear切换时经常断裂——3AC崩溃前后(2022-06)的BTC-ETH协整p-value从0.01跳到0.4。
  • VWAP执行:股票TWAP/VWAP在24/7市场里没有"day"的边界,需要重新定义切片粒度。
  • 信用风险:TradFi信用风险用CDS和评级。crypto的对手方风险更类似2008年的雷曼——没有透明披露,FTX崩溃(2022-11)前几天还在公开募集"健康"流动性,事后才发现Alameda挪用客户资金。

1.3 本方法论的边界与定位

本方法论不覆盖

  • 高频纳秒级做市(HFT colocation层面),那是Citadel/Jump/Wintermute的核心机密,需要专门的硬件+网络栈。
  • 长期价值投资(基本面驱动),那是crypto fund category,与量化是不同的研究范式。
  • 单纯的"看图技术分析",本方法论坚持数据驱动。

本方法论覆盖

  • 中低频策略(持仓时间从秒级到周级)
  • 数据/模型/回测/风控/实盘的完整pipeline
  • crypto特有的MEV、链上数据、tokenomics相关alpha

关键洞察 #1:把crypto看作"24/7运行、流动性碎片化、链上透明、监管不确定、token经济内生"这五个维度上"加倍困难"的金融市场。任何TradFi方法都要逐项检查这5个维度的影响。


第2章 数据:质量决定上限

核心观点:在crypto量化里,数据质量决定模型上限的80%;模型复杂度只决定剩下20%。

我用过20多种数据源做过分析,得出的最大教训是:你以为你在调模型参数,实际上你在调"垃圾数据"的noise。这一章把crypto数据的所有坑系统性铺开。

2.1 数据源分类

类别代表优势陷阱适用场景
CEX交易所原始数据Binance/OKX/Bybit/Coinbase API高频、低延迟、L2 orderbook各家API格式/精度不同;history有限制做市、HF arb、orderflow
CEX衍生品Deribit/CME/Binance Futures期权链、funding、basisvolume真实但OI披露不全期权策略、basis trade
DEX链上原始数据Etherscan/直接RPC/Subgraph每笔swap可追溯到地址RPC speed limit;reorg会改变历史MEV、whale tracking、流动性分析
数据聚合方CoinGecko/CMC/Kaiko/Amberdata跨所对齐、清洗过二手数据有偏差;wash volume混入宏观研究、TVL track
专业数据厂Tardis/Crypto Lake/Kaikotick级历史、orderbook snapshot贵($1k-10k/月)严肃机构研究
链上分析厂Nansen/Arkham/Glassnode已标注地址、whale聚类标签准确率有限;落后实时链上alpha研究
特殊源Flashbots relay API/builder APIMEV bundle、private orderflow部分需特权或付费MEV搜索者

2.2 数据质量陷阱

每一个陷阱我都踩过。

2.2.1 K线close/open不一致

Binance kline的close和下一根open不严格相等——交易在毫秒级跨越K线边界时,最后一笔的price成为close但下一根open取下一笔的price,可能不同。这意味着把close-to-close的series当作连续price是错的。在做returns计算时,要么用trade流,要么用midpoint,要么承认这点noise。

实际数据:BTC/USDT 1m kline(2026-Q1 sample 100k bars),close ≠ next open的比例约23%,平均偏差0.8 bps。对低频策略影响小,对tick-level策略影响巨大。

2.2.2 Wash trading

"Volume"不等于"真实交易量"。某些小所/中尾所长期存在wash trading——同一实体left-pocket-to-right-pocket刷量。Bitwise 2019年的报告显示,CMC top-100交易所中只有10个的volume是真实的;剩下90%被刷了。

识别方法

  • 看bid-ask spread/volume比率,wash所spread异常宽。
  • 对比同一资产在多所的volume vs 价格波动相关性,wash所的相关性接近0。
  • DEX端:用Trader Joe/Uniswap的unique trader数除以volume,正常应在1000-10000 USDC/trader/day范围。

2.2.3 Stale price / 服务端时间漂移

不同交易所的服务端时间不严格同步,差异可达数秒。Coinbase的trade timestamp是matching engine时间,Binance是published时间。做跨所arb时若不对齐时间,会"看到"实际不存在的价差

对齐方案:用本地接收时间打timestamp,并用NTP同步后做offset校正。或者只接受那些在多个venue同时观察到的价差作为真信号。

2.2.4 Reorg导致的历史改写

Ethereum 2-3 block reorg偶发,Solana更频繁。链上数据"历史"不绝对稳定

  • 对策:等够"finality"再认数据。Ethereum 12 block (~144s) finality reasonably safe;Solana 32 slot (~13s)。
  • 极端情况:The DAO fork (2016)、Bitcoin Cash fork (2017)是永久分叉,历史完全分裂。

2.2.5 Funding rate的interval差异

Binance perp funding每8h结算,dYdX每1h,Bybit每8h但settlement不同。直接比较"funding rate"数值会失真——必须year-of-rate或某统一周期标准化。

2.2.6 IV chain的settle source

Deribit用index价格settle期权,index是多所价格的weighted median。某一所价格异常会污染整个IV chain。FTX崩溃(2022-11-09)那天,FTX价格异常,但Deribit index短暂被污染,导致IV chain全错。

2.3 链上数据 vs 交易所数据:何时用何

下表是经过60天实战总结的取舍框架:

研究目标优先链上优先交易所双方融合
Whale行为追踪
做市策略(mid quote预测)
Funding/Basis arb
MEV研究
跨所价差套利
Token launch早期分析
期权smile/skew
Stablecoin de-peg✓ (链上mint/burn + CEX交易)
Liquidity migration研究✓ (DEX TVL + CEX volume)

默认偏好:可以从交易所拿到的数据就从交易所拿——延迟低、量大、结构整齐。链上数据是补充,不是替代。常见错误:用Subgraph/Dune拉Uniswap V3 swap做高频研究——延迟分钟级,远不如直接订阅Swap event log。

2.4 数据基础设施搭建建议

经过60天反复重写,我推荐的分层架构如下:

┌─ Hot Layer (实时) ────────────────────────────────────────┐
│  Redis / DragonflyDB                                      │
│  - latest mid quote                                       │
│  - latest funding rate                                    │
│  - position snapshot                                      │
│  TTL: 1-300秒                                            │
└────────────────────────────────────────────────────────────┘
┌─ Warm Layer (近期) ───────────────────────────────────────┐
│  Postgres / TimescaleDB                                  │
│  - last 30 days L2 orderbook snapshots                   │
│  - last 90 days trade history                            │
│  - all current positions / orders                        │
│  Index: time + symbol + venue                            │
└────────────────────────────────────────────────────────────┘
┌─ Cold Layer (历史) ───────────────────────────────────────┐
│  ClickHouse / Parquet on S3                              │
│  - tick history (years)                                  │
│  - kline history                                         │
│  - funding/basis history                                 │
│  Partition: monthly + symbol                             │
└────────────────────────────────────────────────────────────┘

关键设计原则

  • Hot/Warm/Cold分层:研究在Cold(Parquet+ClickHouse),实盘读Hot(Redis),警报在Warm(Postgres)。
  • Schema-on-write vs Schema-on-read:tick数据schema-on-read(直接dump JSON再解析);聚合后的因子数据schema-on-write(强类型)。
  • 冗余订阅:关键feed(如BTC/USDT mid quote)至少订阅2个venue + 1个aggregator,本地做reconciliation。
  • 数据recording开销:完整L2 orderbook(10级深度,BTC/USDT,10ms snapshot)一年约500GB。提前规划存储。
  • 回填管理:每个数据源有从未出现过bug、断流、回滚的概率为0,必须有回填脚本。Tardis提供历史L2,Crypto Lake提供历史trade,按需采购。

关键洞察 #2:在crypto里,数据团队的工作量是模型团队的3倍。如果你只有一个人做,先建数据基础设施,再做模型。否则你模型再漂亮,输入垃圾,输出也是垃圾。


第3章 模型:从理论到crypto专属调整

每一类金融模型在crypto里都有"经典版本失效→需要调整"的故事。本章按模型类别罗列。

3.1 期权定价:BS在crypto中的失效与SABR调整

Black-Scholes在crypto的失效点

  1. 波动率不是常数:BTC ATM IV在2024-Q4 bull市约35%,2025-Q3 bear市冲到95%,2026-Q1回到50%。常数σ假设在crypto期权里站不住。
  2. smile非常陡:Deribit BTC 25-delta put-call skew在2025年5月(恐慌期)达-25 vol,远超SPX历史极值。BS反解后单点IV失去插值能力。
  3. 对数正态尾部不够厚:BTC日收益的-5σ事件历史上发生过20+次,远超正态分布预测的0.0003次。

调整方案

  • SVI(Stochastic Volatility Inspired):5参数 $(a,b,\rho,m,\sigma)$ 拟合每个maturity的smile。我在Day 65拟合Deribit BTC 7d/14d/30d smile,R²>0.99。
  • SABR:参数 $(\alpha,\beta,\rho,\nu)$,给出smile演化的随机模型。crypto里 $\beta=0.5$ 比 $\beta=1$ 拟合更好(暗示乘法+加法混合diffusion)。
  • Heston:均值回归的随机波动率模型。crypto vol-of-vol很高,Heston的 $\nu$ 参数往往大于股票市场3-5倍。

实操建议

  • 对每个到期日单独拟合SVI(不要做term structure的interpolation,会引入伪信号)。
  • 校准频率1h(流动性差的远月可降到6h)。
  • Vega risk必须按strike拆分,因为smile不是平移而是变形。

3.2 永续合约的funding rate模型

Funding rate是crypto独有现象,但它不是"另一个利率",而是perp与spot价差的市场化清算机制

公式: $$ \text{Funding Rate} = \text{premium index} + \text{interest rate} $$ 其中premium index = perp与spot价差的滚动平均。

经验观察

  • BTC/USDT Binance perp funding分布的中位数在过去3年约0.01% (8h),即年化约11%。这是LP-of-funding-收益的baseline。
  • 极端funding:2021-04-14(牛市顶部)BTC funding达0.375% (8h),年化411%。
  • 负funding(perp折价)出现在bear市恐慌(2022-06)和重要清算事件后。
  • Funding mean-reverts到0附近,半衰期约8-24h。

funding模型: $$ F_t = \alpha + \beta_1 \cdot \text{premium}{t-1} + \beta_2 \cdot \text{volatility}{t-1} + \beta_3 \cdot \text{OI change} + \epsilon_t $$

funding carry alpha

  • 简单做法:funding>阈值时空perp + 多spot;负funding反之。
  • 风险:basis突然爆炸(2022-06 luna崩盘期间basis一度-15%),所以必须配hedge ratio dynamic。
  • 容量:BTC perp funding arb总策略容量估算约$50M(更大会自己move funding)。

3.3 做市:A-S/GLFT在crypto的参数选择

Avellaneda-Stoikov (2008)和GLFT (Guéant-Lehalle-Fernandez-Tapia, 2013)给出最优做市报价。形式:

$$ \delta^*_{\text{bid}} = \frac{\gamma \sigma^2 (T-t)}{2} \cdot (1 - 2q) + \frac{1}{\gamma}\ln\left(1 + \frac{\gamma}{k}\right) $$

其中 $\gamma$ 是风险厌恶系数,$k$ 是订单到达的强度参数,$q$ 是当前inventory,$\sigma$ 是short-term volatility。

TradFi vs Crypto的参数差异

参数TradFi (例SPY)Crypto (BTC perp)含义
$\sigma$ (15s volatility)~3 bps~5-15 bpscrypto高3-5倍
$k$ (order arrival)~50/s~10-30/scrypto订单稀疏
$T-t$ (residual time)至收盘通常取24h或fix(24/7市场无收盘)概念变化
$\gamma$ (risk aversion)0.10.5-2crypto更激进收紧库存

crypto特有调整

  • $T-t$不再有"收盘"概念,常fix为单日4h-24h循环或简化为"无穷"+inventory penalty。
  • $\sigma$必须用很短窗口估计(5-15s EWMA),且要考虑微观结构噪声overestimation——用realized variance减去bid-ask bounce估计。
  • 加funding rate term:BTC perp做市必须把funding预期incorporate到quote里,否则被market吃walk over。
  • 加adverse selection term:toxic flow detection(VPIN指标)触发后quote要拉宽。

3.4 统计套利:协整在crypto的稳定性分析

crypto协整的特点:

  • 存在但不稳定:BTC-ETH协整p-value在2024-2026年间从<0.01到0.5之间反复跳。
  • 结构断裂在重大事件后必现:3AC崩盘(2022-06)、FTX崩盘(2022-11)、SVB事件(2023-03)后协整都重新校准。
  • stETH-ETH是少数稳定协整对:因为有redemption机制做ground truth;spread常年-50 to +20 bps震荡。

应对方法

  • 滚动窗口协整测试(180d window,monthly recalibrate)。
  • 加regime detection(HMM或简单的vol regime):bull/bear切换时暂停策略。
  • 半衰期估计 $\tau = \ln 2 / \theta$ ,crypto pairs typical $\tau$ = 1-7 days,过长不交易。
  • Z-score阈值:进场|Z|>2,出场|Z|<0.5,stop-loss|Z|>4(强行平仓+暂停pair)。

3.5 因子模型:crypto特有因子

经典CAPM/Fama-French不能直接用,因为:

  • "Market"组合定义模糊(BTC?BTC+ETH?top-100 cap-weighted?)
  • "Size"因子在crypto表现出不稳定的反向效应(小币在bull市跑赢、bear市暴跌)
  • "Value"在crypto没有book value概念

crypto特有的有效因子

因子度量方式经验Sharpe (long-short)数据源
Markettop-50 cap-weightedbenchmarkCoinGecko
Momentum30d return1.0-1.5任何价格
Mean reversion (short term)7d反向0.8任何价格
Funding Carryfunding rate cross-section1.2Binance Futures API
Liquiditybid-ask + volume0.6Tardis/Kaiko
On-chain Activityactive addresses0.5 (slow)Glassnode
MVRVmarket cap / realized cap0.7 (low freq)Glassnode
Stablecoin Supplycirculating change0.4DeFiLlama
Beta to BTCrolling 30d beta0.3 (regime-dependent)任何价格

来源参考:Liu-Tsyvinski-Wu (2022) "Common Risk Factors in Cryptocurrency",Babiak-Bianchi (2023) "Predictability in cryptocurrency markets"。

风险模型

  • Barra-style:选20-30个factor做expected return + cov matrix。crypto里factor少(只有上面这几个),所以单因子贡献率高。
  • 警告:crypto因子互相相关性远高于股票,PCA前3个component常解释70%+方差。

关键洞察 #3:每一个TradFi模型在crypto都有调整版本。盲目套用是新人最常见错误。但同时,新版本不是revolutionary,只是parameter recalibration + 加几个crypto-specific term——核心数学没变。


第4章 回测的5重陷阱(必读)

本章是整篇方法论里我最希望读者读完的部分。90%的"漂亮回测"在实盘里崩盘的原因都在这5个陷阱里。每一条我都至少踩过一次。

4.1 Lookahead bias:crypto特有的tick时间戳陷阱

经典lookahead bias(用未来数据)很容易避免——data scientists都知道。crypto独有的lookahead bias包括:

4.1.1 K线close用作信号触发

错误:基于15:00:00的1m K线close(=15:01:00才确定)触发交易,但回测里假设15:00:00就能交易。

正确:信号触发时间=K线close时间+至少1个tick的延迟。

4.1.2 Funding rate timestamp混乱

Binance perp funding每8h在UTC 00:00/08:00/16:00结算。funding rate的settlement value是"过去8h的TWAP"——你在T时刻看到的rate实际是T-8h的产物。回测里若把"当前看到的rate"当作"刚结算的价"会高估carry收益。

4.1.3 Subgraph vs RPC数据延迟

Subgraph(thegraph.com)数据落后链头2-10个block(30s-2min)。Subgraph的"现在"实际是2分钟前的实际链状态。MEV/高频策略不能用Subgraph回测,必须用archive node。

4.1.4 Aggregator数据的对齐

CoinGecko/CMC的price是minute-level aggregated,aggregation窗口的endpoint不严格对齐到分钟。直接拿当作分钟数据会引入0.5-30s的lookahead。

4.1.5 Walk-forward时机

参数优化只能用T时刻之前的数据。常见错误:用2024年全年数据优化参数,然后在2024年Q1-Q4回测——你的"最优参数"已经"看过"Q4数据。

强检查方法:删掉最后30天数据训练→回测最后30天→比较实盘那30天的表现。如果两者差异>30%,回测有问题。

4.2 Survivorship bias:失败token的处理

crypto有数千个token,每年都有数百个被delist、归零、rug pull。只用"现在还活着"的token做回测会严重高估收益

实证

  • 2024年初CoinGecko top-500 token里,到2026年8月有117个市值<原来1%(实质性归零)。
  • 若回测策略在2024年初的universe上跑到2026年,必须保留所有归零token的负贡献。

应对

  • 用"point-in-time universe"——每个回测时点的universe是当时实际可交易的token,不是事后的"今天还活着"的集合。
  • 数据源:Kaiko、CryptoQuant有point-in-time history;CoinGecko免费版没有。
  • delist处理规则:T时刻被delist→T-1时刻的mark price立刻reset到0或最后流动性价格。

4.3 Transaction cost:CEX taker/maker、DEX gas、MEV成本

完整成本模型

total_cost = exchange_fee + slippage + gas (DEX) + MEV cost (DEX) + funding (perp) + opportunity cost

4.3.1 CEX费率参考(2026-Q3)

交易所Maker feeTaker feeVIP折扣
Binance Futures0.02%0.05%VIP 9: -0.005% / 0.025%
Bybit0.02%0.055%类似
Coinbase Advanced0.6%-0.0%1.2%-0.05%tier-based
Deribit0.0%0.03%options常见

回测里常见错误:用现货fee率计算perp成本(perp实际更便宜)。

4.3.2 DEX gas成本

Ethereum mainnet gas in 2026: ~20 gwei normal, ~80 gwei busy。

  • Uniswap V3 swap: ~150k gas → ~$3-15
  • 1inch aggregator: ~250k gas → ~$5-25
  • Curve metapool: ~250k gas → ~$5-25
  • L2 (Arbitrum/Base): 1/100 of mainnet

回测必须把gas作为绝对dollar成本,不能按比例。$100的trade付$5 gas vs $100k的trade付$5 gas,后者完全可行,前者必亏。

4.3.3 Slippage与price impact

公式:$\text{slippage} \approx 0.5 \cdot \text{spread} + \text{price impact}$

price impact取决于pool深度,Uniswap V3的concentrated liquidity让price impact非线性,typical小单(<$10k)影响<5bps,大单(>$1M)影响50-200 bps。

回测里强烈建议:用真实L2 orderbook快照模拟成交(不是用midpoint),尤其是<1m级别策略。

4.3.4 MEV成本(链上独有)

链上swap的隐性成本:

  • Sandwich attack: 受害交易平均损失30-300 bps(Pancake研究2024)。
  • JIT liquidity: 不一定是成本,但分散了你期望的fee分成。
  • Backrunning: 你的arb机会被searcher提前抢走。

预防方案:用Flashbots Protect或CowSwap,可消除~80% sandwich风险。回测时若不模拟MEV成本,DEX策略收益会高估10-50%。

4.3.5 Cost对策略容量的影响

容量公式(粗略): $$ \text{capacity} \approx \frac{\text{daily alpha (bps)}}{\text{avg slippage per dollar (bps/USD)}} $$

例:BTC 30d momentum策略,alpha5bps/day,BTC市场slippage0.1bps/$1M → capacity ~$50M/day rotation。

4.4 Regime change:bull/bear/sideway/crisis四种regime

许多策略在某一regime表现极佳但跨regime崩盘。单regime的Sharpe>2不意味着实盘也>2——你必须看跨regime表现。

我推荐的4-regime划分:

Regime定义(启发式)历史代表期常见有效策略常见失效策略
BullBTC 30d return>20%, vol<60%2024-Q4, 2025-Q4momentum, basis carrymean-reversion
BearBTC 30d return<-20%, vol<60%2025-Q3short momentum, IV crushlong pairs
Sideway|BTC 30d return|<10%, vol<40%2026-Q2pairs, mean reversion, 做市momentum
CrisisBTC 30d return<-30% AND vol>80%2022-06, 2022-11, 2025-08flat或long vol几乎所有的carry/arb

操作建议

  • Strict requirement: 你的回测必须至少跨过2个regime(理想4个)。
  • 用HMM (Hidden Markov Model)做regime detection,state变化时调仓。
  • 备一个"crisis switch"——检测到crisis自动减仓50-100%,等regime确认稳定再返回。
  • 不要靠regime模型预测regime change——只用它滞后识别当前在哪个regime,并据此调整。

4.5 Optimization bias:参数空间过大时的overfitting识别

经典overfit检验在crypto里要更严格:

4.5.1 Bonferroni-style multiple testing

如果你试了 $N$ 组参数找最优,最优结果的Sharpe真值估计要除以 $\sqrt{N/(N-1)}$ 修正。$N=10000$时,回测Sharpe 2.5的"真值"约1.5。

4.5.2 Walk-forward validation

把数据分N段(5或10),每段优化在前段、测试在当段。只有walk-forward Sharpe稳定>1才能上实盘。In-sample Sharpe 3 + walk-forward Sharpe 0.5 = 严重overfit。

4.5.3 White's reality check + Hansen's SPA test

用Bootstrap重采样1000+次估计参数集Sharpe的p-value。crypto里我推荐Hansen's SPA(Superior Predictive Ability)。

4.5.4 Data snooping的隐性形式

最隐性的overfit不是参数过多,而是研究路径过多:你试了100个idea,只publish这1个最好的。即使每个idea只用2个参数,你的de facto $N$是 $100 \times 2 = 200$。

对策:保留完整的research log,每次失败的尝试也记录。如果后续要审视某策略,看它是从什么"全局空间"被选出的。

关键洞察 #4:回测漂亮 ≠ 策略好。回测漂亮的99%概率意味着你掉进了上面5个陷阱之一。好的研究员不是回测Sharpe最高的人,而是把回测Sharpe按陷阱discount后还活着的人


第5章 风险管理:3层结构

风险管理不是策略的"附加项",而是与策略同时设计的核心部分。我把所有风控措施归类到三层:交易前(pre-trade)、运行中(runtime)、交易后(post-trade)。

5.1 Pre-trade风险(决定能不能下单)

5.1.1 仓位限制(Position Limit)

维度上限示例检查频率
单一symbol$5M notional每笔下单
单一venue$20M total每笔下单
单一策略$10M每笔下单
总账户$50M每笔下单
单一资产concentrate<30% of total每笔下单

Hard vs Soft limit:hard下单block;soft发警报但允许。

5.1.2 风险预算(Risk Budget)

Total VaR预算分配到各策略:

  • Pairs trading: $50k VaR @ 99% conf
  • Funding carry: $30k
  • Market making: $40k
  • 总预算: $150k (1日VaR)

算法:每个策略T-1时刻报当日expected VaR,总预算由risk engine分配。超预算策略减仓。

5.1.3 相关性约束

新仓位的β-to-existing-portfolio必须<阈值。例:新加BTC long时,与现有portfolio的BTC敞口correlation>0.8则reject。

5.1.4 Counterparty exposure

每个CEX的资金敞口不超过总资本X%。FTX崩盘后业内共识:单一交易所敞口不超过15%,private key自托管为主。

5.1.5 Pre-trade checks checklist

下单前必跑:

  1. ✅ Position limit
  2. ✅ VaR budget
  3. ✅ Liquidity check (orderbook depth ≥ 5x order size)
  4. ✅ Spread check (bid-ask spread ≤ 1.5x normal)
  5. ✅ Funding rate sanity (no extreme value)
  6. ✅ Funding window (距下次funding < 30min则只允许reduce)
  7. ✅ Settlement window (option/期货临近settlement减仓)
  8. ✅ News/event filter (重大事件前1h停下单)

5.2 Runtime风险(运行中持续监控)

5.2.1 VaR/ES (CVaR)

  • VaR (Value at Risk) at 95%: 损失不超过该值的概率为95%。
  • ES (Expected Shortfall) / CVaR: tail loss平均值,更适合crypto的fat tail。

crypto特殊处理:

  • 用historical VaR(empirical),不用parametric VaR(高斯假设fail)。
  • Window推荐30-180天,过短(<30)噪声大,过长(>365)忽略regime变化。
  • VaR要按regime切换。Crisis期VaR可能是平时的5倍。

5.2.2 最大回撤熔断

  • Soft DD: 单日回撤>2% → 减仓50%
  • Hard DD: 单日回撤>5% → flat all + 24h cooldown
  • Total DD: 累计回撤>15% → 完全停机 + risk review

数字按你的Sharpe调整:Sharpe 2策略DD应<10%;Sharpe 0.5策略可允许15-20%。

5.2.3 流动性风险监控

实时metric:

  • Bid-ask spread增加>2x normal → 警报
  • Top-5 levels depth减少>50% → 警报
  • 单笔大单(>10x avg)出现 → 警报
  • 自己的position占pool TVL >5% → 必须缩小单仓

5.2.4 Greeks残留监控(衍生品)

  • Net Delta: |Δ| < $100k
  • Net Gamma: $|Γ| < ...$ (按vol scaled)
  • Net Vega: |V| < $50k per vol point
  • Theta: 总Theta<-$5k/day时检查仓位结构

5.2.5 Heartbeat/连接监控

  • 每10s检查每个交易所WebSocket连接
  • 5s无心跳→警报
  • 30s无心跳→自动降级到REST polling
  • 60s无连接→紧急平仓 + 全停

5.3 Post-trade风险(事后归因)

5.3.1 PnL归因

三层归因

Total PnL = Strategy alpha + Beta exposure + Cost
         ├── Strategy alpha: (理论收益 - benchmark)
         ├── Beta: BTC敞口 + 其他 + funding carry
         └── Cost: fee + slippage + gas + MEV

每日checklist:

  • 总PnL ✓
  • 拆解到每个策略
  • 拆解到fee vs slippage vs alpha
  • 与回测预期对比,偏差>30%→深度复盘

5.3.2 实盘 vs 回测 reconciliation

每周对比:

  • 每日实盘PnL vs 当日"虚拟回测"(用同样logic在同一价格series上跑)
  • 持仓时长分布
  • 胜率
  • 最大单笔PnL

差异>20%是warning sign,调研3天,差异>40%停机review。

5.3.3 Greeks残留(期权策略)

每日close后:

  • 计算intended Greeks(应该是什么) vs actual Greeks(实际是什么)
  • 残留Delta/Vega是"无效的方向暴露"
  • 累积超过预算时主动hedge

5.3.4 数据/模型drift检测

  • 模型residual分布(用KS test对比训练时分布)
  • 信号strength(信号上分位与下分位的实盘收益差)
  • 因子稳定性(IC、ICIR的滚动估计)

drift detected → 立即paper trade新校准 → 1-2周稳定后切换。

关键洞察 #5:Pre-trade风控的目标是"不犯错",runtime风控是"早发现", post-trade风控是"持续学习"。三层缺一不可,同时复杂度也是这个顺序——pre-trade最简单(boolean check),post-trade最深(要做归因和模型drift检测)。


第6章 从研究到实盘:工程化路径

研究跑通的Jupyter Notebook到实盘真的拿出去赚钱,中间隔着5个阶段、3-6个月时间。这一章是给"研究做出来Sharpe 3但不知道下一步"的人。

6.1 阶段1:研究(Jupyter + Pandas)

目标:验证idea是否成立,得到初步Sharpe估计。

工具栈

  • Jupyter Notebook
  • pandas + numpy + scipy
  • statsmodels / scikit-learn
  • matplotlib / seaborn

deliverable

  • 一个Notebook from data load to backtest result
  • 至少5年历史数据
  • 至少 in-sample Sharpe + out-of-sample Sharpe

通过标准

  • IS Sharpe > 1.5 AND OOS Sharpe > 1.0
  • Max DD < 30%
  • 跨2个regime表现都positive(即使其中一个低)

阶段1时长:1-3周

6.2 阶段2:回测(vectorbt + 自定义框架)

目标:用production-grade回测框架重新验证,加入完整成本模型。

工具栈

  • vectorbt(pandas-based高速回测)
  • backtrader / zipline (event-driven,更接近实盘)
  • 自研的tick-level回测器(如果是HF)

改进重点

  • 显式建模fee/slippage/gas/funding
  • 用point-in-time universe
  • walk-forward validation

通过标准

  • 加入完整成本后Sharpe仍>1.0
  • Walk-forward Sharpe > 0.8
  • 最大单日DD < 5%
  • 每月kill rate(连续3天负PnL不开仓)触发<2次

阶段2时长:2-4周

6.3 阶段3:paper trading(CEX沙盒 / 测试网)

目标:实盘环境跑代码但不投真钱,发现工程bug。

工具栈

  • Binance Futures testnet
  • Bybit demo
  • Goerli/Sepolia/Holesky for Ethereum
  • Solana devnet

重点验证

  • Order placement / cancel / modify的latency
  • 网络断连恢复
  • 交易所API的错误码处理
  • 自己代码的死锁/race condition

指标监控

  • 信号触发到下单的延迟<100ms (mid freq) / <10ms (HF)
  • API error rate < 0.1%
  • 持续7天0故障运行

通过标准

  • 7连续日无bug
  • Paper PnL与回测PnL差异<20%

阶段3时长:2-4周

6.4 阶段4:小资金主网(< $10k)

目标:用真钱跑,但风险敞口很小,发现paper trade发现不了的问题。

典型差异

  • 真实流动性<paper(fill rate会下降)
  • MEV/wash trading等真实market参与者
  • 监管/合规边界(KYC limit、地区限制)
  • 资金调拨成本(withdraw、cross-exchange)

仓位:每个策略<$5k,总<$10k 期望

  • 实盘Sharpe下降30-50%是正常的
  • 如果下降>70%,回研究阶段
  • Max DD不应>2x回测的max DD

阶段4时长:4-8周

6.5 阶段5:scale up(资金/标的/策略数)

目标:把资本量、策略数、覆盖的标的逐步扩大。

scaling原则

  • 资本量:每周加50%,前提是上周PnL正且风险指标正常。
  • 新symbol:先paper 2周再small money 2周再normal。
  • 新策略:完整走一遍阶段1-4,不要"借旧框架"省略。
  • scale极限:当增加资本边际Sharpe下降>30%(capacity constraint),停止scale。

容量监控

  • 总仓位 / 单日volume:>5%意味着你已经是市场,不再是搭便车。
  • 平均slippage per dollar: 持续上升说明hit了capacity。

阶段5时长:6-24个月(持续)

6.6 工程化checklist

  • Code in version control (Git)
  • Tests >70% coverage
  • CI/CD自动跑回测
  • Logging全链路(structured JSON)
  • Monitoring (Grafana + Prometheus)
  • Alerting (PagerDuty / Telegram)
  • On-call rotation
  • Disaster Recovery plan (DR runbook)
  • 资金分散在多个交易所
  • Hot wallet / Cold wallet分离
  • Multi-sig + hardware wallet for cold

6.7 团队 vs 个人路径

个人(1人):

  • 阶段1-2:1-2个月
  • 阶段3-4:2-3个月
  • 实盘$10k-100k
  • 可持续运营3-5个strategy
  • 年化期望:$10k-100k baseline,运气好$1M+

小团队(2-5人):

  • 一人专注研究,一人专注工程,一人风控
  • 阶段1-2:2-3周
  • 阶段3-4:1-2个月
  • 实盘$1M-10M
  • 可持续运营10-30个strategy

机构级(10+人):

  • 完整research/eng/risk/ops分工
  • 数据/基础设施有专门团队
  • $50M+
  • 50-100+strategy

关键洞察 #6:从研究到实盘的工程化路径不是"加几行错误处理",而是把研究品质的代码彻底重写一遍以满足production需求。低估这一步的人都会在阶段4交学费。


第7章 加密专属:MEV与链上量化

这一章是crypto最独特的部分。MEV和链上量化没有TradFi对应物——理解它需要从头学。

7.1 MEV作为成本 vs MEV作为利润

MEV的double-edge sword

  • 你做DEX swap → MEV是你的成本(被sandwich、frontrun)
  • 你做searcher → MEV是你的利润

作为成本(避免)

  • 用Flashbots Protect / CowSwap / 1inch Fusion (Intent-based) 把交易送到private mempool
  • 减少slippage tolerance(但fail rate上升)
  • 拆单(MEV searcher抓的是大单,小单不值得sandwich)
  • 时机选择(gas高时sandwich profit margin被压缩)

作为利润(搜索者)

  • Atomic arb:DEX-to-DEX/CEX-to-DEX价差,单block完成
  • Liquidation:清算underwater仓位赚清算奖励
  • Sandwich:(道德灰区,不推荐)
  • JIT liquidity:UniV3集中流动性JIT mint+burn

Searcher现状(2026-Q3)

  • Top 10 searchers占据85%+ MEV利润
  • Atomic arb毛利润$50M-500M/月(Ethereum mainnet)
  • 工程门槛极高:node infra + simulation + 极致延迟

7.2 链上量化的额外考量

维度TradFiCEX cryptoDEX/链上crypto
SettlementT+1或instantinstantinstant on-chain
Latencyμs5-50ms50-2000ms (block time)
Reorg risk有(特别是Solana)
Gas/Fee固定动态但known动态且变化大
私密性公开(除private mempool)
Bundle原子性N/A单笔atomic整block bundle atomic
Builder/RelayN/AN/A必须理解mev-boost
Failure moderejectedrejected链上回滚但仍付gas

链上特殊错误:

  • Failed tx仍付gas:DEX swap revert(slippage超阈/被抢/oracle fail)会付50-200k gas,单笔$2-50。回测必须包含failed tx的成本
  • Reorg导致已成交回滚:Solana上1-2%的tx在5s内可能reorg。处理方法:等够confirmation + 标记unsafe tx。
  • Block congestion:bull市Ethereum gas可冲到500 gwei(vs normal 20),单笔swap成本20-50倍。

7.3 OFA对最佳执行的改变

OFA = Order Flow Auction,把user的orderflow拍卖给solver(通常以保证最优价为优胜条件)。代表项目:

  • CowSwap (CoW Protocol)
  • 1inch Fusion
  • UniswapX
  • Bebop / Hashflow (RFQ-based)

对量化的影响

  • 如果你是user:OFA给你比直接DEX swap好的价格(因为solver做CoW + 内部batch + MEV-protected execution)。
  • 如果你是searcher/MM:OFA是新的alpha source——成为solver需要建simulation能力 + capital。Top-tier solver如Wintermute/Jane Street/Tokka Labs都在抢这块。
  • 传统DEX MM受冲击:OFA bypass了Uniswap/Curve的pool,传统LP收入下降。

OFA量化

  • 监控orderflow market share(CowSwap占比、1inch Fusion占比)
  • 理解每个solver的策略(CoW vs RFQ vs hybrid)
  • 评估自己的策略是否应该转型为solver

关键洞察 #7:MEV和链上量化是crypto最大的paradigm shift。如果你只在CEX做策略,你错过了链上80%的alpha。但同时链上量化的工程门槛也极高——单干很难,要么和团队合作,要么从CEX strategy入手。


第8章 alpha衰减的7种形态

每个alpha都会衰减。理解衰减形式才知道什么时候放弃、什么时候坚持、什么时候切换。

8.1 信息扩散(Information Diffusion)

机制:你发现的pattern,别人也发现,越来越多人交易→pattern消失。

例子

  • 2020-2021 Curve 3pool与yEarn的carry trade,初期年化40%,2022年压缩到5%。
  • 2021-2022 stETH-ETH spread arb,初期spread常达-5%,2024年压缩到-50bps。

信号

  • Sharpe按时间monotonic下降
  • 信号触发后填单时间变长
  • Twitter/Discord有人公开讨论你的策略

应对

  • 已经在赚钱→继续,但放低预期
  • 还没开始→别做(除非有自己independent edge)

8.2 资金流入(Capital Inflow)

机制:alpha source容量有限,更多资金进入挤压收益。

例子

  • Funding carry arb:BTC perp historical funding 0.01% (8h),2023-2024年大量capital涌入后挤压到0.005%。
  • LP挖矿:Curve gauge最初年化几百%,后期被bribery+CRV emission稀释到20-50%。

信号

  • TVL/AUM显著增长
  • 同一时刻同向flow明显(看链上大单)

应对

  • 预估总capacity,自己仓位<10%是安全线
  • 超过capacity就接受alpha decay

8.3 市场结构变化

机制:交易所/链/工具升级改变市场。

例子

  • Ethereum The Merge (2022-09):PoW → PoS,MEV分配从miner变到validator+builder。
  • Uniswap V2→V3:concentrated liquidity让做市完全重写。
  • Solana性能升级:本来无法做的策略变可行。

信号

  • 协议announcement
  • testnet/devnet出现新功能

应对

  • 关注RIP(Roadmap Improvement Proposal)/ EIP/ chain announcements
  • 提前paper trade新机制

8.4 监管压力

机制:监管行动直接关掉某些策略或加大成本。

例子

  • 2022年OFAC制裁Tornado Cash,私密性策略失效。
  • 2023-Q3 SEC对币安/Coinbase的诉讼,影响美国用户tradable universe。
  • MiCA(2024年生效)改变欧盟稳定币流动性。

信号

  • Reuters/Bloomberg的监管新闻
  • 律所发的compliance update

应对

  • 多管辖地多账户分散
  • 不要在single jurisdiction risk上集中
  • 维护legal counsel关系

8.5 技术升级(合约/链升级)

机制:合约或链的升级改变策略经济模型。

例子

  • Aave V2→V3:interest rate model改变了borrow rate,影响looping strategy。
  • Compound引入Comet:cTokens接口变化,旧的integration broke。
  • Solana DApp更换pricing oracle,arb path改变。

信号

  • GitHub commit
  • Governance proposal

应对

  • 订阅核心协议的GitHub release
  • maintain regression test覆盖关键interface

8.6 协议改版(fee调整/激励调整)

机制:协议参数调整改变经济模型。

例子

  • Uniswap调整fee tier(2024年加0.01% tier),改变LP收益。
  • Curve的vote-locked CRV gauge weight调整,改变各个pool的emission。
  • 期权交易所调整margin要求(Deribit 2025年Q3收紧),改变capital efficiency。

信号

  • Governance forum / Discord proposal
  • 协议的treasury report

应对

  • 参与governance(持有token + vote)
  • 多协议diversification

8.7 规模约束(Capacity Constraint)

机制:你自己的资金体量到达策略容量上限。

例子

  • Pairs trading在BTC-ETH上capacity约$50M(更大move spread本身)
  • 单pool LP做市超过pool TVL 5%时edge显著下降
  • ATM期权做市$50M position size开始move IV term structure

信号

  • 你的flow占总market flow > 5%
  • 你的order明显move price
  • Slippage显著上升

应对

  • 提前估算capacity,不要超过50%
  • Capacity hit后,diversify到其他策略

关键洞察 #8:Alpha永远在衰减。健康的研究pipeline是3-5个alpha同时运行 + 每月找1-2个新idea + 接受老的fade out。永远不要把一个alpha当永久。


第9章 团队与组织:crypto量化团队的组成

9.1 角色组合

最小可行团队(3-5人)

角色主要职责必备技能
Researcheridea生成、统计/数学建模、回测Python/数学/金融知识
Engineer数据基础设施、execution/OMS、live trading botPython/Rust/数据库/网络
Risk/Ops风控monitor、操作CEX/钱包、清结算Excel/SQL+财务+合规
(optional) PM产品方向、对外沟通、合规mixed
(optional) Analyst数据分析、链上researchDune SQL/链上工具

机构级团队(10-30人)

  • Quant Research(5-8人):分pricing/factor/alpha/risk research
  • Engineering(5-10人):data/infra/execution/blockchain
  • Risk(2-3人):market risk/credit risk/operational risk
  • Ops(3-5人):treasury/settlement/compliance
  • Tech support:DevOps/SRE

9.2 与传统对冲基金量化团队的差异

维度TradFi quant fundCrypto quant fund
团队规模50-500人5-50人
研究:工程比例1:11:2 (eng more)
主流人选PhDmix of PhD和practitioner
Compensationbase+bonusbase+token equity+performance
工作节奏9-5 + on-call24/7 on-call
Tech stackC++/KDB/PythonPython/Rust/Solidity
Rare roleDAO governance research, MEV searcher, on-chain forensics

9.3 招聘信号(如果你是hiring manager)

好signal

  • 真实链上交易history(地址可验证)
  • 公开的研究文章(Mirror/Substack/GitHub)
  • 完整的side project(不只是tutorial)
  • 能讲清楚回测的5个陷阱(一问就知道是不是真做过)

红旗signal

  • 只学过、没实操
  • 不能解释自己的P&L attribution
  • 仅会用某一框架(vectorbt/zipline)但不能脱离它思考
  • 对MEV/Solana等"crypto-native"东西完全不了解

9.4 自己的path planning

如果你是想入crypto quant的个人,建议路径:

  1. Year 1:从CEX strategy入手(funding carry / pairs / market making),$10k-100k实盘。目标:能讲清楚自己的策略+attribution
  2. Year 2:加入链上策略(DEX arb/JIT/atomic searcher),形成全栈。目标:能在面试里展示完整pipeline
  3. Year 3:要么加入机构(Wintermute/GSR/Cumberland/Jump),要么创业(个人fund/prop shop)。

关键洞察 #9:crypto量化团队的"小而精"特点是它的优势也是它的劣势。优势:决策快、灵活;劣势:人手不够,每个role都要overlap。新人加入时永远是"被三件事同时拖累"——要适应这种节奏。


第10章 展望与开放问题

10.1 AI agent作为新型市场参与者

2025-2026年看到的现象:

  • AI agent在Polymarket/Hyperliquid/UniswapX大量出现
  • Virtuals Protocol/ai16z等让agent经济可tokenize
  • LLM-driven trading agent(如Trump Trading Agent on Polymarket)单仓位达$1M+

对量化的影响

  • 新的orderflow source(AI agent vs human)
  • AI agent的策略可被反向engineer(它们用什么模型?)
  • AI agent的vulnerabilities可能成为新的alpha

开放问题:AI agent是否会形成自己的"market regime"?是否会出现"AI vs AI"博弈进入纳什均衡,让human alpha彻底被挤出?

10.2 RWA/合规化对crypto量化的影响

2025-2026 RWA趋势:

  • BlackRock BUIDL fund达到$50B
  • Ondo / Centrifuge把treasury yield带上链
  • USDC/USDT合规化压缩稳定币arb空间

对量化的影响

  • 利率类策略重新出现(接触美债收益曲线)
  • 合规要求增加,"匿名交易"门槛上升
  • Institutional money inflow提供更深liquidity

开放问题:当crypto"传统化"后,crypto-native alpha还剩多少?是否最终所有crypto策略都变成"传统策略+24/7"?

10.3 5个未解决问题

  1. Crypto期权smile为什么这么陡?:相比股票期权SABR/Heston解释得很差,是市场不成熟还是有结构性原因?
  2. Funding rate的真实alpha是什么?:经过capital inflow压缩后,是否还有可持续edge?
  3. MEV 2.0是什么样?:PBS、ePBS、SUAVE、Multi-Block MEV等会如何重塑链上量化?
  4. 跨链arb的最终形态?:account abstraction + intent-based system让"跨链"模糊化,cross-chain MEV是新领域。
  5. AI agent市场的新均衡?:human+AI共存的市场会如何reach equilibrium?

关键洞察 #10:crypto量化作为一个领域才10年,现在处于"已经很难但还会更难"的阶段——已经过了"随便挂个策略就赚钱"的红利期,但远没到"传统市场效率"的终点。未来3-5年仍是黄金期,但门槛在快速上升


附录A 工具链推荐表

A.1 数据

类别工具价位用途
CEX历史数据Tardis.dev$1-5k/月tick-level全交易所
CEX历史数据Crypto Lake$0.5-2k/月价格友好替代
CEX历史数据Kaiko$5-50k/月机构级
链上RPCAlchemy / Infura / QuickNode$0-2k/月标准RPC
链上archiveErigon自建 / Chainstack$200-2000/月完整历史
Subgraphthegraph.comfree + pay-per-query索引化的链上数据
链上分析Dune / Flipside / Footprintfree + pro tierSQL分析
标签数据Nansen / Arkham$1-5k/月地址聚类
期权数据Deribit Insights / Laevitasfree / $200/月option chain & IV
MEV数据mevboost.pics / EigenPhi / Edenfree / paid tierMEV分析

A.2 回测

工具适用
pandas + numpyDIY,最灵活
vectorbt中频,pandas-based高速
backtraderevent-driven
zipline学院派
QuantConnect Lean完整云端
自研Rust/C++tick-level HF

A.3 执行

工具适用
ccxtpython,所有CEX统一接口
Hummingbot开源做市机器人
FreqTrade开源trading bot
Hyperliquid SDKHyperliquid专用
web3.py / ethers.jsEVM链下单
anchor (Rust)Solana链下单
Flashbots SDKbundle提交

A.4 监控

工具适用
Grafana可视化
Prometheusmetric collect
Sentryerror tracking
PagerDuty / Opsgeniealerting
Tenderly链上monitoring
Nansen Smart Alertswhale监控

附录B 真实策略案例3则

B.1 案例1:BTC-ETH Pairs Trading

Hypothesis:BTC与ETH的price ratio在rolling 180d window内协整(除crisis期)。

Implementation

  • 数据:Binance USDT spot, 1m kline
  • 信号:Engle-Granger Z-score with rolling window
  • 进场:|Z|>2,仓位等量market neutral(BTC long $50k, ETH short equiv-$)
  • 出场:|Z|<0.5
  • Stop:|Z|>4 → flat all + 24h cooldown

实盘表现(2024-Q1 - 2026-Q2,30个月)

  • Sharpe (gross): 1.45
  • Sharpe (after fee/slippage): 1.05
  • Max DD: 12%
  • 平均胜率: 64%
  • 平均hold time: 3.2 days
  • 最大单笔损失: -$3.5k on $100k notional

回测 vs 实盘差异

  • 回测Sharpe: 1.85 (gross), 1.4 (after cost)
  • 差异原因:协整断裂在2025-Q3(bear市)和2025-Q4(rapid bull rotate),实盘提前stop loss减少损失但也错过部分回归

B.2 案例2:BTC Perp Funding Carry

Hypothesis:当BTC perp funding rate持续显著>spot lending rate时,做空perp+long spot获carry。

Implementation

  • 数据:Binance funding rate每8h
  • 信号:funding rate > 0.02% AND 7d MA > 0
  • 进场:short BTC perp $100k + long BTC spot $100k
  • 出场:funding rate < 0.005% OR 持仓>30日
  • 风险控制:spread (perp-spot) <-2% → 立即unwind(防止basis crash)

实盘表现(2024-Q3 - 2026-Q3,24个月)

  • 累计收益: 18.5%
  • 实际vs回测: 实盘20%下降(funding compression)
  • 最大DD: 4%(2025-Q3 funding突然negative)
  • 平均年化: 9.2%
  • Sharpe: 2.1

关键事件

  • 2025-Q3 LUNA-style事件后funding突然-15%三天,幸亏stop logic及时
  • 2026-Q1 BlackRock spot ETF approval推high funding,连续30天0.05%+ → 那季度收益贡献最大

B.3 案例3:DEX Atomic Arbitrage Searcher

Hypothesis:Uniswap V3 / Curve / Balancer之间存在atomic arb机会,可在single block通过Flashbots bundle执行。

Implementation

  • Infrastructure: 自建Erigon archive node + custom simulation engine
  • 监控:mempool subscription,识别即将mint/burn/swap的tx
  • Path search: Bellman-Ford找最优arb path
  • Execution: Flashbots bundle,priority fee + gas auction

实盘表现(2025-Q4 - 2026-Q3,12个月)

  • 总gross profit: ~$2.8M
  • Gas成本: ~$1.2M
  • Bid loss to other searchers: ~$0.5M
  • Net profit: ~$1.1M
  • 月均: ~$92k
  • Win rate (bundle accepted): 4.2% (其余被bid out或simulation fail)

关键挑战

  • Top-3 atomic searchers (txfusion / rsync / unknown) 拿走75%+市场
  • 自建infra成本:$30k/月(archive node + bandwidth + collocation)
  • 需要持续优化(每月新对手出现)

经验教训

  • 不建议个人入场(infra投入>预期收益)
  • 适合作为更大team的一部分
  • 与其做atomic searcher,不如做JIT LP或Cross-domain MEV

附录C 推荐阅读

数学/金融基础

  • Hull, "Options, Futures, and Other Derivatives" (期权定价bible)
  • Shreve, "Stochastic Calculus for Finance II" (随机微积分)
  • Tsay, "Analysis of Financial Time Series" (时间序列)
  • Cont & Tankov, "Financial Modelling with Jump Processes" (跳跃过程)

微观结构与做市

  • O'Hara, "Market Microstructure Theory" (经典)
  • Hasbrouck, "Empirical Market Microstructure" (实证)
  • Avellaneda & Stoikov (2008), "High-frequency trading in a limit order book"
  • Guéant, Lehalle, Fernandez-Tapia (2013), "Dealing with the inventory risk"
  • Almgren & Chriss (2000), "Optimal execution of portfolio transactions"
  • Kyle (1985), "Continuous auctions and insider trading"

统计套利

  • Vidyamurthy, "Pairs Trading: Quantitative Methods and Analysis"
  • Avellaneda & Lee (2010), "Statistical arbitrage in the U.S. equities market"
  • Engle & Granger (1987), "Co-integration and error correction"

Crypto专属

  • Liu, Tsyvinski, Wu (2022), "Common Risk Factors in Cryptocurrency", Journal of Finance
  • Makarov & Schoar (2020), "Trading and arbitrage in cryptocurrency markets"
  • Daian et al. (2019), "Flash Boys 2.0" (MEV foundational)
  • Vitalik Buterin's MEV blog series
  • Flashbots Research (research.flashbots.net)
  • Paradigm Research blog
  • a16z crypto research

工程/系统

  • Kleppmann, "Designing Data-Intensive Applications"
  • Aleksey Charapko's blog (distributed systems)

实操/实战

  • Marcos López de Prado, "Advances in Financial Machine Learning" (核心方法论)
  • Ernie Chan, "Algorithmic Trading: Winning Strategies and Their Rationale"

博客/Substack

  • Vitalik Buterin: vitalik.eth.limo
  • Hasu: substack hasu.substack.com (MEV, market structure)
  • Doug Colkitt: 0xdoug Twitter (做市/DeFi)
  • Tarun Chitra (Gauntlet): gauntlet.network research
  • Paradigm Research: paradigm.xyz/writing
  • Bankless / Delphi research

论坛/社区

  • Flashbots Discord (MEV)
  • ETHResearch forum
  • Curve / Uniswap governance forum
  • Quantopian / WallStreetQuants (传统但有用)

全文关键洞察总结

  1. 方法论独特性:crypto的5个独特性(24/7、流动性碎片化、链上链下、监管不确定、token经济内生)让每个TradFi方法都要重新审视。
  2. 数据决定上限:质量优先于复杂度,数据团队工作量是模型团队的3倍。
  3. 模型是parameter recalibration:经典模型(BS/A-S/Engle-Granger)的核心数学没变,但crypto的参数选择完全不同。
  4. 回测的5重陷阱:lookahead/survivorship/cost/regime/optimization——回测漂亮的99%概率掉进了其中之一。
  5. 风险管理3层结构:pre-trade(不犯错)+ runtime(早发现)+ post-trade(持续学习)。
  6. 从研究到实盘5阶段:研究→回测→paper→小资金→scale up,每阶段Sharpe都会衰减,正常。
  7. MEV是crypto最大paradigm shift:避免它(成本)或拥抱它(利润)。
  8. Alpha永远衰减:7种衰减形态都要知道,pipeline永远3-5个alpha同时运行。
  9. 团队"小而精":crypto团队规模远小于TradFi,每人overlap多个role。
  10. 未来3-5年仍是黄金期:门槛快速上升,但远未到效率终点。

版本说明

  • v1.0 (2026-08-28):初版,基于60天Phase 2系统研究综合而成。
  • 预计v2 (2027-Q1):加入"交易心理学与连续运营"、"AI agent作为搬运工的新机会"、"Solana/Sui/Aptos的quant差异"。

本文档处于持续演进中。任何产品/工程/研究上的反馈,请通过 GitHub issue 提交。

Disclaimer:本方法论文档不构成投资建议。所有数字、案例、收益率均为研究/回测结果,实际表现受市场条件、执行能力、风险管理多因素影响。Crypto交易有重大资本损失风险,请在自身能力范围内谨慎参与。


END OF DOCUMENT