加密量化研究方法论
- [前言:为谁而写](#前言为谁而写)
Crypto量化研究方法论:从数据到实盘
Crypto Quant Research Methodology: From Data to Production
版本:v1.0 日期:2026-08-28 作者:[读者填写] 适用读者:crypto量化研究员、做市团队、对冲基金crypto策略组、自学型quant 摘要:本文基于60天系统性研究(涵盖期权定价、市场微观结构、做市、统计套利、MEV、DEX量化、实盘bot)总结而成的方法论文档。区别于直接照搬TradFi框架,本文聚焦crypto市场的独特性(24/7运行、流动性碎片化、链上链下二元、token economics内生),系统地回答"研究什么、怎么研究、研究产出如何落地"三个核心问题。
目录
- 前言:为谁而写
- 第1章 引言:为什么需要"crypto专属"方法论
- 第2章 数据:质量决定上限
- 第3章 模型:从理论到crypto专属调整
- 第4章 回测的5重陷阱(必读)
- 第5章 风险管理:3层结构
- 第6章 从研究到实盘:工程化路径
- 第7章 加密专属:MEV与链上量化
- 第8章 alpha衰减的7种形态
- 第9章 团队与组织:crypto量化团队的组成
- 第10章 展望与开放问题
- 附录A 工具链推荐表
- 附录B 真实策略案例3则
- 附录C 推荐阅读
前言:为谁而写
本方法论文档面向三类读者:
- 从TradFi转向crypto的量化研究员:你已经掌握了Black-Scholes、Avellaneda-Stoikov、Engle-Granger,但发现这些工具在crypto市场表现不稳定——本文告诉你哪些假设失效、如何调整。
- crypto-native做市/对冲基金的初级研究员:你能写Python pull数据、跑backtest,但缺少把"跑通的脚本"变成"机构级策略"的方法论框架——本文给你一条从数据到实盘的工程化路径。
- 想转入crypto量化的金融工程师/PM:你希望理解"做这一行需要什么、值不值得做"——第9、10章直接回答这两个问题。
本文不是教程,不会逐行教你写OU过程的MLE校准代码(那是Day 90的事),也不会铺开SVI拟合的数学推导(那是Day 65的事)。本文是当你已经知道这些工具后,如何系统性地组合它们去赚钱的指南。
第1章 引言:为什么需要"crypto专属"方法论
1.1 加密市场的5个独特性
在过去10年中,无数TradFi出身的量化团队进入crypto市场,绝大多数没能做出超额收益。原因不是他们的数学不好,而是他们把crypto当成"另一个市场",而不是"另一种市场"。
加密市场有5个无法绕开的独特性,每一个都让传统方法论需要重新审视:
| # | 独特性 | TradFi对比 | 影响 |
|---|---|---|---|
| 1 | 24/7运行 | 股市每周40小时、外汇120小时 | 没有"收盘价"概念;没有overnight gap;策略需要全天候监控;运维压力倍增 |
| 2 | 流动性碎片化 | 美股90%+在NYSE/NASDAQ | 100+个CEX + 50+条链 + 数千个DEX池;同一资产价格可差50bps;最佳执行变得非trivial |
| 3 | 链上链下二元 | 股票只在交易所 | 链上数据完全公开(whale地址/合约调用/MEV),链下则有privacy差异;两套数据要融合 |
| 4 | 监管/合规不确定性 | SEC/MiFID稳定 | 美国Howey测试、欧盟MiCA、新加坡MAS各异;交易所突然下架/封禁地区是常态 |
| 5 | Token economics内生 | 股票supply稳定 | 通胀/解锁/销毁/staking/restaking改变supply;funding rate/staking yield提供纯crypto特有的alpha源 |
1.2 传统TradFi量化方法论的失效之处
下面这些"在TradFi里是对的、在crypto里是错的"或者"在crypto里需要大改"的事,每一条都让初入crypto的研究员栽过跟头:
- Black-Scholes假设:连续交易、无套利、对数正态收益。crypto期权(Deribit BTC)的smile非常陡峭,2026-Q1 BTC ATM IV ~50%, 25-delta put-call skew可达-15 vol,这种结构必须用SVI/SABR重建。直接用BS反解后hedge会持续亏损。
- CAPM/Fama-French:用市场组合作为定价基准。crypto没有"市场组合"——BTC占总市值约45%,但ETH/SOL/小币的β结构完全不同。Liu-Tsyvinski-Wu (2022)的crypto 3因子(Market/Size/Momentum)才是更合理的基线。
- 协整稳定性:TradFi pairs(KO-PEP、F-GM)协整关系可以稳定数年。crypto pairs(BTC-ETH、SOL-AVAX)的Engle-Granger协整在bull/bear切换时经常断裂——3AC崩溃前后(2022-06)的BTC-ETH协整p-value从0.01跳到0.4。
- VWAP执行:股票TWAP/VWAP在24/7市场里没有"day"的边界,需要重新定义切片粒度。
- 信用风险:TradFi信用风险用CDS和评级。crypto的对手方风险更类似2008年的雷曼——没有透明披露,FTX崩溃(2022-11)前几天还在公开募集"健康"流动性,事后才发现Alameda挪用客户资金。
1.3 本方法论的边界与定位
本方法论不覆盖:
- 高频纳秒级做市(HFT colocation层面),那是Citadel/Jump/Wintermute的核心机密,需要专门的硬件+网络栈。
- 长期价值投资(基本面驱动),那是crypto fund category,与量化是不同的研究范式。
- 单纯的"看图技术分析",本方法论坚持数据驱动。
本方法论覆盖:
- 中低频策略(持仓时间从秒级到周级)
- 数据/模型/回测/风控/实盘的完整pipeline
- crypto特有的MEV、链上数据、tokenomics相关alpha
关键洞察 #1:把crypto看作"24/7运行、流动性碎片化、链上透明、监管不确定、token经济内生"这五个维度上"加倍困难"的金融市场。任何TradFi方法都要逐项检查这5个维度的影响。
第2章 数据:质量决定上限
核心观点:在crypto量化里,数据质量决定模型上限的80%;模型复杂度只决定剩下20%。
我用过20多种数据源做过分析,得出的最大教训是:你以为你在调模型参数,实际上你在调"垃圾数据"的noise。这一章把crypto数据的所有坑系统性铺开。
2.1 数据源分类
| 类别 | 代表 | 优势 | 陷阱 | 适用场景 |
|---|---|---|---|---|
| CEX交易所原始数据 | Binance/OKX/Bybit/Coinbase API | 高频、低延迟、L2 orderbook | 各家API格式/精度不同;history有限制 | 做市、HF arb、orderflow |
| CEX衍生品 | Deribit/CME/Binance Futures | 期权链、funding、basis | volume真实但OI披露不全 | 期权策略、basis trade |
| DEX链上原始数据 | Etherscan/直接RPC/Subgraph | 每笔swap可追溯到地址 | RPC speed limit;reorg会改变历史 | MEV、whale tracking、流动性分析 |
| 数据聚合方 | CoinGecko/CMC/Kaiko/Amberdata | 跨所对齐、清洗过 | 二手数据有偏差;wash volume混入 | 宏观研究、TVL track |
| 专业数据厂 | Tardis/Crypto Lake/Kaiko | tick级历史、orderbook snapshot | 贵($1k-10k/月) | 严肃机构研究 |
| 链上分析厂 | Nansen/Arkham/Glassnode | 已标注地址、whale聚类 | 标签准确率有限;落后实时 | 链上alpha研究 |
| 特殊源 | Flashbots relay API/builder API | MEV bundle、private orderflow | 部分需特权或付费 | MEV搜索者 |
2.2 数据质量陷阱
每一个陷阱我都踩过。
2.2.1 K线close/open不一致
Binance kline的close和下一根open不严格相等——交易在毫秒级跨越K线边界时,最后一笔的price成为close但下一根open取下一笔的price,可能不同。这意味着把close-to-close的series当作连续price是错的。在做returns计算时,要么用trade流,要么用midpoint,要么承认这点noise。
实际数据:BTC/USDT 1m kline(2026-Q1 sample 100k bars),close ≠ next open的比例约23%,平均偏差0.8 bps。对低频策略影响小,对tick-level策略影响巨大。
2.2.2 Wash trading
"Volume"不等于"真实交易量"。某些小所/中尾所长期存在wash trading——同一实体left-pocket-to-right-pocket刷量。Bitwise 2019年的报告显示,CMC top-100交易所中只有10个的volume是真实的;剩下90%被刷了。
识别方法:
- 看bid-ask spread/volume比率,wash所spread异常宽。
- 对比同一资产在多所的volume vs 价格波动相关性,wash所的相关性接近0。
- DEX端:用Trader Joe/Uniswap的unique trader数除以volume,正常应在1000-10000 USDC/trader/day范围。
2.2.3 Stale price / 服务端时间漂移
不同交易所的服务端时间不严格同步,差异可达数秒。Coinbase的trade timestamp是matching engine时间,Binance是published时间。做跨所arb时若不对齐时间,会"看到"实际不存在的价差。
对齐方案:用本地接收时间打timestamp,并用NTP同步后做offset校正。或者只接受那些在多个venue同时观察到的价差作为真信号。
2.2.4 Reorg导致的历史改写
Ethereum 2-3 block reorg偶发,Solana更频繁。链上数据"历史"不绝对稳定。
- 对策:等够"finality"再认数据。Ethereum 12 block (~144s) finality reasonably safe;Solana 32 slot (~13s)。
- 极端情况:The DAO fork (2016)、Bitcoin Cash fork (2017)是永久分叉,历史完全分裂。
2.2.5 Funding rate的interval差异
Binance perp funding每8h结算,dYdX每1h,Bybit每8h但settlement不同。直接比较"funding rate"数值会失真——必须year-of-rate或某统一周期标准化。
2.2.6 IV chain的settle source
Deribit用index价格settle期权,index是多所价格的weighted median。某一所价格异常会污染整个IV chain。FTX崩溃(2022-11-09)那天,FTX价格异常,但Deribit index短暂被污染,导致IV chain全错。
2.3 链上数据 vs 交易所数据:何时用何
下表是经过60天实战总结的取舍框架:
| 研究目标 | 优先链上 | 优先交易所 | 双方融合 |
|---|---|---|---|
| Whale行为追踪 | ✓ | ||
| 做市策略(mid quote预测) | ✓ | ||
| Funding/Basis arb | ✓ | ||
| MEV研究 | ✓ | ||
| 跨所价差套利 | ✓ | ||
| Token launch早期分析 | ✓ | ||
| 期权smile/skew | ✓ | ||
| Stablecoin de-peg | ✓ (链上mint/burn + CEX交易) | ||
| Liquidity migration研究 | ✓ (DEX TVL + CEX volume) |
默认偏好:可以从交易所拿到的数据就从交易所拿——延迟低、量大、结构整齐。链上数据是补充,不是替代。常见错误:用Subgraph/Dune拉Uniswap V3 swap做高频研究——延迟分钟级,远不如直接订阅Swap event log。
2.4 数据基础设施搭建建议
经过60天反复重写,我推荐的分层架构如下:
┌─ Hot Layer (实时) ────────────────────────────────────────┐
│ Redis / DragonflyDB │
│ - latest mid quote │
│ - latest funding rate │
│ - position snapshot │
│ TTL: 1-300秒 │
└────────────────────────────────────────────────────────────┘
┌─ Warm Layer (近期) ───────────────────────────────────────┐
│ Postgres / TimescaleDB │
│ - last 30 days L2 orderbook snapshots │
│ - last 90 days trade history │
│ - all current positions / orders │
│ Index: time + symbol + venue │
└────────────────────────────────────────────────────────────┘
┌─ Cold Layer (历史) ───────────────────────────────────────┐
│ ClickHouse / Parquet on S3 │
│ - tick history (years) │
│ - kline history │
│ - funding/basis history │
│ Partition: monthly + symbol │
└────────────────────────────────────────────────────────────┘
关键设计原则:
- Hot/Warm/Cold分层:研究在Cold(Parquet+ClickHouse),实盘读Hot(Redis),警报在Warm(Postgres)。
- Schema-on-write vs Schema-on-read:tick数据schema-on-read(直接dump JSON再解析);聚合后的因子数据schema-on-write(强类型)。
- 冗余订阅:关键feed(如BTC/USDT mid quote)至少订阅2个venue + 1个aggregator,本地做reconciliation。
- 数据recording开销:完整L2 orderbook(10级深度,BTC/USDT,10ms snapshot)一年约500GB。提前规划存储。
- 回填管理:每个数据源有从未出现过bug、断流、回滚的概率为0,必须有回填脚本。Tardis提供历史L2,Crypto Lake提供历史trade,按需采购。
关键洞察 #2:在crypto里,数据团队的工作量是模型团队的3倍。如果你只有一个人做,先建数据基础设施,再做模型。否则你模型再漂亮,输入垃圾,输出也是垃圾。
第3章 模型:从理论到crypto专属调整
每一类金融模型在crypto里都有"经典版本失效→需要调整"的故事。本章按模型类别罗列。
3.1 期权定价:BS在crypto中的失效与SABR调整
Black-Scholes在crypto的失效点:
- 波动率不是常数:BTC ATM IV在2024-Q4 bull市约35%,2025-Q3 bear市冲到95%,2026-Q1回到50%。常数σ假设在crypto期权里站不住。
- smile非常陡:Deribit BTC 25-delta put-call skew在2025年5月(恐慌期)达-25 vol,远超SPX历史极值。BS反解后单点IV失去插值能力。
- 对数正态尾部不够厚:BTC日收益的-5σ事件历史上发生过20+次,远超正态分布预测的0.0003次。
调整方案:
- SVI(Stochastic Volatility Inspired):5参数 $(a,b,\rho,m,\sigma)$ 拟合每个maturity的smile。我在Day 65拟合Deribit BTC 7d/14d/30d smile,R²>0.99。
- SABR:参数 $(\alpha,\beta,\rho,\nu)$,给出smile演化的随机模型。crypto里 $\beta=0.5$ 比 $\beta=1$ 拟合更好(暗示乘法+加法混合diffusion)。
- Heston:均值回归的随机波动率模型。crypto vol-of-vol很高,Heston的 $\nu$ 参数往往大于股票市场3-5倍。
实操建议:
- 对每个到期日单独拟合SVI(不要做term structure的interpolation,会引入伪信号)。
- 校准频率1h(流动性差的远月可降到6h)。
- Vega risk必须按strike拆分,因为smile不是平移而是变形。
3.2 永续合约的funding rate模型
Funding rate是crypto独有现象,但它不是"另一个利率",而是perp与spot价差的市场化清算机制。
公式: $$ \text{Funding Rate} = \text{premium index} + \text{interest rate} $$ 其中premium index = perp与spot价差的滚动平均。
经验观察:
- BTC/USDT Binance perp funding分布的中位数在过去3年约0.01% (8h),即年化约11%。这是LP-of-funding-收益的baseline。
- 极端funding:2021-04-14(牛市顶部)BTC funding达0.375% (8h),年化411%。
- 负funding(perp折价)出现在bear市恐慌(2022-06)和重要清算事件后。
- Funding mean-reverts到0附近,半衰期约8-24h。
funding模型: $$ F_t = \alpha + \beta_1 \cdot \text{premium}{t-1} + \beta_2 \cdot \text{volatility}{t-1} + \beta_3 \cdot \text{OI change} + \epsilon_t $$
funding carry alpha:
- 简单做法:funding>阈值时空perp + 多spot;负funding反之。
- 风险:basis突然爆炸(2022-06 luna崩盘期间basis一度-15%),所以必须配hedge ratio dynamic。
- 容量:BTC perp funding arb总策略容量估算约$50M(更大会自己move funding)。
3.3 做市:A-S/GLFT在crypto的参数选择
Avellaneda-Stoikov (2008)和GLFT (Guéant-Lehalle-Fernandez-Tapia, 2013)给出最优做市报价。形式:
$$ \delta^*_{\text{bid}} = \frac{\gamma \sigma^2 (T-t)}{2} \cdot (1 - 2q) + \frac{1}{\gamma}\ln\left(1 + \frac{\gamma}{k}\right) $$
其中 $\gamma$ 是风险厌恶系数,$k$ 是订单到达的强度参数,$q$ 是当前inventory,$\sigma$ 是short-term volatility。
TradFi vs Crypto的参数差异:
| 参数 | TradFi (例SPY) | Crypto (BTC perp) | 含义 |
|---|---|---|---|
| $\sigma$ (15s volatility) | ~3 bps | ~5-15 bps | crypto高3-5倍 |
| $k$ (order arrival) | ~50/s | ~10-30/s | crypto订单稀疏 |
| $T-t$ (residual time) | 至收盘 | 通常取24h或fix(24/7市场无收盘) | 概念变化 |
| $\gamma$ (risk aversion) | 0.1 | 0.5-2 | crypto更激进收紧库存 |
crypto特有调整:
- $T-t$不再有"收盘"概念,常fix为单日4h-24h循环或简化为"无穷"+inventory penalty。
- $\sigma$必须用很短窗口估计(5-15s EWMA),且要考虑微观结构噪声overestimation——用realized variance减去bid-ask bounce估计。
- 加funding rate term:BTC perp做市必须把funding预期incorporate到quote里,否则被market吃walk over。
- 加adverse selection term:toxic flow detection(VPIN指标)触发后quote要拉宽。
3.4 统计套利:协整在crypto的稳定性分析
crypto协整的特点:
- 存在但不稳定:BTC-ETH协整p-value在2024-2026年间从<0.01到0.5之间反复跳。
- 结构断裂在重大事件后必现:3AC崩盘(2022-06)、FTX崩盘(2022-11)、SVB事件(2023-03)后协整都重新校准。
- stETH-ETH是少数稳定协整对:因为有redemption机制做ground truth;spread常年-50 to +20 bps震荡。
应对方法:
- 滚动窗口协整测试(180d window,monthly recalibrate)。
- 加regime detection(HMM或简单的vol regime):bull/bear切换时暂停策略。
- 半衰期估计 $\tau = \ln 2 / \theta$ ,crypto pairs typical $\tau$ = 1-7 days,过长不交易。
- Z-score阈值:进场|Z|>2,出场|Z|<0.5,stop-loss|Z|>4(强行平仓+暂停pair)。
3.5 因子模型:crypto特有因子
经典CAPM/Fama-French不能直接用,因为:
- "Market"组合定义模糊(BTC?BTC+ETH?top-100 cap-weighted?)
- "Size"因子在crypto表现出不稳定的反向效应(小币在bull市跑赢、bear市暴跌)
- "Value"在crypto没有book value概念
crypto特有的有效因子:
| 因子 | 度量方式 | 经验Sharpe (long-short) | 数据源 |
|---|---|---|---|
| Market | top-50 cap-weighted | benchmark | CoinGecko |
| Momentum | 30d return | 1.0-1.5 | 任何价格 |
| Mean reversion (short term) | 7d反向 | 0.8 | 任何价格 |
| Funding Carry | funding rate cross-section | 1.2 | Binance Futures API |
| Liquidity | bid-ask + volume | 0.6 | Tardis/Kaiko |
| On-chain Activity | active addresses | 0.5 (slow) | Glassnode |
| MVRV | market cap / realized cap | 0.7 (low freq) | Glassnode |
| Stablecoin Supply | circulating change | 0.4 | DeFiLlama |
| Beta to BTC | rolling 30d beta | 0.3 (regime-dependent) | 任何价格 |
来源参考:Liu-Tsyvinski-Wu (2022) "Common Risk Factors in Cryptocurrency",Babiak-Bianchi (2023) "Predictability in cryptocurrency markets"。
风险模型:
- Barra-style:选20-30个factor做expected return + cov matrix。crypto里factor少(只有上面这几个),所以单因子贡献率高。
- 警告:crypto因子互相相关性远高于股票,PCA前3个component常解释70%+方差。
关键洞察 #3:每一个TradFi模型在crypto都有调整版本。盲目套用是新人最常见错误。但同时,新版本不是revolutionary,只是parameter recalibration + 加几个crypto-specific term——核心数学没变。
第4章 回测的5重陷阱(必读)
本章是整篇方法论里我最希望读者读完的部分。90%的"漂亮回测"在实盘里崩盘的原因都在这5个陷阱里。每一条我都至少踩过一次。
4.1 Lookahead bias:crypto特有的tick时间戳陷阱
经典lookahead bias(用未来数据)很容易避免——data scientists都知道。crypto独有的lookahead bias包括:
4.1.1 K线close用作信号触发
错误:基于15:00:00的1m K线close(=15:01:00才确定)触发交易,但回测里假设15:00:00就能交易。
正确:信号触发时间=K线close时间+至少1个tick的延迟。
4.1.2 Funding rate timestamp混乱
Binance perp funding每8h在UTC 00:00/08:00/16:00结算。funding rate的settlement value是"过去8h的TWAP"——你在T时刻看到的rate实际是T-8h的产物。回测里若把"当前看到的rate"当作"刚结算的价"会高估carry收益。
4.1.3 Subgraph vs RPC数据延迟
Subgraph(thegraph.com)数据落后链头2-10个block(30s-2min)。Subgraph的"现在"实际是2分钟前的实际链状态。MEV/高频策略不能用Subgraph回测,必须用archive node。
4.1.4 Aggregator数据的对齐
CoinGecko/CMC的price是minute-level aggregated,aggregation窗口的endpoint不严格对齐到分钟。直接拿当作分钟数据会引入0.5-30s的lookahead。
4.1.5 Walk-forward时机
参数优化只能用T时刻之前的数据。常见错误:用2024年全年数据优化参数,然后在2024年Q1-Q4回测——你的"最优参数"已经"看过"Q4数据。
强检查方法:删掉最后30天数据训练→回测最后30天→比较实盘那30天的表现。如果两者差异>30%,回测有问题。
4.2 Survivorship bias:失败token的处理
crypto有数千个token,每年都有数百个被delist、归零、rug pull。只用"现在还活着"的token做回测会严重高估收益。
实证:
- 2024年初CoinGecko top-500 token里,到2026年8月有117个市值<原来1%(实质性归零)。
- 若回测策略在2024年初的universe上跑到2026年,必须保留所有归零token的负贡献。
应对:
- 用"point-in-time universe"——每个回测时点的universe是当时实际可交易的token,不是事后的"今天还活着"的集合。
- 数据源:Kaiko、CryptoQuant有point-in-time history;CoinGecko免费版没有。
- delist处理规则:T时刻被delist→T-1时刻的mark price立刻reset到0或最后流动性价格。
4.3 Transaction cost:CEX taker/maker、DEX gas、MEV成本
完整成本模型:
total_cost = exchange_fee + slippage + gas (DEX) + MEV cost (DEX) + funding (perp) + opportunity cost
4.3.1 CEX费率参考(2026-Q3)
| 交易所 | Maker fee | Taker fee | VIP折扣 |
|---|---|---|---|
| Binance Futures | 0.02% | 0.05% | VIP 9: -0.005% / 0.025% |
| Bybit | 0.02% | 0.055% | 类似 |
| Coinbase Advanced | 0.6%-0.0% | 1.2%-0.05% | tier-based |
| Deribit | 0.0% | 0.03% | options常见 |
回测里常见错误:用现货fee率计算perp成本(perp实际更便宜)。
4.3.2 DEX gas成本
Ethereum mainnet gas in 2026: ~20 gwei normal, ~80 gwei busy。
- Uniswap V3 swap: ~150k gas → ~$3-15
- 1inch aggregator: ~250k gas → ~$5-25
- Curve metapool: ~250k gas → ~$5-25
- L2 (Arbitrum/Base): 1/100 of mainnet
回测必须把gas作为绝对dollar成本,不能按比例。$100的trade付$5 gas vs $100k的trade付$5 gas,后者完全可行,前者必亏。
4.3.3 Slippage与price impact
公式:$\text{slippage} \approx 0.5 \cdot \text{spread} + \text{price impact}$
price impact取决于pool深度,Uniswap V3的concentrated liquidity让price impact非线性,typical小单(<$10k)影响<5bps,大单(>$1M)影响50-200 bps。
回测里强烈建议:用真实L2 orderbook快照模拟成交(不是用midpoint),尤其是<1m级别策略。
4.3.4 MEV成本(链上独有)
链上swap的隐性成本:
- Sandwich attack: 受害交易平均损失30-300 bps(Pancake研究2024)。
- JIT liquidity: 不一定是成本,但分散了你期望的fee分成。
- Backrunning: 你的arb机会被searcher提前抢走。
预防方案:用Flashbots Protect或CowSwap,可消除~80% sandwich风险。回测时若不模拟MEV成本,DEX策略收益会高估10-50%。
4.3.5 Cost对策略容量的影响
容量公式(粗略): $$ \text{capacity} \approx \frac{\text{daily alpha (bps)}}{\text{avg slippage per dollar (bps/USD)}} $$
例:BTC 30d momentum策略,alpha5bps/day,BTC市场slippage0.1bps/$1M → capacity ~$50M/day rotation。
4.4 Regime change:bull/bear/sideway/crisis四种regime
许多策略在某一regime表现极佳但跨regime崩盘。单regime的Sharpe>2不意味着实盘也>2——你必须看跨regime表现。
我推荐的4-regime划分:
| Regime | 定义(启发式) | 历史代表期 | 常见有效策略 | 常见失效策略 |
|---|---|---|---|---|
| Bull | BTC 30d return>20%, vol<60% | 2024-Q4, 2025-Q4 | momentum, basis carry | mean-reversion |
| Bear | BTC 30d return<-20%, vol<60% | 2025-Q3 | short momentum, IV crush | long pairs |
| Sideway | |BTC 30d return|<10%, vol<40% | 2026-Q2 | pairs, mean reversion, 做市 | momentum |
| Crisis | BTC 30d return<-30% AND vol>80% | 2022-06, 2022-11, 2025-08 | flat或long vol | 几乎所有的carry/arb |
操作建议:
- Strict requirement: 你的回测必须至少跨过2个regime(理想4个)。
- 用HMM (Hidden Markov Model)做regime detection,state变化时调仓。
- 备一个"crisis switch"——检测到crisis自动减仓50-100%,等regime确认稳定再返回。
- 不要靠regime模型预测regime change——只用它滞后识别当前在哪个regime,并据此调整。
4.5 Optimization bias:参数空间过大时的overfitting识别
经典overfit检验在crypto里要更严格:
4.5.1 Bonferroni-style multiple testing
如果你试了 $N$ 组参数找最优,最优结果的Sharpe真值估计要除以 $\sqrt{N/(N-1)}$ 修正。$N=10000$时,回测Sharpe 2.5的"真值"约1.5。
4.5.2 Walk-forward validation
把数据分N段(5或10),每段优化在前段、测试在当段。只有walk-forward Sharpe稳定>1才能上实盘。In-sample Sharpe 3 + walk-forward Sharpe 0.5 = 严重overfit。
4.5.3 White's reality check + Hansen's SPA test
用Bootstrap重采样1000+次估计参数集Sharpe的p-value。crypto里我推荐Hansen's SPA(Superior Predictive Ability)。
4.5.4 Data snooping的隐性形式
最隐性的overfit不是参数过多,而是研究路径过多:你试了100个idea,只publish这1个最好的。即使每个idea只用2个参数,你的de facto $N$是 $100 \times 2 = 200$。
对策:保留完整的research log,每次失败的尝试也记录。如果后续要审视某策略,看它是从什么"全局空间"被选出的。
关键洞察 #4:回测漂亮 ≠ 策略好。回测漂亮的99%概率意味着你掉进了上面5个陷阱之一。好的研究员不是回测Sharpe最高的人,而是把回测Sharpe按陷阱discount后还活着的人。
第5章 风险管理:3层结构
风险管理不是策略的"附加项",而是与策略同时设计的核心部分。我把所有风控措施归类到三层:交易前(pre-trade)、运行中(runtime)、交易后(post-trade)。
5.1 Pre-trade风险(决定能不能下单)
5.1.1 仓位限制(Position Limit)
| 维度 | 上限示例 | 检查频率 |
|---|---|---|
| 单一symbol | $5M notional | 每笔下单 |
| 单一venue | $20M total | 每笔下单 |
| 单一策略 | $10M | 每笔下单 |
| 总账户 | $50M | 每笔下单 |
| 单一资产concentrate | <30% of total | 每笔下单 |
Hard vs Soft limit:hard下单block;soft发警报但允许。
5.1.2 风险预算(Risk Budget)
Total VaR预算分配到各策略:
- Pairs trading: $50k VaR @ 99% conf
- Funding carry: $30k
- Market making: $40k
- 总预算: $150k (1日VaR)
算法:每个策略T-1时刻报当日expected VaR,总预算由risk engine分配。超预算策略减仓。
5.1.3 相关性约束
新仓位的β-to-existing-portfolio必须<阈值。例:新加BTC long时,与现有portfolio的BTC敞口correlation>0.8则reject。
5.1.4 Counterparty exposure
每个CEX的资金敞口不超过总资本X%。FTX崩盘后业内共识:单一交易所敞口不超过15%,private key自托管为主。
5.1.5 Pre-trade checks checklist
下单前必跑:
- ✅ Position limit
- ✅ VaR budget
- ✅ Liquidity check (orderbook depth ≥ 5x order size)
- ✅ Spread check (bid-ask spread ≤ 1.5x normal)
- ✅ Funding rate sanity (no extreme value)
- ✅ Funding window (距下次funding < 30min则只允许reduce)
- ✅ Settlement window (option/期货临近settlement减仓)
- ✅ News/event filter (重大事件前1h停下单)
5.2 Runtime风险(运行中持续监控)
5.2.1 VaR/ES (CVaR)
- VaR (Value at Risk) at 95%: 损失不超过该值的概率为95%。
- ES (Expected Shortfall) / CVaR: tail loss平均值,更适合crypto的fat tail。
crypto特殊处理:
- 用historical VaR(empirical),不用parametric VaR(高斯假设fail)。
- Window推荐30-180天,过短(<30)噪声大,过长(>365)忽略regime变化。
- VaR要按regime切换。Crisis期VaR可能是平时的5倍。
5.2.2 最大回撤熔断
- Soft DD: 单日回撤>2% → 减仓50%
- Hard DD: 单日回撤>5% → flat all + 24h cooldown
- Total DD: 累计回撤>15% → 完全停机 + risk review
数字按你的Sharpe调整:Sharpe 2策略DD应<10%;Sharpe 0.5策略可允许15-20%。
5.2.3 流动性风险监控
实时metric:
- Bid-ask spread增加>2x normal → 警报
- Top-5 levels depth减少>50% → 警报
- 单笔大单(>10x avg)出现 → 警报
- 自己的position占pool TVL >5% → 必须缩小单仓
5.2.4 Greeks残留监控(衍生品)
- Net Delta: |Δ| < $100k
- Net Gamma: $|Γ| < ...$ (按vol scaled)
- Net Vega: |V| < $50k per vol point
- Theta: 总Theta<-$5k/day时检查仓位结构
5.2.5 Heartbeat/连接监控
- 每10s检查每个交易所WebSocket连接
- 5s无心跳→警报
- 30s无心跳→自动降级到REST polling
- 60s无连接→紧急平仓 + 全停
5.3 Post-trade风险(事后归因)
5.3.1 PnL归因
三层归因:
Total PnL = Strategy alpha + Beta exposure + Cost
├── Strategy alpha: (理论收益 - benchmark)
├── Beta: BTC敞口 + 其他 + funding carry
└── Cost: fee + slippage + gas + MEV
每日checklist:
- 总PnL ✓
- 拆解到每个策略
- 拆解到fee vs slippage vs alpha
- 与回测预期对比,偏差>30%→深度复盘
5.3.2 实盘 vs 回测 reconciliation
每周对比:
- 每日实盘PnL vs 当日"虚拟回测"(用同样logic在同一价格series上跑)
- 持仓时长分布
- 胜率
- 最大单笔PnL
差异>20%是warning sign,调研3天,差异>40%停机review。
5.3.3 Greeks残留(期权策略)
每日close后:
- 计算intended Greeks(应该是什么) vs actual Greeks(实际是什么)
- 残留Delta/Vega是"无效的方向暴露"
- 累积超过预算时主动hedge
5.3.4 数据/模型drift检测
- 模型residual分布(用KS test对比训练时分布)
- 信号strength(信号上分位与下分位的实盘收益差)
- 因子稳定性(IC、ICIR的滚动估计)
drift detected → 立即paper trade新校准 → 1-2周稳定后切换。
关键洞察 #5:Pre-trade风控的目标是"不犯错",runtime风控是"早发现", post-trade风控是"持续学习"。三层缺一不可,同时复杂度也是这个顺序——pre-trade最简单(boolean check),post-trade最深(要做归因和模型drift检测)。
第6章 从研究到实盘:工程化路径
研究跑通的Jupyter Notebook到实盘真的拿出去赚钱,中间隔着5个阶段、3-6个月时间。这一章是给"研究做出来Sharpe 3但不知道下一步"的人。
6.1 阶段1:研究(Jupyter + Pandas)
目标:验证idea是否成立,得到初步Sharpe估计。
工具栈:
- Jupyter Notebook
- pandas + numpy + scipy
- statsmodels / scikit-learn
- matplotlib / seaborn
deliverable:
- 一个Notebook from data load to backtest result
- 至少5年历史数据
- 至少 in-sample Sharpe + out-of-sample Sharpe
通过标准:
- IS Sharpe > 1.5 AND OOS Sharpe > 1.0
- Max DD < 30%
- 跨2个regime表现都positive(即使其中一个低)
阶段1时长:1-3周
6.2 阶段2:回测(vectorbt + 自定义框架)
目标:用production-grade回测框架重新验证,加入完整成本模型。
工具栈:
- vectorbt(pandas-based高速回测)
- backtrader / zipline (event-driven,更接近实盘)
- 自研的tick-level回测器(如果是HF)
改进重点:
- 显式建模fee/slippage/gas/funding
- 用point-in-time universe
- walk-forward validation
通过标准:
- 加入完整成本后Sharpe仍>1.0
- Walk-forward Sharpe > 0.8
- 最大单日DD < 5%
- 每月kill rate(连续3天负PnL不开仓)触发<2次
阶段2时长:2-4周
6.3 阶段3:paper trading(CEX沙盒 / 测试网)
目标:实盘环境跑代码但不投真钱,发现工程bug。
工具栈:
- Binance Futures testnet
- Bybit demo
- Goerli/Sepolia/Holesky for Ethereum
- Solana devnet
重点验证:
- Order placement / cancel / modify的latency
- 网络断连恢复
- 交易所API的错误码处理
- 自己代码的死锁/race condition
指标监控:
- 信号触发到下单的延迟<100ms (mid freq) / <10ms (HF)
- API error rate < 0.1%
- 持续7天0故障运行
通过标准:
- 7连续日无bug
- Paper PnL与回测PnL差异<20%
阶段3时长:2-4周
6.4 阶段4:小资金主网(< $10k)
目标:用真钱跑,但风险敞口很小,发现paper trade发现不了的问题。
典型差异:
- 真实流动性<paper(fill rate会下降)
- MEV/wash trading等真实market参与者
- 监管/合规边界(KYC limit、地区限制)
- 资金调拨成本(withdraw、cross-exchange)
仓位:每个策略<$5k,总<$10k 期望:
- 实盘Sharpe下降30-50%是正常的
- 如果下降>70%,回研究阶段
- Max DD不应>2x回测的max DD
阶段4时长:4-8周
6.5 阶段5:scale up(资金/标的/策略数)
目标:把资本量、策略数、覆盖的标的逐步扩大。
scaling原则:
- 资本量:每周加50%,前提是上周PnL正且风险指标正常。
- 新symbol:先paper 2周再small money 2周再normal。
- 新策略:完整走一遍阶段1-4,不要"借旧框架"省略。
- scale极限:当增加资本边际Sharpe下降>30%(capacity constraint),停止scale。
容量监控:
- 总仓位 / 单日volume:>5%意味着你已经是市场,不再是搭便车。
- 平均slippage per dollar: 持续上升说明hit了capacity。
阶段5时长:6-24个月(持续)
6.6 工程化checklist
- Code in version control (Git)
- Tests >70% coverage
- CI/CD自动跑回测
- Logging全链路(structured JSON)
- Monitoring (Grafana + Prometheus)
- Alerting (PagerDuty / Telegram)
- On-call rotation
- Disaster Recovery plan (DR runbook)
- 资金分散在多个交易所
- Hot wallet / Cold wallet分离
- Multi-sig + hardware wallet for cold
6.7 团队 vs 个人路径
个人(1人):
- 阶段1-2:1-2个月
- 阶段3-4:2-3个月
- 实盘$10k-100k
- 可持续运营3-5个strategy
- 年化期望:$10k-100k baseline,运气好$1M+
小团队(2-5人):
- 一人专注研究,一人专注工程,一人风控
- 阶段1-2:2-3周
- 阶段3-4:1-2个月
- 实盘$1M-10M
- 可持续运营10-30个strategy
机构级(10+人):
- 完整research/eng/risk/ops分工
- 数据/基础设施有专门团队
- $50M+
- 50-100+strategy
关键洞察 #6:从研究到实盘的工程化路径不是"加几行错误处理",而是把研究品质的代码彻底重写一遍以满足production需求。低估这一步的人都会在阶段4交学费。
第7章 加密专属:MEV与链上量化
这一章是crypto最独特的部分。MEV和链上量化没有TradFi对应物——理解它需要从头学。
7.1 MEV作为成本 vs MEV作为利润
MEV的double-edge sword:
- 你做DEX swap → MEV是你的成本(被sandwich、frontrun)
- 你做searcher → MEV是你的利润
作为成本(避免):
- 用Flashbots Protect / CowSwap / 1inch Fusion (Intent-based) 把交易送到private mempool
- 减少slippage tolerance(但fail rate上升)
- 拆单(MEV searcher抓的是大单,小单不值得sandwich)
- 时机选择(gas高时sandwich profit margin被压缩)
作为利润(搜索者):
- Atomic arb:DEX-to-DEX/CEX-to-DEX价差,单block完成
- Liquidation:清算underwater仓位赚清算奖励
- Sandwich:(道德灰区,不推荐)
- JIT liquidity:UniV3集中流动性JIT mint+burn
Searcher现状(2026-Q3):
- Top 10 searchers占据85%+ MEV利润
- Atomic arb毛利润$50M-500M/月(Ethereum mainnet)
- 工程门槛极高:node infra + simulation + 极致延迟
7.2 链上量化的额外考量
| 维度 | TradFi | CEX crypto | DEX/链上crypto |
|---|---|---|---|
| Settlement | T+1或instant | instant | instant on-chain |
| Latency | μs | 5-50ms | 50-2000ms (block time) |
| Reorg risk | 无 | 无 | 有(特别是Solana) |
| Gas/Fee | 固定 | 动态但known | 动态且变化大 |
| 私密性 | 高 | 中 | 公开(除private mempool) |
| Bundle原子性 | N/A | 单笔atomic | 整block bundle atomic |
| Builder/Relay | N/A | N/A | 必须理解mev-boost |
| Failure mode | rejected | rejected | 链上回滚但仍付gas |
链上特殊错误:
- Failed tx仍付gas:DEX swap revert(slippage超阈/被抢/oracle fail)会付50-200k gas,单笔$2-50。回测必须包含failed tx的成本。
- Reorg导致已成交回滚:Solana上1-2%的tx在5s内可能reorg。处理方法:等够confirmation + 标记unsafe tx。
- Block congestion:bull市Ethereum gas可冲到500 gwei(vs normal 20),单笔swap成本20-50倍。
7.3 OFA对最佳执行的改变
OFA = Order Flow Auction,把user的orderflow拍卖给solver(通常以保证最优价为优胜条件)。代表项目:
- CowSwap (CoW Protocol)
- 1inch Fusion
- UniswapX
- Bebop / Hashflow (RFQ-based)
对量化的影响:
- 如果你是user:OFA给你比直接DEX swap好的价格(因为solver做CoW + 内部batch + MEV-protected execution)。
- 如果你是searcher/MM:OFA是新的alpha source——成为solver需要建simulation能力 + capital。Top-tier solver如Wintermute/Jane Street/Tokka Labs都在抢这块。
- 传统DEX MM受冲击:OFA bypass了Uniswap/Curve的pool,传统LP收入下降。
OFA量化:
- 监控orderflow market share(CowSwap占比、1inch Fusion占比)
- 理解每个solver的策略(CoW vs RFQ vs hybrid)
- 评估自己的策略是否应该转型为solver
关键洞察 #7:MEV和链上量化是crypto最大的paradigm shift。如果你只在CEX做策略,你错过了链上80%的alpha。但同时链上量化的工程门槛也极高——单干很难,要么和团队合作,要么从CEX strategy入手。
第8章 alpha衰减的7种形态
每个alpha都会衰减。理解衰减形式才知道什么时候放弃、什么时候坚持、什么时候切换。
8.1 信息扩散(Information Diffusion)
机制:你发现的pattern,别人也发现,越来越多人交易→pattern消失。
例子:
- 2020-2021 Curve 3pool与yEarn的carry trade,初期年化40%,2022年压缩到5%。
- 2021-2022 stETH-ETH spread arb,初期spread常达-5%,2024年压缩到-50bps。
信号:
- Sharpe按时间monotonic下降
- 信号触发后填单时间变长
- Twitter/Discord有人公开讨论你的策略
应对:
- 已经在赚钱→继续,但放低预期
- 还没开始→别做(除非有自己independent edge)
8.2 资金流入(Capital Inflow)
机制:alpha source容量有限,更多资金进入挤压收益。
例子:
- Funding carry arb:BTC perp historical funding 0.01% (8h),2023-2024年大量capital涌入后挤压到0.005%。
- LP挖矿:Curve gauge最初年化几百%,后期被bribery+CRV emission稀释到20-50%。
信号:
- TVL/AUM显著增长
- 同一时刻同向flow明显(看链上大单)
应对:
- 预估总capacity,自己仓位<10%是安全线
- 超过capacity就接受alpha decay
8.3 市场结构变化
机制:交易所/链/工具升级改变市场。
例子:
- Ethereum The Merge (2022-09):PoW → PoS,MEV分配从miner变到validator+builder。
- Uniswap V2→V3:concentrated liquidity让做市完全重写。
- Solana性能升级:本来无法做的策略变可行。
信号:
- 协议announcement
- testnet/devnet出现新功能
应对:
- 关注RIP(Roadmap Improvement Proposal)/ EIP/ chain announcements
- 提前paper trade新机制
8.4 监管压力
机制:监管行动直接关掉某些策略或加大成本。
例子:
- 2022年OFAC制裁Tornado Cash,私密性策略失效。
- 2023-Q3 SEC对币安/Coinbase的诉讼,影响美国用户tradable universe。
- MiCA(2024年生效)改变欧盟稳定币流动性。
信号:
- Reuters/Bloomberg的监管新闻
- 律所发的compliance update
应对:
- 多管辖地多账户分散
- 不要在single jurisdiction risk上集中
- 维护legal counsel关系
8.5 技术升级(合约/链升级)
机制:合约或链的升级改变策略经济模型。
例子:
- Aave V2→V3:interest rate model改变了borrow rate,影响looping strategy。
- Compound引入Comet:cTokens接口变化,旧的integration broke。
- Solana DApp更换pricing oracle,arb path改变。
信号:
- GitHub commit
- Governance proposal
应对:
- 订阅核心协议的GitHub release
- maintain regression test覆盖关键interface
8.6 协议改版(fee调整/激励调整)
机制:协议参数调整改变经济模型。
例子:
- Uniswap调整fee tier(2024年加0.01% tier),改变LP收益。
- Curve的vote-locked CRV gauge weight调整,改变各个pool的emission。
- 期权交易所调整margin要求(Deribit 2025年Q3收紧),改变capital efficiency。
信号:
- Governance forum / Discord proposal
- 协议的treasury report
应对:
- 参与governance(持有token + vote)
- 多协议diversification
8.7 规模约束(Capacity Constraint)
机制:你自己的资金体量到达策略容量上限。
例子:
- Pairs trading在BTC-ETH上capacity约$50M(更大move spread本身)
- 单pool LP做市超过pool TVL 5%时edge显著下降
- ATM期权做市$50M position size开始move IV term structure
信号:
- 你的flow占总market flow > 5%
- 你的order明显move price
- Slippage显著上升
应对:
- 提前估算capacity,不要超过50%
- Capacity hit后,diversify到其他策略
关键洞察 #8:Alpha永远在衰减。健康的研究pipeline是3-5个alpha同时运行 + 每月找1-2个新idea + 接受老的fade out。永远不要把一个alpha当永久。
第9章 团队与组织:crypto量化团队的组成
9.1 角色组合
最小可行团队(3-5人):
| 角色 | 主要职责 | 必备技能 |
|---|---|---|
| Researcher | idea生成、统计/数学建模、回测 | Python/数学/金融知识 |
| Engineer | 数据基础设施、execution/OMS、live trading bot | Python/Rust/数据库/网络 |
| Risk/Ops | 风控monitor、操作CEX/钱包、清结算 | Excel/SQL+财务+合规 |
| (optional) PM | 产品方向、对外沟通、合规 | mixed |
| (optional) Analyst | 数据分析、链上research | Dune SQL/链上工具 |
机构级团队(10-30人):
- Quant Research(5-8人):分pricing/factor/alpha/risk research
- Engineering(5-10人):data/infra/execution/blockchain
- Risk(2-3人):market risk/credit risk/operational risk
- Ops(3-5人):treasury/settlement/compliance
- Tech support:DevOps/SRE
9.2 与传统对冲基金量化团队的差异
| 维度 | TradFi quant fund | Crypto quant fund |
|---|---|---|
| 团队规模 | 50-500人 | 5-50人 |
| 研究:工程比例 | 1:1 | 1:2 (eng more) |
| 主流人选 | PhD | mix of PhD和practitioner |
| Compensation | base+bonus | base+token equity+performance |
| 工作节奏 | 9-5 + on-call | 24/7 on-call |
| Tech stack | C++/KDB/Python | Python/Rust/Solidity |
| Rare role | DAO governance research, MEV searcher, on-chain forensics |
9.3 招聘信号(如果你是hiring manager)
好signal:
- 真实链上交易history(地址可验证)
- 公开的研究文章(Mirror/Substack/GitHub)
- 完整的side project(不只是tutorial)
- 能讲清楚回测的5个陷阱(一问就知道是不是真做过)
红旗signal:
- 只学过、没实操
- 不能解释自己的P&L attribution
- 仅会用某一框架(vectorbt/zipline)但不能脱离它思考
- 对MEV/Solana等"crypto-native"东西完全不了解
9.4 自己的path planning
如果你是想入crypto quant的个人,建议路径:
- Year 1:从CEX strategy入手(funding carry / pairs / market making),$10k-100k实盘。目标:能讲清楚自己的策略+attribution。
- Year 2:加入链上策略(DEX arb/JIT/atomic searcher),形成全栈。目标:能在面试里展示完整pipeline。
- Year 3:要么加入机构(Wintermute/GSR/Cumberland/Jump),要么创业(个人fund/prop shop)。
关键洞察 #9:crypto量化团队的"小而精"特点是它的优势也是它的劣势。优势:决策快、灵活;劣势:人手不够,每个role都要overlap。新人加入时永远是"被三件事同时拖累"——要适应这种节奏。
第10章 展望与开放问题
10.1 AI agent作为新型市场参与者
2025-2026年看到的现象:
- AI agent在Polymarket/Hyperliquid/UniswapX大量出现
- Virtuals Protocol/ai16z等让agent经济可tokenize
- LLM-driven trading agent(如Trump Trading Agent on Polymarket)单仓位达$1M+
对量化的影响:
- 新的orderflow source(AI agent vs human)
- AI agent的策略可被反向engineer(它们用什么模型?)
- AI agent的vulnerabilities可能成为新的alpha
开放问题:AI agent是否会形成自己的"market regime"?是否会出现"AI vs AI"博弈进入纳什均衡,让human alpha彻底被挤出?
10.2 RWA/合规化对crypto量化的影响
2025-2026 RWA趋势:
- BlackRock BUIDL fund达到$50B
- Ondo / Centrifuge把treasury yield带上链
- USDC/USDT合规化压缩稳定币arb空间
对量化的影响:
- 利率类策略重新出现(接触美债收益曲线)
- 合规要求增加,"匿名交易"门槛上升
- Institutional money inflow提供更深liquidity
开放问题:当crypto"传统化"后,crypto-native alpha还剩多少?是否最终所有crypto策略都变成"传统策略+24/7"?
10.3 5个未解决问题
- Crypto期权smile为什么这么陡?:相比股票期权SABR/Heston解释得很差,是市场不成熟还是有结构性原因?
- Funding rate的真实alpha是什么?:经过capital inflow压缩后,是否还有可持续edge?
- MEV 2.0是什么样?:PBS、ePBS、SUAVE、Multi-Block MEV等会如何重塑链上量化?
- 跨链arb的最终形态?:account abstraction + intent-based system让"跨链"模糊化,cross-chain MEV是新领域。
- AI agent市场的新均衡?:human+AI共存的市场会如何reach equilibrium?
关键洞察 #10:crypto量化作为一个领域才10年,现在处于"已经很难但还会更难"的阶段——已经过了"随便挂个策略就赚钱"的红利期,但远没到"传统市场效率"的终点。未来3-5年仍是黄金期,但门槛在快速上升。
附录A 工具链推荐表
A.1 数据
| 类别 | 工具 | 价位 | 用途 |
|---|---|---|---|
| CEX历史数据 | Tardis.dev | $1-5k/月 | tick-level全交易所 |
| CEX历史数据 | Crypto Lake | $0.5-2k/月 | 价格友好替代 |
| CEX历史数据 | Kaiko | $5-50k/月 | 机构级 |
| 链上RPC | Alchemy / Infura / QuickNode | $0-2k/月 | 标准RPC |
| 链上archive | Erigon自建 / Chainstack | $200-2000/月 | 完整历史 |
| Subgraph | thegraph.com | free + pay-per-query | 索引化的链上数据 |
| 链上分析 | Dune / Flipside / Footprint | free + pro tier | SQL分析 |
| 标签数据 | Nansen / Arkham | $1-5k/月 | 地址聚类 |
| 期权数据 | Deribit Insights / Laevitas | free / $200/月 | option chain & IV |
| MEV数据 | mevboost.pics / EigenPhi / Eden | free / paid tier | MEV分析 |
A.2 回测
| 工具 | 适用 |
|---|---|
| pandas + numpy | DIY,最灵活 |
| vectorbt | 中频,pandas-based高速 |
| backtrader | event-driven |
| zipline | 学院派 |
| QuantConnect Lean | 完整云端 |
| 自研Rust/C++ | tick-level HF |
A.3 执行
| 工具 | 适用 |
|---|---|
| ccxt | python,所有CEX统一接口 |
| Hummingbot | 开源做市机器人 |
| FreqTrade | 开源trading bot |
| Hyperliquid SDK | Hyperliquid专用 |
| web3.py / ethers.js | EVM链下单 |
| anchor (Rust) | Solana链下单 |
| Flashbots SDK | bundle提交 |
A.4 监控
| 工具 | 适用 |
|---|---|
| Grafana | 可视化 |
| Prometheus | metric collect |
| Sentry | error tracking |
| PagerDuty / Opsgenie | alerting |
| Tenderly | 链上monitoring |
| Nansen Smart Alerts | whale监控 |
附录B 真实策略案例3则
B.1 案例1:BTC-ETH Pairs Trading
Hypothesis:BTC与ETH的price ratio在rolling 180d window内协整(除crisis期)。
Implementation:
- 数据:Binance USDT spot, 1m kline
- 信号:Engle-Granger Z-score with rolling window
- 进场:|Z|>2,仓位等量market neutral(BTC long $50k, ETH short equiv-$)
- 出场:|Z|<0.5
- Stop:|Z|>4 → flat all + 24h cooldown
实盘表现(2024-Q1 - 2026-Q2,30个月):
- Sharpe (gross): 1.45
- Sharpe (after fee/slippage): 1.05
- Max DD: 12%
- 平均胜率: 64%
- 平均hold time: 3.2 days
- 最大单笔损失: -$3.5k on $100k notional
回测 vs 实盘差异:
- 回测Sharpe: 1.85 (gross), 1.4 (after cost)
- 差异原因:协整断裂在2025-Q3(bear市)和2025-Q4(rapid bull rotate),实盘提前stop loss减少损失但也错过部分回归
B.2 案例2:BTC Perp Funding Carry
Hypothesis:当BTC perp funding rate持续显著>spot lending rate时,做空perp+long spot获carry。
Implementation:
- 数据:Binance funding rate每8h
- 信号:funding rate > 0.02% AND 7d MA > 0
- 进场:short BTC perp $100k + long BTC spot $100k
- 出场:funding rate < 0.005% OR 持仓>30日
- 风险控制:spread (perp-spot) <-2% → 立即unwind(防止basis crash)
实盘表现(2024-Q3 - 2026-Q3,24个月):
- 累计收益: 18.5%
- 实际vs回测: 实盘20%下降(funding compression)
- 最大DD: 4%(2025-Q3 funding突然negative)
- 平均年化: 9.2%
- Sharpe: 2.1
关键事件:
- 2025-Q3 LUNA-style事件后funding突然-15%三天,幸亏stop logic及时
- 2026-Q1 BlackRock spot ETF approval推high funding,连续30天0.05%+ → 那季度收益贡献最大
B.3 案例3:DEX Atomic Arbitrage Searcher
Hypothesis:Uniswap V3 / Curve / Balancer之间存在atomic arb机会,可在single block通过Flashbots bundle执行。
Implementation:
- Infrastructure: 自建Erigon archive node + custom simulation engine
- 监控:mempool subscription,识别即将mint/burn/swap的tx
- Path search: Bellman-Ford找最优arb path
- Execution: Flashbots bundle,priority fee + gas auction
实盘表现(2025-Q4 - 2026-Q3,12个月):
- 总gross profit: ~$2.8M
- Gas成本: ~$1.2M
- Bid loss to other searchers: ~$0.5M
- Net profit: ~$1.1M
- 月均: ~$92k
- Win rate (bundle accepted): 4.2% (其余被bid out或simulation fail)
关键挑战:
- Top-3 atomic searchers (txfusion / rsync / unknown) 拿走75%+市场
- 自建infra成本:$30k/月(archive node + bandwidth + collocation)
- 需要持续优化(每月新对手出现)
经验教训:
- 不建议个人入场(infra投入>预期收益)
- 适合作为更大team的一部分
- 与其做atomic searcher,不如做JIT LP或Cross-domain MEV
附录C 推荐阅读
数学/金融基础
- Hull, "Options, Futures, and Other Derivatives" (期权定价bible)
- Shreve, "Stochastic Calculus for Finance II" (随机微积分)
- Tsay, "Analysis of Financial Time Series" (时间序列)
- Cont & Tankov, "Financial Modelling with Jump Processes" (跳跃过程)
微观结构与做市
- O'Hara, "Market Microstructure Theory" (经典)
- Hasbrouck, "Empirical Market Microstructure" (实证)
- Avellaneda & Stoikov (2008), "High-frequency trading in a limit order book"
- Guéant, Lehalle, Fernandez-Tapia (2013), "Dealing with the inventory risk"
- Almgren & Chriss (2000), "Optimal execution of portfolio transactions"
- Kyle (1985), "Continuous auctions and insider trading"
统计套利
- Vidyamurthy, "Pairs Trading: Quantitative Methods and Analysis"
- Avellaneda & Lee (2010), "Statistical arbitrage in the U.S. equities market"
- Engle & Granger (1987), "Co-integration and error correction"
Crypto专属
- Liu, Tsyvinski, Wu (2022), "Common Risk Factors in Cryptocurrency", Journal of Finance
- Makarov & Schoar (2020), "Trading and arbitrage in cryptocurrency markets"
- Daian et al. (2019), "Flash Boys 2.0" (MEV foundational)
- Vitalik Buterin's MEV blog series
- Flashbots Research (research.flashbots.net)
- Paradigm Research blog
- a16z crypto research
工程/系统
- Kleppmann, "Designing Data-Intensive Applications"
- Aleksey Charapko's blog (distributed systems)
实操/实战
- Marcos López de Prado, "Advances in Financial Machine Learning" (核心方法论)
- Ernie Chan, "Algorithmic Trading: Winning Strategies and Their Rationale"
博客/Substack
- Vitalik Buterin: vitalik.eth.limo
- Hasu: substack hasu.substack.com (MEV, market structure)
- Doug Colkitt: 0xdoug Twitter (做市/DeFi)
- Tarun Chitra (Gauntlet): gauntlet.network research
- Paradigm Research: paradigm.xyz/writing
- Bankless / Delphi research
论坛/社区
- Flashbots Discord (MEV)
- ETHResearch forum
- Curve / Uniswap governance forum
- Quantopian / WallStreetQuants (传统但有用)
全文关键洞察总结
- 方法论独特性:crypto的5个独特性(24/7、流动性碎片化、链上链下、监管不确定、token经济内生)让每个TradFi方法都要重新审视。
- 数据决定上限:质量优先于复杂度,数据团队工作量是模型团队的3倍。
- 模型是parameter recalibration:经典模型(BS/A-S/Engle-Granger)的核心数学没变,但crypto的参数选择完全不同。
- 回测的5重陷阱:lookahead/survivorship/cost/regime/optimization——回测漂亮的99%概率掉进了其中之一。
- 风险管理3层结构:pre-trade(不犯错)+ runtime(早发现)+ post-trade(持续学习)。
- 从研究到实盘5阶段:研究→回测→paper→小资金→scale up,每阶段Sharpe都会衰减,正常。
- MEV是crypto最大paradigm shift:避免它(成本)或拥抱它(利润)。
- Alpha永远衰减:7种衰减形态都要知道,pipeline永远3-5个alpha同时运行。
- 团队"小而精":crypto团队规模远小于TradFi,每人overlap多个role。
- 未来3-5年仍是黄金期:门槛快速上升,但远未到效率终点。
版本说明
- v1.0 (2026-08-28):初版,基于60天Phase 2系统研究综合而成。
- 预计v2 (2027-Q1):加入"交易心理学与连续运营"、"AI agent作为搬运工的新机会"、"Solana/Sui/Aptos的quant差异"。
本文档处于持续演进中。任何产品/工程/研究上的反馈,请通过 GitHub issue 提交。
Disclaimer:本方法论文档不构成投资建议。所有数字、案例、收益率均为研究/回测结果,实际表现受市场条件、执行能力、风险管理多因素影响。Crypto交易有重大资本损失风险,请在自身能力范围内谨慎参与。
END OF DOCUMENT