BH TERMINALBlackHole Institutional返回网站
洞察

Risk Management / 9 min read

加密策略回测:如何避免自欺欺人

回测真正衡量的是什么,过拟合陷阱,样本内与样本外测试的区别,以及为何期望值和最大回撤比胜率更重要。

对加密货币交易策略进行回测,感觉像是一门科学。你将历史价格数据输入系统,看着净值曲线向上倾斜,并说服自己已经找到了某种优势。但大多数时候,你什么都没发现,只不过得到了一条拟合历史数据的曲线。发现真实优势与制造一份漂亮回测之间的区别,是系统化交易中最重要的分野之一,而加密货币市场使这一错误的代价异常高昂。

首先明确回测的本质。你将一套固定规则应用于历史数据,衡量若在该时段按这些规则实际交易会产生怎样的结果。它只告诉你一件事:这些规则在特定数据集上、在该时间窗口内所呈现的历史条件下的表现。它对未来将发生什么毫无预测力。这听起来显而易见,但交易者常常将表现优异的回测误当作未来盈利的证据。两者之间的鸿沟,正是大多数系统化交易策略走向消亡的地方。

样本内与样本外的区分,是流程中纪律性首先显现之处。样本内数据是用于开发和优化规则的历史时间窗口;样本外数据则是你完全隔离、仅在开发完成后使用一次的数据,作为检验规则是否能够泛化至设计周期以外的最终测试。典型的错误是对全部可用数据进行优化,然后将结果称为回测。你实际上只是找到了最能描述历史的参数组合——这是一个描述引擎,而非预测引擎。规范的流程应将样本内数据用于构建,将30%至40%的历史数据锁定保留,并仅在所有参数决策冻结后,才在该保留窗口上进行测试。若样本外表现相对样本内大幅退化,则说明存在过拟合。

过拟合(又称曲线拟合)是系统化策略开发的核心顽疾。当你为模型增加足够多的自由度——足够多的参数、条件和过滤器——策略实际上会记住训练数据,而非学习市场的结构性规律。一个针对七年BTC小时数据进行了十二个参数优化的策略,即便回测结果看似卓越,也几乎可以确定存在过拟合。检验过拟合的标准不是净值曲线,而是策略逻辑是否对应某种可识别、可重复且具有持续存在理由的市场动态。若你无法用一句话解释买卖双方为何会持续如此行事,那么这个优势很可能只是优化过程中产生的统计假象。

加密货币市场对样本量的要求常被低估,部分原因在于交易者将多年数据视为天然充足。但若策略交易频率较低,这种认知是错误的。一个每年产生30笔交易、运行三年的策略,回测中仅有90笔交易记录。用于检验优势的统计显著性通常要求至少200至400笔交易,具体取决于结果的波动程度。在仅有90笔交易的情况下,对相同收益分布进行蒙特卡洛模拟将产生从灾难性到卓越不等的各种净值曲线——这些都与相同的底层期望值相符。90笔交易中呈现的胜率和平均R值,几乎不能提供任何可靠信息。样本是否有意义,取决于交易频率与时间跨度的乘积,而非时间跨度本身。

加密货币中的前瞻性偏差值得特别关注,因为与股票市场相比,它更容易被无意间引入。在传统回测框架中,前瞻性偏差通常是指使用未来价格或未来指标值来生成信号。在加密货币中,它以更隐蔽的形式出现。使用日收盘价模拟日内入场,意味着假设你在收盘之前就已知晓收盘价。使用事后汇总的订单簿数据,引入了实时状态下并不存在的信息。许多加密货币数据供应商从交易数据重建OHLCV K线,而其处理稀疏交易时段或交易所宕机的方法,会引入系统性扭曲结果的不一致性。在仔细核实数据来源的方法论之前,请默认你的数据存在问题。

加密货币还面临使回测比股票市场复杂得多的结构性挑战。大多数山寨币的流动性极为稀薄,你模拟的成交在测试规模下根本无法实现。一个在2024年币安上每笔交易执行0.5 BTC的策略,测试结果或许尚可。但若以等额美元规模对某个中市值山寨币测试相同策略,则是在模拟那些本会对市场造成显著不利冲击的成交。期货平台在高波动时期的宕机,会造成任何回测都无法复现的执行缺口。永续合约的资金费率机制在不同市场周期中剧烈变化,忽视资金成本的策略可能在回测中显示盈利,而在实盘中持续亏损。费用建模必须精细化——包括挂单与吃单费率、阶梯式费率结构,以及超出报价费用之外的实际滑点——否则回测结果必然偏于乐观。

正向测试是历史验证与实盘资金部署之间的桥梁。策略在通过样本内优化和样本外测试后,应在真实市场条件下以最小规模交易——或以模拟交易形式进行,尽管真实执行更具教益——并追踪实盘表现是否符合回测预测的统计分布。关键问题不在于策略在正向测试窗口内是否盈利,而在于逐笔交易的特征——平均盈利、平均亏损、结果方差——是否与回测预测一致。若出现显著背离,意味着要么回测存在缺陷,要么市场条件已发生变化,导致该优势失效。

真正重要的指标,并非大多数交易者所报告的那些。脱离盈亏比单独谈论胜率几乎毫无意义。35%的胜率配合平均3R的盈利,优于65%的胜率配合平均0.8R的盈利。期望值——每单位风险的平均收益,计算方式为(胜率乘以平均盈利)减去(败率乘以平均亏损)——是最重要的单一指标。夏普比率高于1.0,表明相对波动性而言回报尚属合理。最大回撤与恢复系数——净利润除以最大回撤——揭示策略能否在不可避免的连续亏损期中存活。一个期望值较高但恢复系数低于2.0的策略,需要大多数交易者在实践中难以坚持的资金管理纪律。

可操作的框架如下:仅在样本内数据上构建,冻结所有参数,在样本外数据上运行一次测试,要求组合样本中至少有300笔交易,核实数据来源的方法论,对费用和滑点进行保守建模,并且在样本外结果令人满意之前不进行正向测试。若首次运行结果不理想,正确的应对不是反复优化直至通过,因为那样做会彻底消弭样本内与样本外的界限。先衡量,再判断优势是否真实存在。

研究语境

如何使用:加密策略回测:如何避免自欺欺人

本内容与 backtest crypto strategy, crypto backtesting, overfitting trading, trading strategy testing 相关。在 BlackHole 框架中,先阅读市场语境,再等待确认,最后才判断执行质量是否足够。

语境

先观察市场状态、流动性位置和周围结构。

确认

区分早期兴趣与真正支持场景的证据。

执行

把想法转化为风险、时机和清晰的决策流程。

分享这篇研究笔记

发给更重视背景而不是盲目信号的交易者。

TelegramX

BH Terminal 工作流

把研究转化为结构化决策流程。

使用公开工具在入场前定义风险,或申请 BlackHole 私有生态的早期访问。

相关洞察

继续沿着结构、流动性与执行质量的研究路径前进。