로그인
← Glossary

过度优化(过拟合)

过度优化(过拟合)是把交易规则打磨得过分贴合历史数据,结果历史成绩单光鲜、放到新行情里却不管用的现象。可以理解为:把过去偶然出现的花纹也当成规律背了下来。当回测成绩好得不真实时,这是第一个要怀疑的陷阱。

想象一个把历年真题答案整本背下来的学生:重考真题能拿 100 分,但题目稍微一变的新考试就不及格。过度优化的交易规则正是如此——对历史K线这份“真题”完美贴合,在“新考试”也就是未来面前使不上力。

用数字看它怎么发生。假设“RSI 低于 30 就买”这条规则过去出现了 500 次、胜率 52%。嫌成绩不够好,就开始加条件——“只在周三”、“只在凌晨”、“只在 RSI 精确低于 28.3 时”。折腾下来,就能造出过去 5 次出现、5 次全涨、胜率 100% 的规则。但这不是发现了市场规律,只是把过去碰巧上涨的那几个瞬间,用条件倒推着包了起来。

之所以会这样,是因为把条件和数字的组合试上几百几千个,其中总有几个纯靠偶然和历史对得上。让 1,000 个人抛硬币,总会有人连出 10 次正面。那个人不是抛硬币大师;同理,几千个组合里历史成绩第一的规则,很可能不是实力,而是偶然选出的冠军。

识别过度优化有几个信号:样本数太少(不到几十次)、条件具体得奇怪(说不清为什么偏偏是 28.3)、数字稍微一改成绩就剧变(RSI 28 时大赚、30 时大亏)、只在特定时期灵——命中任何一条都该起疑。

减少它的办法并不华丽:保持规则简单、攒够样本、把数据按时期切开确认每一段的表现都差不多、务必把手续费算进去。越好的规则,往往越能用一句话讲完。

What the data actually shows

Baro 为了避开这个陷阱设了两道装置。第一,历史案例不满 40 次的组合干脆不公开——样本越少,偶然越容易装成实力。第二,把止盈目标切得很小就能让胜率看起来像 90% 这件事,我们也不隐瞒。胜率上升的同时期望盈亏反转为负的全过程,可以在信号目录各信号页面里按曲线原样确认。以后在别处遇到拿高胜率开路的策略,想想这条曲线。

Common misconceptions

“条件越多越精密的策略越好”——恰恰相反。每多一个条件,只贴合过去的风险就大一分。活得久的规则大多简单。

“历史胜率 90% 就是被验证过的”——先确认样本有几次。10 次里中 9 次还在偶然范围内。何况胜率光靠收窄止盈目标就能人为拉高,单看胜率什么也验证不了。

FAQ

Q. 怎么确认我的策略是不是过拟合?

没有完美的方法,但可以查三点:样本数够不够(至少几十次)、条件是否简单到一句话能说清、把规则里的数字稍微改动后成绩会不会崩。三项里有一项不满足,就要怀疑它是只对过去有效的规则。

Q. 带单群晒的华丽历史收益截图也是过拟合吗?

有可能是贴着历史K线凑出来的规则,或者是只把做对的结果挑出来展示的 cherry-picking。判别标准只有一个——是否连同条件一起,公开包含对与错在内的全部记录。不给看完整分布的成绩单,不算成绩单。

Related terms

回测胜率(Win Rate)期望盈亏(EV)
For reference, not a prediction. Term explainers and historical data are not a guaranteed direction.
barobara.com · not a signal group — honest term explainers