样本数量(N)
同样是“胜率 70%”,分量可以完全不同。抛硬币 10 次出 7 次正面很常见——公平的硬币也大约每 6 次里有 1 次会这样。但抛 1,000 次出 700 次正面几乎不可能。前一个 70% 可以用偶然解释,后一个 70% 是硬币本身不对劲的证据。
交易统计一模一样。10 笔交易得出的胜率 70%,就算真实实力只是抛硬币(五五开)也完全可能出现。反而 200 笔交易得出的胜率 55% 可能有意义得多。比数字大小更优先的,是这个数字出自多少个案例。
图表信号里,越稀有的信号 N 越小。条件越极端(例如 RSI 跌破 20),翻遍几年的数据也只有几十个案例。这种信号的胜率,只要几个案例变动就会大幅晃动,读这些数字要格外小心。
N 小的时候还有另一个问题:挑拣(cherry-picking)。把条件换来换去试上几十种组合,纯靠偶然也会有几个跑出像样的胜率。只把好看的那个拿出来展示,看着像重大发现,实际上和反复玩“抛 10 次硬币”、只晒运气最好那一局是一回事。
所以不管在哪里看到胜率或收益率,都条件反射地问一句:“N 是多少?”对这个问题避而不答的统计,先过滤掉也无妨。
What the data actually shows
Baro 在所有胜率·期望盈亏旁边都标着案例数(N),案例太少的组合干脆不下结论。能上统计页面的信号,也只挑历史出现次数超过一定标准的。例如像 RSI 深度超卖(日线)这种很少亮起的信号,案例少、数字晃得厉害——请务必连页面上写的 N 一起看。全部信号列表在信号统计。
Common misconceptions
“连中 10 次就是实力?”如果押方向是五五开,10 连中的概率是 1/1,024。看着很低,但 1,024 个人各押一遍,平均就有 1 个人全中。社交平台上只看得见那 1 个人,其余 1,023 人悄悄消失——这叫幸存者偏差。短暂的连中,很难成为实力的证据。
FAQ
Q. N 有多少个才算可信?
没有一刀切的答案,但几十个级别的样本里,胜率上下晃 ±10 个百分点以上很正常。Baro 选择对案例少的组合不下结论。重要的是养成任何数字都和 N 一起读的习惯。
Q. N 大就可以无条件相信吗?
N 再大,如果数据集中在特定时期(比如牛市),或者未来市场性质改变,也会失准。大 N 是最低条件而不是充分条件,历史统计终究只是过去的分布。