回測期間長不等於樣本夠。真正決定回測可不可信的,是交易次數,不是年份。
一個常見的自我安慰
「我的策略回測了五年,夠了吧?」
這句話我聽過無數次。五年聽起來很長,資料量也不少,應該夠有說服力了——對吧?
不一定。如果你的策略五年只交易了 30 次,那你的回測結果在統計上幾乎沒有意義。反過來,一個只回測一年但有 500 筆交易的策略,可信度可能高得多。
關鍵不是「你看了多少年的資料」,而是「你的策略在這些資料裡做了多少次決策」。
為什麼交易次數比年份重要?
想像你在丟銅板。
你丟了 10 次,出現 7 次正面。你會說這個銅板「偏向正面」嗎?大概不會。10 次太少了,7:3 的比例可能只是運氣。
但如果你丟了 1,000 次,出現 700 次正面——這就很可疑了。1,000 次樣本下出現這種偏差,純靠運氣的機率極低。
回測的邏輯完全一樣。
你的策略賺錢,可能是因為它真的有效,也可能只是剛好碰到有利的市場環境。交易次數越少,你越無法區分「真正有效」和「純屬運氣」。
那到底要多少筆交易?
沒有一個放諸四海皆準的數字,但有些經驗法則:
最低門檻:30 筆
統計學上,30 是一個常見的「大樣本」起點。低於 30 筆交易的回測,基本上什麼都無法證明。
但 30 筆只是「可以開始看」的門檻,不是「可以信賴」的門檻。
比較可靠:100 筆以上
大部分量化交易文獻建議至少 100 筆交易,才能對策略的績效有初步的統計信心。
100 筆交易讓你可以比較合理地估計勝率、平均獲利、平均虧損這些基本指標。
更嚴謹:200-300 筆以上
如果你要評估更細緻的統計量——像是最大連續虧損次數、回撤分佈、獲利的穩定性——你需要更多樣本。
200-300 筆交易是很多專業量化團隊的內部標準。
年份長不等於樣本多
這是很多人搞混的地方。
一個月交易一次的策略,回測五年只有 60 筆交易。一個每天交易的策略,回測一年有超過 250 筆。
哪個樣本更充足?後者。
但大部分人會覺得「五年」比「一年」更可靠,因為直覺上五年覆蓋了更多市場環境。這沒錯,但如果交易次數不夠,你對每種市場環境的觀察都只有寥寥幾筆,根本無法得出有意義的結論。
回測的可信度 = 交易次數 × 市場環境的多樣性
兩者缺一不可。
樣本不夠會怎樣?
高估勝率
假設你的策略真實勝率是 50%(跟丟銅板一樣)。如果你只有 20 筆交易,出現 65% 勝率的機率大約是 12%。聽起來不高?但考慮到你可能測試了很多策略,總有一個碰巧跑出高勝率——這就是資料窺探的陷阱。
低估風險
20 筆交易裡,你可能碰巧沒遇到極端行情。你以為最大回撤只有 10%,但那只是因為你的樣本裡沒有黑天鵝。一上實盤,第一個大波動就讓你見識到真正的回撤。
過擬合的溫床
樣本越少,越容易找到「看起來有效」的規律。因為在小樣本裡,隨機雜訊就能產生漂亮的曲線。這是過擬合最肥沃的土壤。
一個簡單的檢驗方法
下次看到一個回測結果,先問一個問題:
這個策略在回測期間總共交易了幾次?
- 低於 30 次:直接忽略,統計上無意義
- 30-100 次:參考就好,不能當真
- 100-200 次:可以開始認真評估
- 200 次以上:統計上比較有信心
然後再看這些交易是否涵蓋了不同的市場環境——多頭、空頭、盤整、高波動、低波動。如果 200 筆交易全都在一個大多頭行情裡,那跟 50 筆交易的價值差不多。
結語
「我的策略回測五年」不代表任何事情。五年只是時間,不是證據。
真正的問題是:在這五年裡,你的策略被市場考驗了幾次?每次考驗的環境夠不夠多元?
樣本數不夠的回測,就像只考了一次期中考就宣稱自己是學霸。也許你真的厲害,但一次考試說明不了什麼。
下一篇,我們聊一個更根本的問題——為什麼「年化報酬率」可能是回測報告裡最會騙人的數字?很多人被這個數字迷惑,卻忽略了更重要的東西。



















