日前看到幾則帶有驚奇數字的新聞,(1). 某人膽結石5000餘顆,正常人的膽結石約10~20顆、(2). 土耳其第一大城伊斯坦堡罕見大暴雪,24小時內積雪50多公分、(3). 俄羅斯的奧伊米雅康鎮,號稱是最低溫的人類定居地點,在零下53度的條件下舉辦馬拉松比賽,參賽年齡最高者是75歲。
以上都可用經驗法則直接判斷是超乎異常的數字,但在開發交易策略時,如何偵測異常極端值(突破訊號),則可借用前人的統計檢定方法。
統計檢定異常值的方法頗多,本文介紹的是小樣本極端值的Dixon檢定
本方法使用的限制為
(a). 樣本數至少三個、
(b). 樣本採自常態分配
檢定方法程序如下 :
將n個樣本由大而小依序排列,排列後為X(1)、X(2)、...、X(n),
檢定統計量為
樣本數界於4~7時,檢定統計量 r = X(2)-X(1) / X(n)-X(1)
樣本數界於8~10時,檢定統計量 r = X(2)-X(1) / X(n-1)-X(1)
樣本數界於11~13時,檢定統計量 r = X(3)-X(1) / X(n-1)-X(1)
樣本數界於14~25時,檢定統計量 r = X(3)-X(1) / X(n-2)-X(1)
統計檢定量的臨界值可透過下表查詢,只要超過臨界值,就拒絕虛無假設,拒絕X(1)該數值來自相同母體的虛無假設
參考的MC程式碼如下
Vars:x(0),y(0),z(0);
x=NthHighest(3,High,25);
y=Highest(High,25);
z=NthLowest(3,High,25);
If y-z<>0 then begin
If y-x>0.406*(y-z) then Buy next bar at Highest(High,25) stop;
End;