美股原始 8,000 家 → 清洗後剩 5,000 家的異常排除邏輯
美國原始上市公司約 8,000 家,但我不是全部都拿來分析。
我使用一套異常排除模組,針對每一家公司進行清洗,最終只留下約 5,000 家能夠進行年K報酬分析的標的。
以下是我排除的異常條件:
🧹 資料清洗與異常排除邏輯

🧠 清洗後的好處
- 每一筆年K報酬都來自「可交易、邏輯正確、無企業行為干擾」的樣本
- 不會因為拆併或配股導致報酬率失真
- 不會因為冷門股或便士股造成統計偏誤
- 每一張圖表都能放心解讀,不需要再做二次清洗
以及如下是AI的解釋
📉 為什麼美股從 8,000 家變成 5,000 多家?
✅ 1. 美股有大量「便士股」與 OTC 公司
- 美股上市公司中,有數千家是股價低於 $3 的微型股(penny stocks)或 OTC(場外交易)公司
- 這些公司成交量低、流動性差、容易出現異常價格跳動
- 在你的模組中,這些會被「可交易性濾波」直接排除
✅ 2. 美股企業行為極多:拆股、併股、配股、除權
- 美股公司常進行 1:10 拆股、1:5 併股等操作
- 這會造成開盤/昨收跳空異常,模組會標記為 Maybe_CorpAction 並排除
- 台股、港股、日股相對穩定,企業行為較少,保留率高
✅ 3. 美股資料來源涵蓋範圍廣,包含大量「殼公司」與停牌股
- 原始資料可能包含 SPAC、空殼公司、已退市但仍有殘留資料的標的
- 這些公司在年K模組中會因為「價格異常、報酬率異常、成交量過低」而被排除























