近期拜讀Igor Tulchinsky在2019年的著作《Finding Alphas: A Quantitative Approach to Building Trading Strategies》,學習更深入的投資,在這系列文章中,將逐章節摘要書籍重點。此為系列第二篇,涵蓋Part II的Chapter 4到10。
本書結合WorldQuant全球專家的知識,涵蓋alpha、相關性分析、偏差控制、ETF、事件驅動投資、指數alpha、日內數據研究、機器學習等主題。提供最新交易策略資訊,內容實用、易懂,並新增學術參考與高質量範例,適合關注量化交易的讀者。本書作者Igor Tulchinsky是 WorldQuant的創始人兼 CEO。
Alpha Design
- 常見資料
- 價格與成交量
- 基本面資料(PE, ROE, Profit Margin, ...) (這類 Alpha 通常具有較低的turnover)
- 總經 (GDP、就業率、...)
- 文字資料、多媒體資料
- 降低預測雜訊或者精煉其他 Alpha 訊號的方式
- 風險因子模型 (Risk Factor Models)
- 控制或消除某些特定風險因子的曝險(exposure),以期提升 Alpha 的表現。
- 關係模型 (Relationship Models)
- 分析在歷史上彼此具高度相關性的標的,有些可能存在領先(leading)或落後(lagging)的關係,進而找出套利空間。
- Alpha 的預測頻率
- 逐筆、日內、每日(Delay 1=只使用「前一日收盤前」 or Delay 0 = 在同一天某個特定時間點(如當日中場)取得資料,用於當日剩餘時間或下一時段的預測
- 週頻率或月頻率 通常配合基本面分析或長期經濟趨勢。
- 通常跟數據的更新頻率密切相關。
- 用公司季度財報資料,則一季更新一次
- 用即時訂單深度(Level II Order Book)或高頻資料,就可能需要逐筆或日內頻率的更新。
- 如何評估 Alpha 的價值
- 實務中並不容易精準度量(沒有固定的策略、非線性組合)
- 資訊比率IR 越大,代表預測的穩定度越高
- 若觀察期長達 5 年,且 Alpha 幾乎沒有過度擬合,且與其他已知 Alpha 的相關度不高,IR 大約在 1.0 就算是不錯的水準。
- Margin = Profit / Trading Volume 越高,代表該 Alpha 對交易成本不敏感
- 對於常見的日頻Alpha,約 5 個基點(0.05%)的邊際即算可以接受。
- Correlation
- 該 Alpha 與「池中已存在的某個最相似 Alpha」之間的相關係數(Pearson correlation)
- >0.7: 相關度太高,只有在該 Alpha 明顯優於現有 Alpha 時,才值得納入
- 0.5–0.7: 邊際情況,需要其他指標(如 IR、邊際等)表現極佳才有價值。
- 0.3–0.5: 通常可接受。
- < 0.3: 視為相當良好的獨特性。
- 注意
- 保留測試集、比較整體的 In-Sample 與 Out-of-Sample
How to Develop an Alpha: A Case Study
- 發想策略/邏輯→概念數學化→回測→優化與風控
- 假設要做出Alphabet(GOOG)、Apple(AAPL)的alpha
- 股價的波動來自許多方面,先只用「價格趨勢」因子
- 假設我們注意到
- 在最近一週股價若連續上漲,可能短期內有獲利了結的壓力,容易往下修正
- 也就是負的五日報酬,若五日報酬越大,我們越傾向做空


- 風險中和
- 原本的設計有 31.2% 的年化報酬,但最大回撤可高達 39.22%
- 常見做法是做「行業中和」或「市值中和」 (權重加總為0)
- 在例子中,當我們對 Alpha進行行業中和後,整體年化報酬下降至大約 10.22%,但最大回撤大幅縮小至不到 9%,IR也上升至 1.37。
- 進一步優化
- 排名(Rank)
- 註:觀察值越多,Rank 越能很好地呈現趨勢
- 衰減(Decay)
- 若發現每日調整部位過於頻繁(週轉率高),或想降低雜訊造成的波動可使用
Data and Alpha Design
- 如何尋找 Alpha 所需的資料
- 最快的方法之一是參考現有文獻
- 可從 SSRN、Google Scholar 或知名的金融/經濟期刊著手,關鍵字可以使用「stock returns」「abnormal returns」「fundamental data」等
- 從資料供應商 取得資料
- 可能的風險: Crowded Trade、Forward-looking Bias、Survivorship Bias
- 資料驗證
- 須注意未來可持續性
- Outliers: 在 Alpha 或前置資料清洗階段加入基本的檢查機制,如對極端值以 Winsorization 或 z-score 過濾
- WQ也使用更多元的資料
- 季節性感受 (日照時間長短影響投資人的情緒)、天氣因素(晴朗天氣與大盤當日收盤報酬存在顯著正相關)
- 搜尋趨勢: Preis et al. (2013) 透過 Google 搜尋趨勢 (Google Trends) 建構投資策略,結果大幅跑贏大盤 (326% vs 16%)。
- 社交媒體
Turnover
- Alpha Horizon: 「要預測多久之後」的股價或報酬
- Horizon通常 負相關 IR 與 IC
- 常見交易成本
- 佣金、Bid–Ask Spread、Slippage
- 高流動性的市場(例如美股前 500 大市值)買賣價差一般較小(例如 5 bps)
- 流動性低的市場或冷門股票,可能擴大到 25~30 bps
- 舉例
- 策略 std(returns) 表示它會偏好那些「近期報酬波動度較高」的標的。流動性通常較低。伴隨較大的買賣價差。
- 策略 log(volume) 偏好大盤股或高交易量股票,低交易成本
- 短期 Horizon 的 Alpha,需要在短時間內完成進出場,交易成本高
Alpha Correlation
- Alpha 相關性通常可以基於PnL或Positions等方式進行
- 可使用Pearson Correlation / cosine
- 有時也會考慮「最近資料重要性更高」的想法,對近期的PnL做加權
- 廣義相關(Generalized Correlation)
- 先將原本的 PnL 時序向量轉換再做Correlation (線性
- 例如:週盈虧、月盈虧、只看多空方向
- 以持倉為基礎的相關性
- Position Correlation: 觀察某段期間,concat所有天數的持倉向量後計算相關性
- Trading Correlation: 計算每天持倉變化量的相關性
- 在 Alpha 池中的相關性衡量
- 計算某個 Alpha 與池內所有其他 Alpha 的相關係數後取平均,或計算所有 Alpha 兩兩之間的相關係數矩陣,去觀察其整體分布。
- 總相關(T-corr): 該 Alpha 與所有其他 Alpha 的相關係數加總
Backtest – Signal or Overfitting
- 如何降低過度擬合風險
- True Out-of-Sample Test (實際在未來的真實市場觀察其表現,而不是把「舊的歷史區間」當作樣本外資料)
- 提高In-sample Sharpe Ratio要求
- 延長回測期間、跨市場驗證、模型簡潔優雅、減少參數和操作
Controlling Biases
- 系統性偏誤(systematic bias)
- Look-Ahead Bias(前視性偏誤): 若某個投資訊號或投資策略做決策時,使用到未來時間或之後才會知道的資料
- 理想情況下,每筆資料都應該有「事件發生時間(occurrence datetime)」與「資料接收時間(arrival datetime)」兩個時間戳。若只使用「事件發生時間」會發生問題
- 若策略橫跨多個時區,常見的做法是將所有交易日與事件的時間統一轉換成同一個基準時區(例如 UTC)
- 在sentiment analysis領域,一些供應商提供的sentiment dictionary若以未來資訊或未來文檔訓練而成,可能也會產生前視性偏誤。
- 行為性偏誤 (Behavioral bias)
- Storytelling, Confirmation Bias, Familiarity Bias, Narrow Framing (投資人做決策時,沒有將其視為整體投資組合的一部分), Herding Bias