什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(1)論文解析

更新於 發佈於 閱讀時間約 6 分鐘
  • 文內如有投資理財相關經驗、知識、資訊等內容,皆為創作者個人分享行為。
  • 有價證券、指數與衍生性商品之數據資料,僅供輔助說明之用,不代表創作者投資決策之推介及建議。
  • 閱讀同時,請審慎思考自身條件及自我決策,並應有為決策負責之事前認知。
  • 方格子希望您能從這些分享內容汲取投資養份,養成獨立思考的能力、判斷、行動,成就最適合您的投資理財模式。
raw-image



前言

這個系列打算分三篇來完成。

第一篇先來解析論文中的方法以及實驗結果。

第二篇會把這篇論文應用在台股上,評估效果如何。

第三篇會把這篇論文實作成因子套用在Finlab上進行回測。



動機

今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道這篇論文是看到FCDO在臉書上分享了這篇論文,覺得很有趣就把這篇看完了。此論文收錄在頂尖的金融期刊Journal of Finance上,又有AQR的Bryan Kelly加持,可以說是非常值得讀的一篇論文。



論文解析


研究目的

這篇論文改變了預測股市趨勢的方式。與傳統的測試理論或固定模式不同,他們選擇運用機器學習,利用股價線圖作為數據來探索潛在上漲的股票。有趣的是,這些模型不同於以往研究中常見的股價趨勢信號,它們提供更精準的報酬預測,並且能夠轉化為更具獲利性的投資策略。更令人驚奇的是,這些模型似乎與時間尺度和地區都無關,無論是短期還是長期、美國還是國際市場,都呈現出卓越的表現。總體來說,這篇論文透過獨特的視角,旨在找出更為卓越的股市預測方法。

然而論文中提到的股票線圖和我們平常用的k線有些不同,他們所使用的是美國線(下圖為特斯拉的美國線圖)。


raw-image


直線呈現的最高點代表最高價,而最低點則代表最低價。左側橫線表示開盤價,而右側橫線表示收盤價。

OHLC chart (from wikipedia)

OHLC chart (from wikipedia)



研究方法

美國線雖然看起來比k線圖還簡單,但圖中的顏色、文字以及不同股票的尺度差異使得AI在訓練時難以學習和收斂。為解決此問題,本論文將美國線圖簡化如下:

包含開高低收、均線、成交量的線圖

包含開高低收、均線、成交量的線圖

將圖片轉為黑白,並降低畫質,同時將不同股票的尺度標準化。統一的線圖有助於AI更迅速學習股價走勢和成交量資訊。

另外,論文中使用到的AI模型是CNN(如果沒聽過CNN但有興趣認識的話可以參考這部影片)。是專為影像辨識而設計的模型,非常適合辨識股價線圖趨勢。

根據不同時間區間,線圖可分為5日、20日和60日,並針對不同周期設計了不同複雜度的CNN模型。(如下圖)。

raw-image

週期越長的圖片複雜度越高,信息更豐富,因此使用的CNN模型也更複雜。

CNN模型預測的目標是y天後股價是上漲還是下跌,論文中僅關注漲跌,而非漲跌幅。上漲標注為1,下跌標注為0。模型需要針對給定的線圖預測1或0。問題可表示為Ix/Ry,其中x代表時間週期,y代表y天後市場漲跌(例如I5/R5表示使用五天線圖預測五天後市場上漲還是下跌)。



模型訓練

首先,研究人員收集了1993年至2019年的美股資料。他們以1993年至2000年的數據作為訓練集,用來訓練CNN模型;而2001年至2019年的數據則被用作測試集,以驗證模型是否成功學習了如何透過線圖來辨別股價漲跌趨勢。

隨後,研究人員根據不同週期的線圖(I5、I20、I60)和不同週期的預測值(R5、R20、R60),總共培訓了9個模型(I5/R5、I5/R20、I5/R60、I20/R5、I20/R20、I20/R60、I60/R5、I60/R20、I60/R60)



模型表現

經過訓練的模型以2001年至2019年的資料進行預測和評估。CNN模型將每張圖片轉換為介於0和1之間的數值,數值越接近1表示上漲的機率越高,反之則下跌機率越高。

按照模型轉換的數值排序預測結果,並將其分為十等分。第一等分包含模型預測分數最低的股票,而第十等分包含模型預測分數最高的股票。結果如下圖所示

raw-image

可觀察到I5/R5模型的表現最為優越,而隨著等分升高,報酬率也相應提高,反之,較低等分則顯示報酬率較差。這顯示模型預測的結果能夠有效預測股票的漲跌。與其他因子相比,如MOM(動能)、STR(月短期反轉)、WSTR(周短期反轉)等因子也呈現優異的表現。

下圖呈現將上述結果以圖表方式呈現,顯示大多數因子在第一等分的表現相對較低,而在第十等分的表現相對較高。值得注意的是,透過CNN產生的訊號在第十等分呈現更為顯著的報酬,同時第一等分也顯示更為顯著的負報酬。這樣的結果非常適合應用於多空對沖策略。

raw-image



下圖就是透過多空對沖進行交易的報酬曲線圖,作法就是做多第十等分同時放空第一等分。

raw-image



不論是I5/R5、I20/R5還是I60/R5,其表現均明顯優於大盤(SPY),且優於其他因子。這顯示CNN模型確實成功學習如何透過股票線圖來準確判斷漲跌。



模型學到了什麼?


為了深入了解CNN模型的學習成果,本論文將該CNN模型與傳統因子進行了比較。研究著重於近期價格趨勢(包括動能指標(MOM)、月短期反轉(STR)、周短期反轉(WSTR)以及距離52周高點的距離(52WH))、風險(包括β值(Beta)和波動性(Volat.))以及流動性(如買賣價差(Bid-Ask)、成交金額(Dollar Volume)、無交易日數(Zero Trade)、價格延遲(Price Delay)、市值規模(Size)以及Amihud流動性(Illiq.))等因子的對比,具體內容見下圖。

raw-image


透過觀察此圖,我們可以發現當模型以"未來5日後的漲跌 (R5)" 作為預測目標時,其相關性與WSTR達到最高點。然而,隨著預測目標週期延長至20日 (R20) 或60日 (R60),相關性明顯下降,甚至在60日時幾乎降至零。

值得注意的是,動能 (MOM) 在長週期線圖 (I60) 中展現出顯著的相關性,隨著線圖週期的遞減而遞減,到5日線圖 (I5) 時幾乎為零。

最令人驚奇的是,CNN 居然學到了除價量之外的資訊。我們可以觀察到60日線圖 (I60) 與風險以及流動性的因子之間存在相當大的相關性。需要強調的是,這些線圖都經過歸一化處理,因此無法得知每張線圖的原始股價和原始成交量。在這樣的前提下,CNN 模型仍然能夠捕捉到非價量的訊息,例如52週最高價、波動度、交易額、市值、流動性等因子。

結語

這是我第一次嘗試發文解析論文,有哪裡看不懂或不清楚的歡迎留言。下一篇我將把這篇論文的方法實作在台股上,覺得有幫助的歡迎幫忙點讚,也歡迎贊助~。

avatar-img
29會員
11內容數
這個專題會分享有關投資、量化、因子以及機器學習相關的內容。主要會以我有興趣的內容進行分享,希望能透過實際回測及實驗做為佐證,找尋股票市場中的ALPHA。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
挺有趣的,在AI題材炒熱了全球股市的同時,也以令人猝不及防的全面滲透並改變人類的金融、股票市場生態系。
Thumbnail
這篇文章探討了股票技術分析的基本概念,包括K線圖和移動平均線的定義和用途,以及型態學的應用。此外,文章也介紹了葛蘭碧八大法則的相關內容,並討論了其歷史和潛在侷限性。最後,文章提醒投資者要理解技術分析工具的原理,不依賴單一指標做出投資決策。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
K線的意思是某段期間的股價紀錄,K線圖的意思則是記錄市場某段期間的價格變化,屬於技術分析的一種。 包含股票、ETF、期貨、外匯等等商品,在觀察價格走勢時,其實都會使用到K線與K線圖。 本篇市場先生將介紹K線、K線圖,以及K線的16種型態。 本文市場先生會告訴你: K線是什麼? K線圖怎
Thumbnail
近日台灣的股市在台積電的帶領之下屢創新高,網路上不斷的討論某一檔股票的合理價格應該是多少?股票的價格是如何決定的呢?在《洞悉價格背後的心理戰(Priceless: The Myth of Fair Value)》一書中,作者William Poundstone詳細探討了股票價格如何受到心理因素的影響
Thumbnail
作者 Only 系列文章,【一天一千字,進化每一次】很多股票投資人,都想要預測,什麼時候股票會漲,什麼時候股票會跌,但是最廣為人的K線等技術指標,最容易失靈的原因,他是透過歷史數據而形成的走勢圖,就好像看這後照鏡開車,所以使用景氣燈號,是一個更好的方法。
Thumbnail
2024年,美國主要股指勇攀新高,投資者關於通膨與高利率的憂慮似乎已被對人工智慧的熱情所取代,牛市趨勢佔據了上風。 然而,股市的牛市究竟是什麼?面對這些新高點,投資者應該如何反應?本文將揭示股市牛市的技術性定義,講述如何交易於牛市,以及牛市對更廣泛經濟的含義。 牛市的定義與成因 從實證角度
Thumbnail
學習K線圖的好處是能夠在這項技能當中研判各國股市、匯率或個股的趨勢脈動,因K棒的形成是真金白銀打出來的型態,就是最真實的市場的反映,若將K棒及成交量結合,就能掌握大部分市場的走向,未來您可以做波段或是當沖交易都適用,就不需要再聽任何消息能夠自己做判斷。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
挺有趣的,在AI題材炒熱了全球股市的同時,也以令人猝不及防的全面滲透並改變人類的金融、股票市場生態系。
Thumbnail
這篇文章探討了股票技術分析的基本概念,包括K線圖和移動平均線的定義和用途,以及型態學的應用。此外,文章也介紹了葛蘭碧八大法則的相關內容,並討論了其歷史和潛在侷限性。最後,文章提醒投資者要理解技術分析工具的原理,不依賴單一指標做出投資決策。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
K線的意思是某段期間的股價紀錄,K線圖的意思則是記錄市場某段期間的價格變化,屬於技術分析的一種。 包含股票、ETF、期貨、外匯等等商品,在觀察價格走勢時,其實都會使用到K線與K線圖。 本篇市場先生將介紹K線、K線圖,以及K線的16種型態。 本文市場先生會告訴你: K線是什麼? K線圖怎
Thumbnail
近日台灣的股市在台積電的帶領之下屢創新高,網路上不斷的討論某一檔股票的合理價格應該是多少?股票的價格是如何決定的呢?在《洞悉價格背後的心理戰(Priceless: The Myth of Fair Value)》一書中,作者William Poundstone詳細探討了股票價格如何受到心理因素的影響
Thumbnail
作者 Only 系列文章,【一天一千字,進化每一次】很多股票投資人,都想要預測,什麼時候股票會漲,什麼時候股票會跌,但是最廣為人的K線等技術指標,最容易失靈的原因,他是透過歷史數據而形成的走勢圖,就好像看這後照鏡開車,所以使用景氣燈號,是一個更好的方法。
Thumbnail
2024年,美國主要股指勇攀新高,投資者關於通膨與高利率的憂慮似乎已被對人工智慧的熱情所取代,牛市趨勢佔據了上風。 然而,股市的牛市究竟是什麼?面對這些新高點,投資者應該如何反應?本文將揭示股市牛市的技術性定義,講述如何交易於牛市,以及牛市對更廣泛經濟的含義。 牛市的定義與成因 從實證角度
Thumbnail
學習K線圖的好處是能夠在這項技能當中研判各國股市、匯率或個股的趨勢脈動,因K棒的形成是真金白銀打出來的型態,就是最真實的市場的反映,若將K棒及成交量結合,就能掌握大部分市場的走向,未來您可以做波段或是當沖交易都適用,就不需要再聽任何消息能夠自己做判斷。