什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(1)論文解析

更新於 發佈於 閱讀時間約 6 分鐘
投資理財內容聲明
raw-image



前言

這個系列打算分三篇來完成。

第一篇先來解析論文中的方法以及實驗結果。

第二篇會把這篇論文應用在台股上,評估效果如何。

第三篇會把這篇論文實作成因子套用在Finlab上進行回測。



動機

今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道這篇論文是看到FCDO在臉書上分享了這篇論文,覺得很有趣就把這篇看完了。此論文收錄在頂尖的金融期刊Journal of Finance上,又有AQR的Bryan Kelly加持,可以說是非常值得讀的一篇論文。



論文解析


研究目的

這篇論文改變了預測股市趨勢的方式。與傳統的測試理論或固定模式不同,他們選擇運用機器學習,利用股價線圖作為數據來探索潛在上漲的股票。有趣的是,這些模型不同於以往研究中常見的股價趨勢信號,它們提供更精準的報酬預測,並且能夠轉化為更具獲利性的投資策略。更令人驚奇的是,這些模型似乎與時間尺度和地區都無關,無論是短期還是長期、美國還是國際市場,都呈現出卓越的表現。總體來說,這篇論文透過獨特的視角,旨在找出更為卓越的股市預測方法。

然而論文中提到的股票線圖和我們平常用的k線有些不同,他們所使用的是美國線(下圖為特斯拉的美國線圖)。


raw-image


直線呈現的最高點代表最高價,而最低點則代表最低價。左側橫線表示開盤價,而右側橫線表示收盤價。

OHLC chart (from wikipedia)

OHLC chart (from wikipedia)



研究方法

美國線雖然看起來比k線圖還簡單,但圖中的顏色、文字以及不同股票的尺度差異使得AI在訓練時難以學習和收斂。為解決此問題,本論文將美國線圖簡化如下:

包含開高低收、均線、成交量的線圖

包含開高低收、均線、成交量的線圖

將圖片轉為黑白,並降低畫質,同時將不同股票的尺度標準化。統一的線圖有助於AI更迅速學習股價走勢和成交量資訊。

另外,論文中使用到的AI模型是CNN(如果沒聽過CNN但有興趣認識的話可以參考這部影片)。是專為影像辨識而設計的模型,非常適合辨識股價線圖趨勢。

根據不同時間區間,線圖可分為5日、20日和60日,並針對不同周期設計了不同複雜度的CNN模型。(如下圖)。

raw-image

週期越長的圖片複雜度越高,信息更豐富,因此使用的CNN模型也更複雜。

CNN模型預測的目標是y天後股價是上漲還是下跌,論文中僅關注漲跌,而非漲跌幅。上漲標注為1,下跌標注為0。模型需要針對給定的線圖預測1或0。問題可表示為Ix/Ry,其中x代表時間週期,y代表y天後市場漲跌(例如I5/R5表示使用五天線圖預測五天後市場上漲還是下跌)。



模型訓練

首先,研究人員收集了1993年至2019年的美股資料。他們以1993年至2000年的數據作為訓練集,用來訓練CNN模型;而2001年至2019年的數據則被用作測試集,以驗證模型是否成功學習了如何透過線圖來辨別股價漲跌趨勢。

隨後,研究人員根據不同週期的線圖(I5、I20、I60)和不同週期的預測值(R5、R20、R60),總共培訓了9個模型(I5/R5、I5/R20、I5/R60、I20/R5、I20/R20、I20/R60、I60/R5、I60/R20、I60/R60)



模型表現

經過訓練的模型以2001年至2019年的資料進行預測和評估。CNN模型將每張圖片轉換為介於0和1之間的數值,數值越接近1表示上漲的機率越高,反之則下跌機率越高。

按照模型轉換的數值排序預測結果,並將其分為十等分。第一等分包含模型預測分數最低的股票,而第十等分包含模型預測分數最高的股票。結果如下圖所示

raw-image

可觀察到I5/R5模型的表現最為優越,而隨著等分升高,報酬率也相應提高,反之,較低等分則顯示報酬率較差。這顯示模型預測的結果能夠有效預測股票的漲跌。與其他因子相比,如MOM(動能)、STR(月短期反轉)、WSTR(周短期反轉)等因子也呈現優異的表現。

下圖呈現將上述結果以圖表方式呈現,顯示大多數因子在第一等分的表現相對較低,而在第十等分的表現相對較高。值得注意的是,透過CNN產生的訊號在第十等分呈現更為顯著的報酬,同時第一等分也顯示更為顯著的負報酬。這樣的結果非常適合應用於多空對沖策略。

raw-image



下圖就是透過多空對沖進行交易的報酬曲線圖,作法就是做多第十等分同時放空第一等分。

raw-image



不論是I5/R5、I20/R5還是I60/R5,其表現均明顯優於大盤(SPY),且優於其他因子。這顯示CNN模型確實成功學習如何透過股票線圖來準確判斷漲跌。



模型學到了什麼?


為了深入了解CNN模型的學習成果,本論文將該CNN模型與傳統因子進行了比較。研究著重於近期價格趨勢(包括動能指標(MOM)、月短期反轉(STR)、周短期反轉(WSTR)以及距離52周高點的距離(52WH))、風險(包括β值(Beta)和波動性(Volat.))以及流動性(如買賣價差(Bid-Ask)、成交金額(Dollar Volume)、無交易日數(Zero Trade)、價格延遲(Price Delay)、市值規模(Size)以及Amihud流動性(Illiq.))等因子的對比,具體內容見下圖。

raw-image


透過觀察此圖,我們可以發現當模型以"未來5日後的漲跌 (R5)" 作為預測目標時,其相關性與WSTR達到最高點。然而,隨著預測目標週期延長至20日 (R20) 或60日 (R60),相關性明顯下降,甚至在60日時幾乎降至零。

值得注意的是,動能 (MOM) 在長週期線圖 (I60) 中展現出顯著的相關性,隨著線圖週期的遞減而遞減,到5日線圖 (I5) 時幾乎為零。

最令人驚奇的是,CNN 居然學到了除價量之外的資訊。我們可以觀察到60日線圖 (I60) 與風險以及流動性的因子之間存在相當大的相關性。需要強調的是,這些線圖都經過歸一化處理,因此無法得知每張線圖的原始股價和原始成交量。在這樣的前提下,CNN 模型仍然能夠捕捉到非價量的訊息,例如52週最高價、波動度、交易額、市值、流動性等因子。

結語

這是我第一次嘗試發文解析論文,有哪裡看不懂或不清楚的歡迎留言。下一篇我將把這篇論文的方法實作在台股上,覺得有幫助的歡迎幫忙點讚,也歡迎贊助~。

留言
avatar-img
留言分享你的想法!
avatar-img
Li way Cheng的沙龍
30會員
10內容數
這個專題會分享有關投資、量化、因子以及機器學習相關的內容。主要會以我有興趣的內容進行分享,希望能透過實際回測及實驗做為佐證,找尋股票市場中的ALPHA。
Li way Cheng的沙龍的其他內容
2024/07/24
近幾年來,個股期貨的流動性越來越好,也有越來越多靠著股票期貨發家致富的故事,當然也有人不當使用這個商品而破產。這篇文章不會教你如何靠股票期貨發財,而是利用股票及期貨之間的差異性進行短線風險性較低的類套利交易。
Thumbnail
2024/07/24
近幾年來,個股期貨的流動性越來越好,也有越來越多靠著股票期貨發家致富的故事,當然也有人不當使用這個商品而破產。這篇文章不會教你如何靠股票期貨發財,而是利用股票及期貨之間的差異性進行短線風險性較低的類套利交易。
Thumbnail
2024/03/22
前言 這次除了00940上市的話題很熱門之外,吃00940豆腐的話題也是非常火熱。老實說身邊有在吃豆腐的人比有買00940的人多非常多,這也導致高殖利率股票在這一周波動非常大。 可以看到前十大成分股之一的漢唐最近兩周上下波動非常劇烈,基本上都是長紅K或是長黑K所組成。 手中00940持
Thumbnail
2024/03/22
前言 這次除了00940上市的話題很熱門之外,吃00940豆腐的話題也是非常火熱。老實說身邊有在吃豆腐的人比有買00940的人多非常多,這也導致高殖利率股票在這一周波動非常大。 可以看到前十大成分股之一的漢唐最近兩周上下波動非常劇烈,基本上都是長紅K或是長黑K所組成。 手中00940持
Thumbnail
2024/03/15
前言 最近市場上最熱門的股票不是台積電也不是任何一檔飆股,而是還沒上市的00940元大臺灣價值高息。這檔ETF申購首日就突破650億元,最終規模應該很有機會接近2000億。2000億的資金湧入成分股勢必會造成股價被拉抬的情況發生,如果能夠提前在00940買進前先卡位的話,或許就能偷吃到00940的
Thumbnail
2024/03/15
前言 最近市場上最熱門的股票不是台積電也不是任何一檔飆股,而是還沒上市的00940元大臺灣價值高息。這檔ETF申購首日就突破650億元,最終規模應該很有機會接近2000億。2000億的資金湧入成分股勢必會造成股價被拉抬的情況發生,如果能夠提前在00940買進前先卡位的話,或許就能偷吃到00940的
Thumbnail
看更多
你可能也想看
Thumbnail
這篇文章探討了股票技術分析的基本概念,包括K線圖和移動平均線的定義和用途,以及型態學的應用。此外,文章也介紹了葛蘭碧八大法則的相關內容,並討論了其歷史和潛在侷限性。最後,文章提醒投資者要理解技術分析工具的原理,不依賴單一指標做出投資決策。
Thumbnail
這篇文章探討了股票技術分析的基本概念,包括K線圖和移動平均線的定義和用途,以及型態學的應用。此外,文章也介紹了葛蘭碧八大法則的相關內容,並討論了其歷史和潛在侷限性。最後,文章提醒投資者要理解技術分析工具的原理,不依賴單一指標做出投資決策。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
Thumbnail
前言 這篇會拿Finlab上的策略與機器學習預測線圖的因子進行結合。由於模型是透過2007-2011年的線圖作為訓練資料,回測的時候會從2012年開始以示公平。 還沒看過前面兩篇的可以點下面連結,會比較看得懂接下來的內容。 第一篇: 什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲
Thumbnail
前言 這篇會拿Finlab上的策略與機器學習預測線圖的因子進行結合。由於模型是透過2007-2011年的線圖作為訓練資料,回測的時候會從2012年開始以示公平。 還沒看過前面兩篇的可以點下面連結,會比較看得懂接下來的內容。 第一篇: 什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲
Thumbnail
還沒有看過上一篇的可以點擊下面連結 什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(1)論文解析。 這一篇會把注意力放在論文提到的技術並套用在台股市場,也會使用論文中的方法進行驗證,看看是否在台股也有一樣的超額報酬。 資料生成 第一步也是最難的一步-資料生成。 這裡
Thumbnail
還沒有看過上一篇的可以點擊下面連結 什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(1)論文解析。 這一篇會把注意力放在論文提到的技術並套用在台股市場,也會使用論文中的方法進行驗證,看看是否在台股也有一樣的超額報酬。 資料生成 第一步也是最難的一步-資料生成。 這裡
Thumbnail
前言 這個系列打算分三篇來完成。 第一篇先來解析論文中的方法以及實驗結果。 第二篇會把這篇論文應用在台股上,評估效果如何。 第三篇會把這篇論文實作成因子套用在Finlab上進行回測。 動機 今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道
Thumbnail
前言 這個系列打算分三篇來完成。 第一篇先來解析論文中的方法以及實驗結果。 第二篇會把這篇論文應用在台股上,評估效果如何。 第三篇會把這篇論文實作成因子套用在Finlab上進行回測。 動機 今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道
Thumbnail
K線圖趨勢線邏輯與意義💕 👉支撐與壓力的意義與背後邏輯 在金融市場當中大多數的投資者 都會以技術分析做為找尋資產進場與退場的相關參考位置。 背後邏輯是希望可以找到「行情關鍵的反轉或關鍵位置」來規劃操作的機會。 👉趨勢線怎麼定義? 👉趨勢線背後的邏輯是什麼?實際案例說明上升趨勢線!
Thumbnail
K線圖趨勢線邏輯與意義💕 👉支撐與壓力的意義與背後邏輯 在金融市場當中大多數的投資者 都會以技術分析做為找尋資產進場與退場的相關參考位置。 背後邏輯是希望可以找到「行情關鍵的反轉或關鍵位置」來規劃操作的機會。 👉趨勢線怎麼定義? 👉趨勢線背後的邏輯是什麼?實際案例說明上升趨勢線!
Thumbnail
本期要介紹的是股市技術面分析的名詞,以下的許多名詞經常出現在商業週刊、經濟日報、投資相關書籍、新聞報導裡。每期的內容不會一次介紹幾十個名詞,讓讀者記不得,希望讀者能運用每期學習的機會,來讀懂各式商業報刊雜誌。
Thumbnail
本期要介紹的是股市技術面分析的名詞,以下的許多名詞經常出現在商業週刊、經濟日報、投資相關書籍、新聞報導裡。每期的內容不會一次介紹幾十個名詞,讓讀者記不得,希望讀者能運用每期學習的機會,來讀懂各式商業報刊雜誌。
Thumbnail
《何謂技術面?》 《技術分析的原理?》 《有那些技術面指標?》 K線圖(蠟燭圖) 指數平滑異同移動平均線(MACD) 相對強弱指標(RSI) 布林線(Boll) 隨機震盪指標(KD) 移動平均線(MA) 乖離率(BIAS) 《總結》 推薦網站 推薦書籍
Thumbnail
《何謂技術面?》 《技術分析的原理?》 《有那些技術面指標?》 K線圖(蠟燭圖) 指數平滑異同移動平均線(MACD) 相對強弱指標(RSI) 布林線(Boll) 隨機震盪指標(KD) 移動平均線(MA) 乖離率(BIAS) 《總結》 推薦網站 推薦書籍
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News