什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(2)台股實測

更新於 2024/12/21閱讀時間約 3 分鐘
  • 文內如有投資理財相關經驗、知識、資訊等內容,皆為創作者個人分享行為。
  • 有價證券、指數與衍生性商品之數據資料,僅供輔助說明之用,不代表創作者投資決策之推介及建議。
  • 閱讀同時,請審慎思考自身條件及自我決策,並應有為決策負責之事前認知。
  • 方格子希望您能從這些分享內容汲取投資養份,養成獨立思考的能力、判斷、行動,成就最適合您的投資理財模式。
raw-image



還沒有看過上一篇的可以點擊下面連結

什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(1)論文解析

這一篇會把注意力放在論文提到的技術並套用在台股市場,也會使用論文中的方法進行驗證,看看是否在台股也有一樣的超額報酬。



資料生成

第一步也是最難的一步-資料生成。

這裡使用到的資料為股票的開盤價、收盤價、最高價、最低價、成交量。需要先把這些資料標準化,再轉換成0和1的二維陣列,最後將二維陣列轉換成黑白的像素線圖。

我使用finlab的python套件獲取開高低收量的資料後,就能夠轉換成以下不同週期的線圖。


5日線圖

5日線圖


20線圖

20線圖

60日線圖

60日線圖


可以看到,除了依照周期區分之外,也可以依照是否使用均線/成交量,產生不同的線圖資料,進而訓練不同的模型。

同時也可以注意到,線圖中沒辦法得知是哪隻股票、股價、成交量為何,所呈現的都是標準化後的資訊。


資料切割

finlab的資料集橫跨2007-2023年,依照論文的方式,拿前三分之一作為訓練及驗證,最後三分之二做測試。

raw-image


2007-2011年的資料轉換成線圖後,會隨機打亂,並切割成訓練集(90%)和驗證集(10%)。2012-2023年的資料則會在模型訓練好後,作為實測的測試集。


模型訓練

這裡選擇訓練的模型是I5/R5,也就是拿五日的線圖去預測五日後的漲跌,而使用的線圖是包含均線以及成交量的。

會選擇這個模型當作實驗是因為他在論文中的表現是最好的。然而,在接下來的finlab實際回測中,我會使用不同模型進行回測。這將包含使用不同的時間週期、不同的線圖變化(如有無均線及成交量)。這些模型在不同量化策略下會有不同的效果,這裡就先賣個關子了。

模型的架構以及參數都比照論文的設定,如下圖。

模型架構圖

模型架構圖

訓練會持續直到驗證集的loss持續兩個epochs都沒辦法進步為止。


實驗結果

這裡會使用到2012-2023年的資料進行實驗。

首先是十等分的實驗。將模型預測出來的結果依照分數進行排序,並切成十等分。第一分位代表預測的數字越低,而第十分位則最高。結果如下圖

十等分圖

十等分圖


可以發現,隨著預測的分數越高,報酬率也跟著上升。紅色的線代表0050的平均報酬,從第五分位開始打敗0050的報酬。

論文中的第一分位平均報酬為負的,在這樣的條件下作多空對沖非常適合。然而在台股市場上並沒有這樣的條件,做多空對沖的話反而會拉低報酬,不過如果想要更平滑的報酬曲線的話仍然可以使用多空對沖。

raw-image

上圖為實際操作的流程。首先會將股價資訊轉換成線圖,接著會透過CNN模型預測上漲下跌機率,根據上漲的機率進行排序後,買入前n檔股票,每五日做一次換股。

假設n=20。則買進前20檔、多空對沖(買進前20同時放空後20檔)、以及0050的走勢比較圖如下。

n=20

n=20


可以看到只買進前二十檔的績效遠超過0050的報酬,而多空對沖則和0050相當,不過曲線更為平滑一些。

假設n=10%。則買進前10%、多空對沖(買進前10%同時放空後10%)、以及0050的走勢比較圖如下。

n=10%(約203檔)

n=10%(約203檔)


可以發現只買進前10%的報酬雖然下降,但仍然很明顯的大敗大盤,而多空對沖的策略則更加平滑,但報酬也跟著降低了。



總結

上一篇主要在介紹論文中的方法,這一篇則是把論文中的方法套用在台股上實驗。可以發現這個方法(或說這個因子)在台股上也是十分顯著有用的,下一篇我將把這個因子結合finlab上的策略進行優化。

覺得有幫助或是有趣的歡迎點贊關注,也歡迎贊助~。🙇

avatar-img
28會員
11內容數
這個專題會分享有關投資、量化、因子以及機器學習相關的內容。主要會以我有興趣的內容進行分享,希望能透過實際回測及實驗做為佐證,找尋股票市場中的ALPHA。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Li way Cheng的沙龍 的其他內容
前言 這個系列打算分三篇來完成。 第一篇先來解析論文中的方法以及實驗結果。 第二篇會把這篇論文應用在台股上,評估效果如何。 第三篇會把這篇論文實作成因子套用在Finlab上進行回測。 動機 今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道
前言 這個系列打算分三篇來完成。 第一篇先來解析論文中的方法以及實驗結果。 第二篇會把這篇論文應用在台股上,評估效果如何。 第三篇會把這篇論文實作成因子套用在Finlab上進行回測。 動機 今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
重讀兩本迥異的書,《齊瓦哥醫生》和池波正太郎的《東京美食散步》。 •齊瓦哥的處境簡直是作曲家 Mussorgsky 翻版,社會分崩離析悄然發生,身不由己進軍隊,但對於參加別人的權力遊戲早已心死。 Mussorgsky 看朋友去世遺留畫作,也不過隨筆塗鴉,卻認真一幅幅寫成曲子。齊瓦哥從軍隊逃出來,
Thumbnail
本篇文以筆者本身的學習及認識,淺白的討論「什麼時候設計師才會被 AI 取代?」的問題,希望對於未來有意投入設計工作的人,有基本的認識及信心,設計工作並不會完全消失。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
AI生成技術領頭羊Open AI又出手了,旗下產品「Sora」有別於Chat GPT,只要給予指令,生產出來的不再只是文字,而是一幕幕需要耗費大量人工努力下產出的產品,所謂大量人工包含了:攝影、剪接、燈光、彩妝、演員、美術道具,甚至導演、製片等等。 而AI只要彈指之間,便能將無形化有形,從無到有
Thumbnail
前言 這篇會拿Finlab上的策略與機器學習預測線圖的因子進行結合。由於模型是透過2007-2011年的線圖作為訓練資料,回測的時候會從2012年開始以示公平。 還沒看過前面兩篇的可以點下面連結,會比較看得懂接下來的內容。 第一篇: 什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲
Thumbnail
不難發現大語言模型能對生產力與學習帶來許多幫助,未來教育型 AI 機器人很大機率將會成為主流,使用 AI 輔助學習、即時從 AI 獲得解答、利用 AI 學習新技能都會是新的學習場景。根據教育市調機構 HolonIQ 過去的報告顯示全球教育人工智能的投入預計 2025 年將達 60 億。
Thumbnail
未來,人工智慧(AI)預計將在各行各業帶來迅速的變革,重新塑造生活方式。文章探討了AI的定義,強調其模擬人類思維和行為的能力。AI已廣泛應用於手機、電腦、醫療、商業、教育和法律等領域,並影響生活的方方面面。
Thumbnail
2023年才到三月為止,VC投入生成式AI的市場的估值就已經超越了前兩年的總和,可以想見整年下來絕對是一個數量級以上的差異。難道AI是這兩年才發明出來的嗎? 為什麼忽然之間全世界都在關注AI呢?  這就是我們這邊文章想要探討的,究竟AI發展到現在是否有什麼突破? 為什麼大家開始關注起AI。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
重讀兩本迥異的書,《齊瓦哥醫生》和池波正太郎的《東京美食散步》。 •齊瓦哥的處境簡直是作曲家 Mussorgsky 翻版,社會分崩離析悄然發生,身不由己進軍隊,但對於參加別人的權力遊戲早已心死。 Mussorgsky 看朋友去世遺留畫作,也不過隨筆塗鴉,卻認真一幅幅寫成曲子。齊瓦哥從軍隊逃出來,
Thumbnail
本篇文以筆者本身的學習及認識,淺白的討論「什麼時候設計師才會被 AI 取代?」的問題,希望對於未來有意投入設計工作的人,有基本的認識及信心,設計工作並不會完全消失。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
AI生成技術領頭羊Open AI又出手了,旗下產品「Sora」有別於Chat GPT,只要給予指令,生產出來的不再只是文字,而是一幕幕需要耗費大量人工努力下產出的產品,所謂大量人工包含了:攝影、剪接、燈光、彩妝、演員、美術道具,甚至導演、製片等等。 而AI只要彈指之間,便能將無形化有形,從無到有
Thumbnail
前言 這篇會拿Finlab上的策略與機器學習預測線圖的因子進行結合。由於模型是透過2007-2011年的線圖作為訓練資料,回測的時候會從2012年開始以示公平。 還沒看過前面兩篇的可以點下面連結,會比較看得懂接下來的內容。 第一篇: 什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲
Thumbnail
不難發現大語言模型能對生產力與學習帶來許多幫助,未來教育型 AI 機器人很大機率將會成為主流,使用 AI 輔助學習、即時從 AI 獲得解答、利用 AI 學習新技能都會是新的學習場景。根據教育市調機構 HolonIQ 過去的報告顯示全球教育人工智能的投入預計 2025 年將達 60 億。
Thumbnail
未來,人工智慧(AI)預計將在各行各業帶來迅速的變革,重新塑造生活方式。文章探討了AI的定義,強調其模擬人類思維和行為的能力。AI已廣泛應用於手機、電腦、醫療、商業、教育和法律等領域,並影響生活的方方面面。
Thumbnail
2023年才到三月為止,VC投入生成式AI的市場的估值就已經超越了前兩年的總和,可以想見整年下來絕對是一個數量級以上的差異。難道AI是這兩年才發明出來的嗎? 為什麼忽然之間全世界都在關注AI呢?  這就是我們這邊文章想要探討的,究竟AI發展到現在是否有什麼突破? 為什麼大家開始關注起AI。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。