什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(2)台股實測

閱讀時間約 3 分鐘
  • 文內如有投資理財相關經驗、知識、資訊等內容,皆為創作者個人分享行為。
  • 有價證券、指數與衍生性商品之數據資料,僅供輔助說明之用,不代表創作者投資決策之推介及建議。
  • 閱讀同時,請審慎思考自身條件及自我決策,並應有為決策負責之事前認知。
  • 方格子希望您能從這些分享內容汲取投資養份,養成獨立思考的能力、判斷、行動,成就最適合您的投資理財模式。
raw-image



還沒有看過上一篇的可以點擊下面連結

什麼?!AI也看得懂k線圖?利用機器學習來判斷股票漲跌。(1)論文解析

這一篇會把注意力放在論文提到的技術並套用在台股市場,也會使用論文中的方法進行驗證,看看是否在台股也有一樣的超額報酬。



資料生成

第一步也是最難的一步-資料生成。

這裡使用到的資料為股票的開盤價、收盤價、最高價、最低價、成交量。需要先把這些資料標準化,再轉換成0和1的二維陣列,最後將二維陣列轉換成黑白的像素線圖。

我使用finlab的python套件獲取開高低收量的資料後,就能夠轉換成以下不同週期的線圖。


5日線圖

5日線圖


20線圖

20線圖

60日線圖

60日線圖


可以看到,除了依照周期區分之外,也可以依照是否使用均線/成交量,產生不同的線圖資料,進而訓練不同的模型。

同時也可以注意到,線圖中沒辦法得知是哪隻股票、股價、成交量為何,所呈現的都是標準化後的資訊。


資料切割

finlab的資料集橫跨2007-2023年,依照論文的方式,拿前三分之一作為訓練及驗證,最後三分之二做測試。

raw-image


2007-2011年的資料轉換成線圖後,會隨機打亂,並切割成訓練集(90%)和驗證集(10%)。2012-2023年的資料則會在模型訓練好後,作為實測的測試集。


模型訓練

這裡選擇訓練的模型是I5/R5,也就是拿五日的線圖去預測五日後的漲跌,而使用的線圖是包含均線以及成交量的。

會選擇這個模型當作實驗是因為他在論文中的表現是最好的。然而,在接下來的finlab實際回測中,我會使用不同模型進行回測。這將包含使用不同的時間週期、不同的線圖變化(如有無均線及成交量)。這些模型在不同量化策略下會有不同的效果,這裡就先賣個關子了。

模型的架構以及參數都比照論文的設定,如下圖。

模型架構圖

模型架構圖

訓練會持續直到驗證集的loss持續兩個epochs都沒辦法進步為止。


實驗結果

這裡會使用到2012-2023年的資料進行實驗。

首先是十等分的實驗。將模型預測出來的結果依照分數進行排序,並切成十等分。第一分位代表預測的數字越低,而第十分位則最高。結果如下圖

十等分圖

十等分圖


可以發現,隨著預測的分數越高,報酬率也跟著上升。紅色的線代表0050的平均報酬,從第五分位開始打敗0050的報酬。

論文中的第一分位平均報酬為負的,在這樣的條件下作多空對沖非常適合。然而在台股市場上並沒有這樣的條件,做多空對沖的話反而會拉低報酬,不過如果想要更平滑的報酬曲線的話仍然可以使用多空對沖。

raw-image

上圖為實際操作的流程。首先會將股價資訊轉換成線圖,接著會透過CNN模型預測上漲下跌機率,根據上漲的機率進行排序後,買入前n檔股票,每五日做一次換股。

假設n=20。則買進前20檔、多空對沖(買進前20同時放空後20檔)、以及0050的走勢比較圖如下。

n=20

n=20


可以看到只買進前二十檔的績效遠超過0050的報酬,而多空對沖則和0050相當,不過曲線更為平滑一些。

假設n=10%。則買進前10%、多空對沖(買進前10%同時放空後10%)、以及0050的走勢比較圖如下。

n=10%(約203檔)

n=10%(約203檔)


可以發現只買進前10%的報酬雖然下降,但仍然很明顯的大敗大盤,而多空對沖的策略則更加平滑,但報酬也跟著降低了。



總結

上一篇主要在介紹論文中的方法,這一篇則是把論文中的方法套用在台股上實驗。可以發現這個方法(或說這個因子)在台股上也是十分顯著有用的,下一篇我將把這個因子結合finlab上的策略進行優化。

覺得有幫助或是有趣的歡迎點贊關注,也歡迎贊助~。🙇

26會員
11內容數
這個專題會分享有關投資、量化、因子以及機器學習相關的內容。主要會以我有興趣的內容進行分享,希望能透過實際回測及實驗做為佐證,找尋股票市場中的ALPHA。
留言0
查看全部
發表第一個留言支持創作者!
Li way Cheng的沙龍 的其他內容
前言 這個系列打算分三篇來完成。 第一篇先來解析論文中的方法以及實驗結果。 第二篇會把這篇論文應用在台股上,評估效果如何。 第三篇會把這篇論文實作成因子套用在Finlab上進行回測。 動機 今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道
前言 這個系列打算分三篇來完成。 第一篇先來解析論文中的方法以及實驗結果。 第二篇會把這篇論文應用在台股上,評估效果如何。 第三篇會把這篇論文實作成因子套用在Finlab上進行回測。 動機 今天要介紹的論文是這篇 (Re-)Imag(in)ing Price Trends。會知道
你可能也想看
Google News 追蹤
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
不難發現大語言模型能對生產力與學習帶來許多幫助,未來教育型 AI 機器人很大機率將會成為主流,使用 AI 輔助學習、即時從 AI 獲得解答、利用 AI 學習新技能都會是新的學習場景。根據教育市調機構 HolonIQ 過去的報告顯示全球教育人工智能的投入預計 2025 年將達 60 億。
Thumbnail
未來,人工智慧(AI)預計將在各行各業帶來迅速的變革,重新塑造生活方式。文章探討了AI的定義,強調其模擬人類思維和行為的能力。AI已廣泛應用於手機、電腦、醫療、商業、教育和法律等領域,並影響生活的方方面面。
Thumbnail
2023年才到三月為止,VC投入生成式AI的市場的估值就已經超越了前兩年的總和,可以想見整年下來絕對是一個數量級以上的差異。難道AI是這兩年才發明出來的嗎? 為什麼忽然之間全世界都在關注AI呢?  這就是我們這邊文章想要探討的,究竟AI發展到現在是否有什麼突破? 為什麼大家開始關注起AI。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
繼大麻、人造肉、Gamestop,我最近覺得會被炒的股可能是 C3.ai 這家公司。 年初至今,也就是YTD回報,C3.ai(代號AI)的股價已經飆升了 133%,因為投資者對AI股票的狂熱正在升溫。儘管年初至今股價飆升,但 C3.ai 仍比 2020 年 12 月創下的每股 183.90 美元的歷
Thumbnail
近年來不斷有經濟預測分析所說的:「xx年內什麼行業會不見」已經不是預測,而是現在進行式,專家所說的,二十年內所有勞動階級都會被取代,其實是太過樂觀的預估,因為不只勞動業,而是幾乎所有行業都將會產生天翻地覆的改變。 當人工智慧愈來愈厲害,設置價格愈來愈低廉時,這種可以二十四小時工作,不必管一例一休,不
Thumbnail
☆2019美國「鸚鵡螺圖書獎」獲獎書籍☆ ☆普立茲獎得主《第六次大滅絕》作者 伊麗莎白‧寇伯特激賞之書☆ ☆亞馬遜書店逾兩百則評價,讀者平均四點六顆星好評推薦☆ ➢➢嚴峻的氣候與環境挑戰當前,全球糧食危機迫在眉睫, 想要繼續餵飽全世界,就得在傳統與與創新間找出「第三條路」!
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
不難發現大語言模型能對生產力與學習帶來許多幫助,未來教育型 AI 機器人很大機率將會成為主流,使用 AI 輔助學習、即時從 AI 獲得解答、利用 AI 學習新技能都會是新的學習場景。根據教育市調機構 HolonIQ 過去的報告顯示全球教育人工智能的投入預計 2025 年將達 60 億。
Thumbnail
未來,人工智慧(AI)預計將在各行各業帶來迅速的變革,重新塑造生活方式。文章探討了AI的定義,強調其模擬人類思維和行為的能力。AI已廣泛應用於手機、電腦、醫療、商業、教育和法律等領域,並影響生活的方方面面。
Thumbnail
2023年才到三月為止,VC投入生成式AI的市場的估值就已經超越了前兩年的總和,可以想見整年下來絕對是一個數量級以上的差異。難道AI是這兩年才發明出來的嗎? 為什麼忽然之間全世界都在關注AI呢?  這就是我們這邊文章想要探討的,究竟AI發展到現在是否有什麼突破? 為什麼大家開始關注起AI。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
繼大麻、人造肉、Gamestop,我最近覺得會被炒的股可能是 C3.ai 這家公司。 年初至今,也就是YTD回報,C3.ai(代號AI)的股價已經飆升了 133%,因為投資者對AI股票的狂熱正在升溫。儘管年初至今股價飆升,但 C3.ai 仍比 2020 年 12 月創下的每股 183.90 美元的歷
Thumbnail
近年來不斷有經濟預測分析所說的:「xx年內什麼行業會不見」已經不是預測,而是現在進行式,專家所說的,二十年內所有勞動階級都會被取代,其實是太過樂觀的預估,因為不只勞動業,而是幾乎所有行業都將會產生天翻地覆的改變。 當人工智慧愈來愈厲害,設置價格愈來愈低廉時,這種可以二十四小時工作,不必管一例一休,不
Thumbnail
☆2019美國「鸚鵡螺圖書獎」獲獎書籍☆ ☆普立茲獎得主《第六次大滅絕》作者 伊麗莎白‧寇伯特激賞之書☆ ☆亞馬遜書店逾兩百則評價,讀者平均四點六顆星好評推薦☆ ➢➢嚴峻的氣候與環境挑戰當前,全球糧食危機迫在眉睫, 想要繼續餵飽全世界,就得在傳統與與創新間找出「第三條路」!
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?