利用Gemini3 實做台股相關因素分析

更新 發佈閱讀 9 分鐘

我最近都在玩 Google出的Gemini3 AI 模型。今天我就嚐試把一些台股股市的一些數值套用Gemini3 AI 模型玩看看。在本文中我就嚐試叫AI做出最基礎的單變數線性迴歸分析,因為有蒐集與大盤指數變動的一些變數,所以也就順便進行多變數迴歸分析。除此之外,金融市場裡存在時間序列關係,於是進行時間序列分析,看看效果如何?結論是又快又厲害。也對,凡理論上的東西是難不倒AI的,但人類最大的價值是要懂學科理論,像廚師一樣做料理,把所有的原料放入鍋內炒一炒,但炒的好不好吃,就看廚師的功力了。所以AI只我們的助手,而最終還是要人類判讀AI產出的資訊。千萬不要GIGO。


壹、先產出簡單的單變數線性迴歸分析

提供 CSV 檔案中的加權指數與周成交量之間的線性迴歸關係。執行以下步驟:資料預處理:確認並處理「大盤指數」與「周成交量」這兩組數據。計算線性迴歸:使用最小平方法 (Ordinary Least Squares, OLS) 建立模型,形如 Y = a + bX,其中 Y 為加權指數(依變數),X 為周成交量(自變數)。結果解釋:提供迴歸方程式、迴歸係數(斜率 b)、截距 a 以及判定係數 R Square 。

 我們建立的線性迴歸模型為:

            加權指數 = a + b *周成交量

 

1. 迴歸係數 (斜率 b) 數值: b= 0.528

解釋: 迴歸係數 b 為正值,表示加權指數與周成交量之間存在正向關 係。實際意義: 在其他條件不變的情況下,周成交量每增加 1 億元,預期加權指數將平均增加約 0.528 點。

2. 截距a

  • 數值: a= 8730.01
  • 解釋: 當周成交量為 0 億元時,預期的加權指數約為 8,730.01 點。在實際市場情況中,這主要是一個數學上的調整項。

3. 判定係數R Square

 數值: R^2 = 0.771解釋: R^2 衡量了自變數(周成交量)解釋依變數(加權指數)變異程度的能力。實際意義: 約 77.1% 的加權指數變動可以由周成交量的變動來解釋。這表明周成交量對加權指數具有相當高的解釋能力,模型配適度良好

📝 結論:線性迴歸方程式

根據以上計算,加權指數與周成交量的線性迴歸方程式為:

加權指數 = 8730.01 + 0.528 *周成交量


🔍 總結與市場意涵

  • 關聯性強:R^2 值高0.771,顯示加權指數的變動與周成交量的變動呈現高度相關。
  • 價量關係:正向斜率0.528 符合「價量同步」的市場原則:成交量增加,通常伴隨著指數上漲,顯示市場買氣旺盛,推動股價上揚。

 

計算並檢驗係數的 P 值 (p-value) 來評估統計顯著性?

計算並檢驗迴歸係數斜率b的 P 值 (p-value),以評估周成交量對加權指數的解釋是否具有統計顯著性。

📊 統計顯著性檢驗結果

在這個線性迴歸分析中,我們關注兩個核心的統計量:

  1. 迴歸係數的 P 值 (p-value):檢驗斜率 b 是否顯著不等於零。
  2. 模型的 F 統計量及 P 值:檢驗整個模型的顯著性。

周成交量的 P 值為極小值 (< 0.001)。

在一般的統計顯著水準之下,P 值遠小於 0.05

結論: 我們有充分的統計證據拒絕虛無假設。這表示周成交量的迴歸係數具有高度統計顯著性,證明周成交量的變動確實能顯著地解釋加權指數的變動。


根據最小平方法 (OLS) 計算出來的線性迴歸線。並繪圖如下:

raw-image


貳、做一個多變數的多元迴歸方程式

依變數 (Dependent Variable, Y): 大盤指數

 自變數 (Independent Variables ,X):

  • X1:交易量
  • X2:當沖比 (市)
  • X3:當沖比 (櫃)
  • X4:本益比 (市)
  • X5:本益比 (櫃)
  • X6:融資
  • X7:融券

我會先對資料進行必要的轉置(將時間點作為觀察值/列,變數作為欄位),然後建立迴歸模型:

raw-image
raw-image
raw-image
raw-image
raw-image

接下來進行Durbin-Watson 檢定 (Durbin-Watson Test),檢定用於確認迴歸模型的殘差是否具有一階自相關 (First-order Autocorrelation)。

檢定結果 DW = 0.85:這個數值遠低於 2.0,且接近 0,強烈表示模型殘差存在顯著的 正向自相關。


參、對這些重要的市場指標進行時間序列分析 (Time Series Analysis)。

變數包括:

  • 價格/指數相關: 大盤指數
  • 成交相關: 交易量
  • 熱度/投機相關: 當沖比(市)、當沖比(櫃)
  • 估值相關: 本益比(市)、本益比(櫃)
  • 槓桿/籌碼相關: 融資、融券

好的,針對您提供的 8 個變數(大盤指數、交易量、當沖比、本益比、融資、融券等),若要進行 ARIMA 類型的分析,最適合的方法是 ARIMAX (ARIMA with eXogenous variables) 模型。

  • 標準 ARIMA:只能用「大盤指數」自己的歷史數據來預測未來(單變數)。
  • ARIMAX:可以將「交易量」、「融資」、「本益比」等其他 7 個變數作為外部解釋變數 (Exogenous Variables) 加入模型。這樣我們就能分析這些指標變動時,對大盤指數的具體影響。

由於您的數據量較少(約 26 筆),一次放入所有 7 個變數會導致模型無法計算(自由度不足)。因此,AI將執行以下優化步驟:

  1. 數據預處理:對所有數據進行一階差分(轉為「變動量」),以滿足平穩性要求。
  2. 特徵篩選:計算這 7 個變數與「大盤指數」的相關係數,挑選出相關性最高的 2-3 個關鍵指標作為輸入,以確保模型穩定。
  3. ARIMAX 建模:建立模型並解釋結果。


下圖顯現出各變數差分後的相關係數矩陣。例如大盤指數與「當沖比」、「融資餘額」二個變數間產生較大的正相關。而交易量與「當沖比(市)」、「當沖比(櫃)」二個變數間有比較大的負相關。


raw-image


另外從下圖 可以看出,紅色的虛線(模型預測)相當緊密地跟隨藍色的實線(實際走勢)。這表明只要我們掌握了融資餘額當沖熱度的變化,就能相當準確地解釋這段期間大盤的波動。

raw-image

📊 ARIMAX 時間序列分析結果

針對提供的數據,執行了 ARIMAX (AutoRegressive Integrated Moving Average with Exogenous variables) 分析。

由於單純的 ARIMA 只能依賴過去的指數來預測未來,而您提供了多個市場指標,因此 ARIMAX 是最佳選擇。這能讓我們量化其他指標(如融資、當沖比)對大盤指數的「解釋能力」。

檢測平穩性 (Stationarity Test)

  • 檢定方法:使用 ADF (Augmented Dickey-Fuller) 或 KPSS 檢定。背景知識: 大多數傳統的時間序列模型(如 ARIMA)要求數據是平穩的(即均值、變異數和自相關結構不隨時間變化)。目標: 判斷是否需要進行差分 (Differencing)(例如,取一階差分 Delta Y_t = Y_t - YDelta(t-1)來消除趨勢。

1. 關鍵變數篩選 (Feature Selection)

為了避免模型在數據量較少的情況下過擬合,我先計算了各指標變動量與大盤指數變動量的相關性,並挑選出最具影響力的變數:

  • 與大盤連動性最高的指標
    1. 融資 (Correlation: 0.62):正高度相關,顯示散戶/槓桿資金的進出與大盤漲跌方向一致性高。
    2. 當沖比(市)(Correlation: 0.55):正相關,顯示市場投機氣氛(當沖熱度)越高,大盤傾向於上漲(或大盤上漲吸引更多當沖)。
  • 其他指標
    • 交易量 (-0.04):意外地呈現微弱負相關,這可能表示在您的數據區間內,「量大」不一定對應「價漲」,或者存在量價背離的情況。

2. ARIMAX 模型結果摘要

我們使用 融資當沖比(市) 作為外部預測因子來解釋 大盤指數 的變動。

💡 結論與投資洞察

  1. 緊盯「融資」:在您的數據區間內,融資餘額是預測大盤最強的領先/同步指標。如果融資持續增加,大盤上漲機率極高;反之若融資開始退潮,需警惕大盤回調。
  2. 當沖熱度助漲:當沖比率上升通常伴隨著指數上漲,這反映了市場的熱絡程度。
  3. 量能訊號不明:單純的「總交易量」在本模型中預測力不佳,建議將焦點放在「有槓桿性質的資金」(融資)而非整體成交量。



留言
avatar-img
曹滴掉~ 寬廣vs渺小的沙龍
16.2K會員
223內容數
大量閱讀讓我可以滿足探索未知。這裡大多數是我閱讀後的心得。我是認真讀後再分享,記錄於此,私心為己。可能有些內容比較硬澀,若您真有興趣,讀它可能需要耐心及用心,或許燒腦。我相信弱水三千,獨取一飄飲,自有共鳴之夥伴長相左右。
2025/10/25
本書的核心架構為  致富公式= 【基本面好轉+低價位】+ 【長期投資】
Thumbnail
2025/10/25
本書的核心架構為  致富公式= 【基本面好轉+低價位】+ 【長期投資】
Thumbnail
2025/05/16
顯而之,書名中有「付出的代價」,已經說明四位作者的立場是批評央行的政策,這二十年,央行為了提高台灣廠商的出口競爭力,必須壓低新台幣兌美元匯率。又同時,為了防堵國際熱錢進入台灣後抄高新台幣匯率,也必須壓低利率讓熱錢無利可圖不會進入台灣。
Thumbnail
2025/05/16
顯而之,書名中有「付出的代價」,已經說明四位作者的立場是批評央行的政策,這二十年,央行為了提高台灣廠商的出口競爭力,必須壓低新台幣兌美元匯率。又同時,為了防堵國際熱錢進入台灣後抄高新台幣匯率,也必須壓低利率讓熱錢無利可圖不會進入台灣。
Thumbnail
2025/05/14
本書作者是橡樹資本公司董事長暨共同創辦人霍華 馬克斯(Howard Marks),書中有關他關於投資心得備忘錄之彙集之作。為什麼他的書吸引股神巴菲特讀了兩遍呢? 我想是因為他的論述很有哲理,與巴菲特之投資理論相似,更重要的是1995年成立的橡樹資本公司在2016年管理資產超過1000億美元。
Thumbnail
2025/05/14
本書作者是橡樹資本公司董事長暨共同創辦人霍華 馬克斯(Howard Marks),書中有關他關於投資心得備忘錄之彙集之作。為什麼他的書吸引股神巴菲特讀了兩遍呢? 我想是因為他的論述很有哲理,與巴菲特之投資理論相似,更重要的是1995年成立的橡樹資本公司在2016年管理資產超過1000億美元。
Thumbnail
看更多