利用Gemini3 實做台股相關因素分析

我最近都在玩 Google出的Gemini3 AI 模型。今天我就嚐試把一些台股股市的一些數值套用Gemini3 AI 模型玩看看。在本文中我就嚐試叫AI做出最基礎的單變數線性迴歸分析，因為有蒐集與大盤指數變動的一些變數，所以也就順便進行多變數迴歸分析。除此之外，金融市場裡存在時間序列關係，於是進行時間序列分析，看看效果如何？結論是又快又厲害。也對，凡理論上的東西是難不倒AＩ的，但人類最大的價值是要懂學科理論，像廚師一樣做料理，把所有的原料放入鍋內炒一炒，但炒的好不好吃，就看廚師的功力了。所以ＡＩ只我們的助手，而最終還是要人類判讀AＩ產出的資訊。千萬不要GIGO。

壹、先產出簡單的單變數線性迴歸分析

提供 CSV 檔案中的加權指數與周成交量之間的線性迴歸關係。執行以下步驟：資料預處理：確認並處理「大盤指數」與「周成交量」這兩組數據。計算線性迴歸：使用最小平方法 (Ordinary Least Squares, OLS) 建立模型，形如 Y = a + bX，其中 Y 為加權指數（依變數），X 為周成交量（自變數）。結果解釋：提供迴歸方程式、迴歸係數（斜率 b）、截距 a 以及判定係數 R Square 。

我們建立的線性迴歸模型為：

　　　　　　　　　　　　加權指數 = a + b *周成交量

1. 迴歸係數 (斜率 b)　數值： b= 0.528

解釋： 迴歸係數 b 為正值，表示加權指數與周成交量之間存在正向關　係。實際意義：在其他條件不變的情況下，周成交量每增加 1 億元，預期加權指數將平均增加約 0.528 點。

2. 截距a

數值： a= 8730.01
解釋： 當周成交量為 0 億元時，預期的加權指數約為 8,730.01 點。在實際市場情況中，這主要是一個數學上的調整項。

3. 判定係數R Square

　數值： R^2 = 0.771解釋： R^2 衡量了自變數（周成交量）解釋依變數（加權指數）變異程度的能力。實際意義：約 77.1% 的加權指數變動可以由周成交量的變動來解釋。這表明周成交量對加權指數具有相當高的解釋能力，模型配適度良好。

📝 結論：線性迴歸方程式

根據以上計算，加權指數與周成交量的線性迴歸方程式為：

加權指數 = 8730.01 + 0.528 *周成交量

🔍 總結與市場意涵

關聯性強：R^2 值高0.771，顯示加權指數的變動與周成交量的變動呈現高度相關。
價量關係：正向斜率0.528 符合「價量同步」的市場原則：成交量增加，通常伴隨著指數上漲，顯示市場買氣旺盛，推動股價上揚。

計算並檢驗係數的 P 值 (p-value) 來評估統計顯著性？

計算並檢驗迴歸係數斜率b的 P 值 (p-value)，以評估周成交量對加權指數的解釋是否具有統計顯著性。

📊 統計顯著性檢驗結果

在這個線性迴歸分析中，我們關注兩個核心的統計量：

迴歸係數的 P 值 (p-value)：檢驗斜率 b 是否顯著不等於零。
模型的 F 統計量及 P 值：檢驗整個模型的顯著性。

周成交量的 P 值為極小值 (< 0.001)。

在一般的統計顯著水準之下，P 值遠小於 0.05

結論：我們有充分的統計證據拒絕虛無假設。這表示周成交量的迴歸係數具有高度統計顯著性，證明周成交量的變動確實能顯著地解釋加權指數的變動。

根據最小平方法 (OLS) 計算出來的線性迴歸線。並繪圖如下：

貳、做一個多變數的多元迴歸方程式

依變數 (Dependent Variable, Y): 大盤指數

自變數 (Independent Variables ,X):

X1：交易量
X2：當沖比 (市)
X3：當沖比 (櫃)
X4：本益比 (市)
X5：本益比 (櫃)
X6：融資
X7：融券

我會先對資料進行必要的轉置（將時間點作為觀察值/列，變數作為欄位），然後建立迴歸模型：

接下來進行Durbin-Watson 檢定 (Durbin-Watson Test)，檢定用於確認迴歸模型的殘差是否具有一階自相關 (First-order Autocorrelation)。

檢定結果 DW = 0.85：這個數值遠低於 2.0，且接近 0，強烈表示模型殘差存在顯著的正向自相關。

參、對這些重要的市場指標進行時間序列分析 (Time Series Analysis)。

變數包括：

價格/指數相關： 大盤指數
成交相關： 交易量
熱度/投機相關： 當沖比（市）、當沖比（櫃）
估值相關： 本益比（市）、本益比（櫃）
槓桿/籌碼相關： 融資、融券

好的，針對您提供的 8 個變數（大盤指數、交易量、當沖比、本益比、融資、融券等），若要進行 ARIMA 類型的分析，最適合的方法是 ARIMAX (ARIMA with eXogenous variables) 模型。

標準 ARIMA：只能用「大盤指數」自己的歷史數據來預測未來（單變數）。
ARIMAX：可以將「交易量」、「融資」、「本益比」等其他 7 個變數作為外部解釋變數 (Exogenous Variables) 加入模型。這樣我們就能分析這些指標變動時，對大盤指數的具體影響。

由於您的數據量較少（約 26 筆），一次放入所有 7 個變數會導致模型無法計算（自由度不足）。因此，AI將執行以下優化步驟：

數據預處理：對所有數據進行一階差分（轉為「變動量」），以滿足平穩性要求。
特徵篩選：計算這 7 個變數與「大盤指數」的相關係數，挑選出相關性最高的 2-3 個關鍵指標作為輸入，以確保模型穩定。
ARIMAX 建模：建立模型並解釋結果。

下圖顯現出各變數差分後的相關係數矩陣。例如大盤指數與「當沖比」、「融資餘額」二個變數間產生較大的正相關。而交易量與「當沖比（市）」、「當沖比（櫃）」二個變數間有比較大的負相關。

另外從下圖可以看出，紅色的虛線（模型預測）相當緊密地跟隨藍色的實線（實際走勢）。這表明只要我們掌握了融資餘額和當沖熱度的變化，就能相當準確地解釋這段期間大盤的波動。

📊 ARIMAX 時間序列分析結果

針對提供的數據，執行了 ARIMAX (AutoRegressive Integrated Moving Average with Exogenous variables) 分析。

由於單純的 ARIMA 只能依賴過去的指數來預測未來，而您提供了多個市場指標，因此 ARIMAX 是最佳選擇。這能讓我們量化其他指標（如融資、當沖比）對大盤指數的「解釋能力」。

檢測平穩性 (Stationarity Test)

檢定方法：使用 ADF (Augmented Dickey-Fuller) 或 KPSS 檢定。背景知識：大多數傳統的時間序列模型（如 ARIMA）要求數據是平穩的（即均值、變異數和自相關結構不隨時間變化）。目標：判斷是否需要進行差分 (Differencing)（例如，取一階差分 Delta Y_t = Y_t - YDelta(t-1）來消除趨勢。

1. 關鍵變數篩選 (Feature Selection)

為了避免模型在數據量較少的情況下過擬合，我先計算了各指標變動量與大盤指數變動量的相關性，並挑選出最具影響力的變數：

與大盤連動性最高的指標：
1. 融資 (Correlation: 0.62)：正高度相關，顯示散戶/槓桿資金的進出與大盤漲跌方向一致性高。
2. 當沖比（市）(Correlation: 0.55)：正相關，顯示市場投機氣氛（當沖熱度）越高，大盤傾向於上漲（或大盤上漲吸引更多當沖）。
其他指標：
- 交易量 (-0.04)：意外地呈現微弱負相關，這可能表示在您的數據區間內，「量大」不一定對應「價漲」，或者存在量價背離的情況。

2. ARIMAX 模型結果摘要

我們使用融資和 當沖比（市） 作為外部預測因子來解釋 大盤指數 的變動。

💡 結論與投資洞察

緊盯「融資」：在您的數據區間內，融資餘額是預測大盤最強的領先/同步指標。如果融資持續增加，大盤上漲機率極高；反之若融資開始退潮，需警惕大盤回調。
當沖熱度助漲：當沖比率上升通常伴隨著指數上漲，這反映了市場的熱絡程度。
量能訊號不明：單純的「總交易量」在本模型中預測力不佳，建議將焦點放在「有槓桿性質的資金」（融資）而非整體成交量。