我最近都在玩 Google出的Gemini3 AI 模型。今天我就嚐試把一些台股股市的一些數值套用Gemini3 AI 模型玩看看。在本文中我就嚐試叫AI做出最基礎的單變數線性迴歸分析,因為有蒐集與大盤指數變動的一些變數,所以也就順便進行多變數迴歸分析。除此之外,金融市場裡存在時間序列關係,於是進行時間序列分析,看看效果如何?結論是又快又厲害。也對,凡理論上的東西是難不倒AI的,但人類最大的價值是要懂學科理論,像廚師一樣做料理,把所有的原料放入鍋內炒一炒,但炒的好不好吃,就看廚師的功力了。所以AI只我們的助手,而最終還是要人類判讀AI產出的資訊。千萬不要GIGO。
提供 CSV 檔案中的加權指數與周成交量之間的線性迴歸關係。執行以下步驟:資料預處理:確認並處理「大盤指數」與「周成交量」這兩組數據。計算線性迴歸:使用最小平方法 (Ordinary Least Squares, OLS) 建立模型,形如 Y = a + bX,其中 Y 為加權指數(依變數),X 為周成交量(自變數)。結果解釋:提供迴歸方程式、迴歸係數(斜率 b)、截距 a 以及判定係數 R Square 。
我們建立的線性迴歸模型為:
加權指數 = a + b *周成交量
1. 迴歸係數 (斜率 b) 數值: b= 0.528
解釋: 迴歸係數 b 為正值,表示加權指數與周成交量之間存在正向關 係。實際意義: 在其他條件不變的情況下,周成交量每增加 1 億元,預期加權指數將平均增加約 0.528 點。
2. 截距a
- 數值: a= 8730.01
- 解釋: 當周成交量為 0 億元時,預期的加權指數約為 8,730.01 點。在實際市場情況中,這主要是一個數學上的調整項。
3. 判定係數R Square
數值: R^2 = 0.771解釋: R^2 衡量了自變數(周成交量)解釋依變數(加權指數)變異程度的能力。實際意義: 約 77.1% 的加權指數變動可以由周成交量的變動來解釋。這表明周成交量對加權指數具有相當高的解釋能力,模型配適度良好。
📝 結論:線性迴歸方程式
根據以上計算,加權指數與周成交量的線性迴歸方程式為:
加權指數 = 8730.01 + 0.528 *周成交量
🔍 總結與市場意涵
- 關聯性強:R^2 值高0.771,顯示加權指數的變動與周成交量的變動呈現高度相關。
- 價量關係:正向斜率0.528 符合「價量同步」的市場原則:成交量增加,通常伴隨著指數上漲,顯示市場買氣旺盛,推動股價上揚。
計算並檢驗係數的 P 值 (p-value) 來評估統計顯著性?
計算並檢驗迴歸係數斜率b的 P 值 (p-value),以評估周成交量對加權指數的解釋是否具有統計顯著性。
📊 統計顯著性檢驗結果
在這個線性迴歸分析中,我們關注兩個核心的統計量:
- 迴歸係數的 P 值 (p-value):檢驗斜率 b 是否顯著不等於零。
- 模型的 F 統計量及 P 值:檢驗整個模型的顯著性。
周成交量的 P 值為極小值 (< 0.001)。
在一般的統計顯著水準之下,P 值遠小於 0.05
結論: 我們有充分的統計證據拒絕虛無假設。這表示周成交量的迴歸係數具有高度統計顯著性,證明周成交量的變動確實能顯著地解釋加權指數的變動。
根據最小平方法 (OLS) 計算出來的線性迴歸線。並繪圖如下:

貳、做一個多變數的多元迴歸方程式
依變數 (Dependent Variable, Y): 大盤指數
自變數 (Independent Variables ,X):
- X1:交易量
- X2:當沖比 (市)
- X3:當沖比 (櫃)
- X4:本益比 (市)
- X5:本益比 (櫃)
- X6:融資
- X7:融券
我會先對資料進行必要的轉置(將時間點作為觀察值/列,變數作為欄位),然後建立迴歸模型:





接下來進行Durbin-Watson 檢定 (Durbin-Watson Test),檢定用於確認迴歸模型的殘差是否具有一階自相關 (First-order Autocorrelation)。
檢定結果 DW = 0.85:這個數值遠低於 2.0,且接近 0,強烈表示模型殘差存在顯著的 正向自相關。
參、對這些重要的市場指標進行時間序列分析 (Time Series Analysis)。
變數包括:
- 價格/指數相關: 大盤指數
- 成交相關: 交易量
- 熱度/投機相關: 當沖比(市)、當沖比(櫃)
- 估值相關: 本益比(市)、本益比(櫃)
- 槓桿/籌碼相關: 融資、融券
好的,針對您提供的 8 個變數(大盤指數、交易量、當沖比、本益比、融資、融券等),若要進行 ARIMA 類型的分析,最適合的方法是 ARIMAX (ARIMA with eXogenous variables) 模型。
- 標準 ARIMA:只能用「大盤指數」自己的歷史數據來預測未來(單變數)。
- ARIMAX:可以將「交易量」、「融資」、「本益比」等其他 7 個變數作為外部解釋變數 (Exogenous Variables) 加入模型。這樣我們就能分析這些指標變動時,對大盤指數的具體影響。
由於您的數據量較少(約 26 筆),一次放入所有 7 個變數會導致模型無法計算(自由度不足)。因此,AI將執行以下優化步驟:
- 數據預處理:對所有數據進行一階差分(轉為「變動量」),以滿足平穩性要求。
- 特徵篩選:計算這 7 個變數與「大盤指數」的相關係數,挑選出相關性最高的 2-3 個關鍵指標作為輸入,以確保模型穩定。
- ARIMAX 建模:建立模型並解釋結果。
下圖顯現出各變數差分後的相關係數矩陣。例如大盤指數與「當沖比」、「融資餘額」二個變數間產生較大的正相關。而交易量與「當沖比(市)」、「當沖比(櫃)」二個變數間有比較大的負相關。

另外從下圖 可以看出,紅色的虛線(模型預測)相當緊密地跟隨藍色的實線(實際走勢)。這表明只要我們掌握了融資餘額和當沖熱度的變化,就能相當準確地解釋這段期間大盤的波動。

📊 ARIMAX 時間序列分析結果
針對提供的數據,執行了 ARIMAX (AutoRegressive Integrated Moving Average with Exogenous variables) 分析。
由於單純的 ARIMA 只能依賴過去的指數來預測未來,而您提供了多個市場指標,因此 ARIMAX 是最佳選擇。這能讓我們量化其他指標(如融資、當沖比)對大盤指數的「解釋能力」。
檢測平穩性 (Stationarity Test)
- 檢定方法:使用 ADF (Augmented Dickey-Fuller) 或 KPSS 檢定。背景知識: 大多數傳統的時間序列模型(如 ARIMA)要求數據是平穩的(即均值、變異數和自相關結構不隨時間變化)。目標: 判斷是否需要進行差分 (Differencing)(例如,取一階差分 Delta Y_t = Y_t - YDelta(t-1)來消除趨勢。
1. 關鍵變數篩選 (Feature Selection)
為了避免模型在數據量較少的情況下過擬合,我先計算了各指標變動量與大盤指數變動量的相關性,並挑選出最具影響力的變數:
- 與大盤連動性最高的指標:
- 融資 (Correlation: 0.62):正高度相關,顯示散戶/槓桿資金的進出與大盤漲跌方向一致性高。
- 當沖比(市)(Correlation: 0.55):正相關,顯示市場投機氣氛(當沖熱度)越高,大盤傾向於上漲(或大盤上漲吸引更多當沖)。
- 其他指標:
- 交易量 (-0.04):意外地呈現微弱負相關,這可能表示在您的數據區間內,「量大」不一定對應「價漲」,或者存在量價背離的情況。
2. ARIMAX 模型結果摘要
我們使用 融資 和 當沖比(市) 作為外部預測因子來解釋 大盤指數 的變動。
💡 結論與投資洞察
- 緊盯「融資」:在您的數據區間內,融資餘額是預測大盤最強的領先/同步指標。如果融資持續增加,大盤上漲機率極高;反之若融資開始退潮,需警惕大盤回調。
- 當沖熱度助漲:當沖比率上升通常伴隨著指數上漲,這反映了市場的熱絡程度。
- 量能訊號不明:單純的「總交易量」在本模型中預測力不佳,建議將焦點放在「有槓桿性質的資金」(融資)而非整體成交量。





