統計急救箱──用共變數描述分數之間的關係（下）

更新於 2024/09/16發佈於 2023/09/17閱讀時間約 3 分鐘

　　由於共變數的解釋有點太長了，就分成上下兩篇。如果看過上一篇統計急救箱──用共變數描述分數之間的關係（上）還不太確定共變數要怎麼計算，這篇會用圖像的方式來進行解釋，最後也會提及共變數的小缺點。

用面積來理解共變異數

　　如同變異數可以用面積的方式來理解一樣（參考統計急救箱─樣本變異數與標準差），共變數也可以算是一種變異數，也可以用面積的方式來理解它。和變異數最大的不同是，變異數只有一種數值，但共變數則有兩種。例如下圖中，每一個相同顏色的人都有x和y兩個數值，平均數分別是5.2和4.8。

每個人都有x和y兩種數值

　　接著我們在兩群數值上計算每個人和平均值之間相差多少。和變異數不同的是，在平均數左邊的線段會用淺色表示，平均數右邊的線段則用深色表示。

顏色深淺表示方向，長短表示離均差的大小

把這些線段排列一下，整理成下面的樣子就可以清楚的看到每個人有兩個離均差了。

每個人都會有兩個離均差

　　根據共變數的公式，要先把每個人的這兩個線段相乘起來。也就是說，用這兩個線段當邊長圍出一個矩形。

矩形分成左半邊與右半邊兩種

在上圖當中，刻意區分出了兩種不同的矩形。左半邊的矩形面積顏色較淺（人也放在矩形裡面），右半邊的矩形面積顏色較深（人則是放在上面）。這樣區分的依據其實就是上面提到線段的顏色，如果矩形的邊長都是淺色或者都是深色，就會是淺色的矩形；如果矩形的邊長是深淺交錯，就會是右邊深色的矩形。

　　就如同上面說的，深色的線段表示離均差是正數，而淺色的線段表示離均差是負數。因此深淺相同的線段相乘（離均差皆為正或者皆為負），會成為一個正值；而深淺不同的線段相乘（離均差一正一負）就會是一個負值。共變數的計算需要把這些矩形通通加起來，只不過不同顏色的矩形彼此是要相減的（因為正負值不同）。

　　也就是說，我們要把左邊灰色的矩形加起來變成一個大矩形，右邊深色的矩形加起來也變成一個大的深色矩形，然後兩者相減。

共變異數需要考慮方向性，所以兩種矩形的面積要相減

最後剩餘的面積，就是所謂的積差和 (Sum of Cross-Product, SP of CP) 囉！這也就是共變異數公式當中的分子部分。

積差和

　　再來只要把積差和平分給每一個人，每個人都會得到一個小小的矩形，這個矩形就是共變數啦～

把積差和平分給每個人就成為共變數

有興趣的讀者可以回去之前的文章對照看看變異數和共變數的計算過程，就可以知道共變數和變異數的主要差別在於要考慮方向性的問題，不過整個計算過程其實和變異數是相同的。

共變異數受到測量單位影響

　　共變數在多變量統計當中是非常重要的，不過在描述兩群數值關係的時候，共變異數存在一個不太方便的地方──共變數是具有單位的，也就共變數的大小會隨著單位不同而改變，因此我們沒有辦法光看共變數就知道兩群數值的關聯性有多強。

　　舉例而言，假如上面的x指的是年資，而上面的y指的是月收入（萬元），那麼共變數最後的單位就會是：年 x 萬元。

當計算年資和月收入的共變數時，單位是年 x 萬元

那麼如果今天換成計算身高（公分）和月收入之間的共變，最後的共變數單位就會是：公分 x 萬元。由於身高往往會比年資更大，因此身高和收入之間的共變數一定會比年資和收入更大。但是按照常理來說，年資和收入之間的關係應該比身高和收入來得更為強烈才對。

　　所以如果光是要描述關聯性，共變數可能不是一個很方便的東西。不過只要經過一點簡單的處理，共變數就可以擺脫單位的影響，成為一個很好拿來描述關聯性的指標，那就是皮爾森線性相關係數，也是下一篇文章的主題。

統計急救箱的沙龍社會科學初心者的統計急救箱

留言

留言分享你的想法！

統計急救箱的沙龍

71會員

32內容數

大學念文組，碩士班的報告突然要用統計了怎麼辦？沒學過統計怎麼寫量化學位論文？跟著統計書操作都沒問題，但報表都不知道在講什麼，也不知道做的分析到底對不對？作者在應用統計的路上跌跌撞撞也差不多十年了，希望有些心得可以幫助到有這些困擾的你。

統計急救箱的沙龍的其他內容

2024/12/29

統計急救箱─使用獨立t test的時機與前提

　　上回講了獨立樣本t test的運作原理，不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test，以及在什麼條件下可以使用獨立樣本t test？

2024/12/29

統計急救箱─使用獨立t test的時機與前提

2024/12/15

統計急救箱─獨立樣本t檢定

　在實務上，t檢定最常被拿來使用的時機是檢驗兩個群體的（母體）平均數是不是相同。

2024/12/15

統計急救箱─獨立樣本t檢定

　在實務上，t檢定最常被拿來使用的時機是檢驗兩個群體的（母體）平均數是不是相同。

2024/10/20

統計急救箱─相關係數的顯著性

既然現在講完t檢定的基礎了，正好是時候來談談單樣本t檢定的重要用途之一：檢定相關係數的顯著性。

2024/10/20

統計急救箱─相關係數的顯著性

既然現在講完t檢定的基礎了，正好是時候來談談單樣本t檢定的重要用途之一：檢定相關係數的顯著性。

看更多

你可能也想看

黛•Adele的生活隨筆

斜槓生活日常｜不受時間空間限制，分享喜歡的產品也能有被動收入｜蝦皮分潤計畫

常常被朋友問「哪裡買的？」嗎？透過蝦皮分潤計畫，把日常購物的分享多加一個步驟，就能轉換成現金回饋。門檻低、申請簡單，特別適合學生與上班族，讓零碎時間也能創造小確幸。

#蝦皮分潤計畫#蝦皮聯盟行銷#蝦皮副業

2025/09/06

黛•Adele的生活隨筆

斜槓生活日常｜不受時間空間限制，分享喜歡的產品也能有被動收入｜蝦皮分潤計畫

#蝦皮分潤計畫#蝦皮聯盟行銷#蝦皮副業

2025/09/06

統計急救箱的沙龍

統計急救箱─皮爾森相關

前面兩篇會刻意提到共變數，除了因為共變數在多變量統計裡面非常重要之外，最主要的原因其實是為了解釋皮爾森相關係數而做鋪陳。相關係數的種類也相當的繁多，這裡介紹的皮爾森相關大概是最常看到的一種啦～

2023/09/24

2023/09/24

統計急救箱──用共變數描述分數之間的關係（下）

如果看過上一篇還不太確定共變數要怎麼計算，這篇會用圖像的方式來進行解釋，最後也會提及共變數的小缺點。

#統計#統計急救箱#社會科學

2023/09/17

統計急救箱的沙龍

統計急救箱──用共變數描述分數之間的關係（下）

如果看過上一篇還不太確定共變數要怎麼計算，這篇會用圖像的方式來進行解釋，最後也會提及共變數的小缺點。

#統計#統計急救箱#社會科學

2023/09/17

統計急救箱的沙龍

統計急救箱──標準分數

在知道平均數與標準差之後，就可以進一步了解什麼是所謂的「標準分數」了。標準分數的重要用途是可以幫助我們比較不同單位、不同分散程度的數值。以概念來說，跟百分等級（PR）有點類似的味道吧。標準分數在後續的統計當中也很常會出現的。

2023/08/28

2023/08/28

在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。

#模型#觀察

2023/08/06

MC 統計的沙龍

迴歸係數的解釋

在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。

#模型#觀察

2023/08/06

統計急救箱的沙龍

統計急救箱──樣本變異數與標準差（二）

通常討論標準差都會用面積的方式來解釋，不過有天我想也許可以用空間來解釋。但這樣解釋對於標準差和變異數的理解似乎並不完整，可以當個有趣的觀點看看就好。

2023/08/06

2023/08/06

　　雖然多數人應該都知道平均數是什麼，也會計算平均數，不過平均數是統計當中非常常使用的統計量，因此還是做一些基本的介紹吧。　　順便趁這機會解釋一下令人頭痛的數學公式用白話文說起來是什麼。

2023/07/23

2023/07/23

中學以下的素養教育與經驗談：國三上數學，相似形（2）

筆者在這邊的經驗可以說是「慘痛」兩個字，因為你以為很簡單的，學生不這麼覺得，我們以為這圖片夠清楚的，學生不明白。我們得要放很多層階梯，階梯的高度還得差很小，不然會有很多人跨不過去。具體的解題就不多說，照例筆者這邊解釋教學上的技巧，有經驗的老師應該一看就知道，學生的盲點在哪。

#數學#國中數學#教育文化

2022/11/16

王立第二戰研所

中學以下的素養教育與經驗談：國三上數學，相似形（2）

#數學#國中數學#教育文化

2022/11/16

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News