統計急救箱──用共變數描述分數之間的關係(下)

更新於 發佈於 閱讀時間約 3 分鐘

  由於共變數的解釋有點太長了,就分成上下兩篇。如果看過上一篇統計急救箱──用共變數描述分數之間的關係(上)還不太確定共變數要怎麼計算,這篇會用圖像的方式來進行解釋,最後也會提及共變數的小缺點。


用面積來理解共變異數

  如同變異數可以用面積的方式來理解一樣(參考統計急救箱─樣本變異數與標準差),共變數也可以算是一種變異數,也可以用面積的方式來理解它。和變異數最大的不同是,變異數只有一種數值,但共變數則有兩種。例如下圖中,每一個相同顏色的人都有x和y兩個數值,平均數分別是5.2和4.8。

每個人都有x和y兩種數值

每個人都有x和y兩種數值

  接著我們在兩群數值上計算每個人和平均值之間相差多少。和變異數不同的是,在平均數左邊的線段會用淺色表示,平均數右邊的線段則用深色表示。

顏色深淺表示方向,長短表示離均差的大小

顏色深淺表示方向,長短表示離均差的大小

把這些線段排列一下,整理成下面的樣子就可以清楚的看到每個人有兩個離均差了。

每個人都會有兩個離均差

每個人都會有兩個離均差

  根據共變數的公式,要先把每個人的這兩個線段相乘起來。也就是說,用這兩個線段當邊長圍出一個矩形。

矩形分成左半邊與右半邊兩種

矩形分成左半邊與右半邊兩種

在上圖當中,刻意區分出了兩種不同的矩形。左半邊的矩形面積顏色較淺(人也放在矩形裡面),右半邊的矩形面積顏色較深(人則是放在上面)。這樣區分的依據其實就是上面提到線段的顏色,如果矩形的邊長都是淺色或者都是深色,就會是淺色的矩形;如果矩形的邊長是深淺交錯,就會是右邊深色的矩形。

  就如同上面說的,深色的線段表示離均差是正數,而淺色的線段表示離均差是負數。因此深淺相同的線段相乘(離均差皆為正或者皆為負),會成為一個正值;而深淺不同的線段相乘(離均差一正一負)就會是一個負值。共變數的計算需要把這些矩形通通加起來,只不過不同顏色的矩形彼此是要相減的(因為正負值不同)。

  也就是說,我們要把左邊灰色的矩形加起來變成一個大矩形,右邊深色的矩形加起來也變成一個大的深色矩形,然後兩者相減。

共變異數需要考慮方向性,所以兩種矩形的面積要相減

共變異數需要考慮方向性,所以兩種矩形的面積要相減

最後剩餘的面積,就是所謂的積差和 (Sum of Cross-Product, SP of CP) 囉!這也就是共變異數公式當中的分子部分。

積差和

積差和

  再來只要把積差和平分給每一個人,每個人都會得到一個小小的矩形,這個矩形就是共變數啦~

把積差和平分給每個人就成為共變數

把積差和平分給每個人就成為共變數

有興趣的讀者可以回去之前的文章對照看看變異數和共變數的計算過程,就可以知道共變數和變異數的主要差別在於要考慮方向性的問題,不過整個計算過程其實和變異數是相同的。


共變異數受到測量單位影響

  共變數在多變量統計當中是非常重要的,不過在描述兩群數值關係的時候,共變異數存在一個不太方便的地方──共變數是具有單位的,也就共變數的大小會隨著單位不同而改變,因此我們沒有辦法光看共變數就知道兩群數值的關聯性有多強

  舉例而言,假如上面的x指的是年資,而上面的y指的是月收入(萬元),那麼共變數最後的單位就會是:年 x 萬元。

當計算年資和月收入的共變數時,單位是年 x 萬元

當計算年資和月收入的共變數時,單位是年 x 萬元

那麼如果今天換成計算身高(公分)和月收入之間的共變,最後的共變數單位就會是:公分 x 萬元。由於身高往往會比年資更大,因此身高和收入之間的共變數一定會比年資和收入更大。但是按照常理來說,年資和收入之間的關係應該比身高和收入來得更為強烈才對。

  所以如果光是要描述關聯性,共變數可能不是一個很方便的東西。不過只要經過一點簡單的處理,共變數就可以擺脫單位的影響,成為一個很好拿來描述關聯性的指標,那就是皮爾森線性相關係數,也是下一篇文章的主題。


留言
avatar-img
留言分享你的想法!
Dr. Rover-avatar-img
2023/09/17
哇,圖解真的很酷
Way-avatar-img
發文者
2023/09/20
Dr. Rover 以前很常聽不懂,試試看用圖會不會更容易理解一些 :P
Way-avatar-img
發文者
2023/09/24
統計急救箱─皮爾森相關提及了這篇文章,趕快過去看看吧!
avatar-img
統計急救箱的沙龍
68會員
32內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
2024/12/29
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
2024/12/29
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
前面兩篇會刻意提到共變數,除了因為共變數在多變量統計裡面非常重要之外,最主要的原因其實是為了解釋皮爾森相關係數而做鋪陳。 相關係數的種類也相當的繁多,這裡介紹的皮爾森相關大概是最常看到的一種啦~
Thumbnail
前面兩篇會刻意提到共變數,除了因為共變數在多變量統計裡面非常重要之外,最主要的原因其實是為了解釋皮爾森相關係數而做鋪陳。 相關係數的種類也相當的繁多,這裡介紹的皮爾森相關大概是最常看到的一種啦~
Thumbnail
如果看過上一篇還不太確定共變數要怎麼計算,這篇會用圖像的方式來進行解釋,最後也會提及共變數的小缺點。
Thumbnail
如果看過上一篇還不太確定共變數要怎麼計算,這篇會用圖像的方式來進行解釋,最後也會提及共變數的小缺點。
Thumbnail
在知道平均數與標準差之後,就可以進一步了解什麼是所謂的「標準分數」了。 標準分數的重要用途是可以幫助我們比較不同單位、不同分散程度的數值。 以概念來說,跟百分等級(PR)有點類似的味道吧。 標準分數在後續的統計當中也很常會出現的。
Thumbnail
在知道平均數與標準差之後,就可以進一步了解什麼是所謂的「標準分數」了。 標準分數的重要用途是可以幫助我們比較不同單位、不同分散程度的數值。 以概念來說,跟百分等級(PR)有點類似的味道吧。 標準分數在後續的統計當中也很常會出現的。
Thumbnail
在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。
Thumbnail
在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。
Thumbnail
通常討論標準差都會用面積的方式來解釋,不過有天我想也許可以用空間來解釋。 但這樣解釋對於標準差和變異數的理解似乎並不完整,可以當個有趣的觀點看看就好。
Thumbnail
通常討論標準差都會用面積的方式來解釋,不過有天我想也許可以用空間來解釋。 但這樣解釋對於標準差和變異數的理解似乎並不完整,可以當個有趣的觀點看看就好。
Thumbnail
  雖然多數人應該都知道平均數是什麼,也會計算平均數,不過平均數是統計當中非常常使用的統計量,因此還是做一些基本的介紹吧。   順便趁這機會解釋一下令人頭痛的數學公式用白話文說起來是什麼。
Thumbnail
  雖然多數人應該都知道平均數是什麼,也會計算平均數,不過平均數是統計當中非常常使用的統計量,因此還是做一些基本的介紹吧。   順便趁這機會解釋一下令人頭痛的數學公式用白話文說起來是什麼。
Thumbnail
筆者在這邊的經驗可以說是「慘痛」兩個字,因為你以為很簡單的,學生不這麼覺得,我們以為這圖片夠清楚的,學生不明白。我們得要放很多層階梯,階梯的高度還得差很小,不然會有很多人跨不過去。具體的解題就不多說,照例筆者這邊解釋教學上的技巧,有經驗的老師應該一看就知道,學生的盲點在哪。
Thumbnail
筆者在這邊的經驗可以說是「慘痛」兩個字,因為你以為很簡單的,學生不這麼覺得,我們以為這圖片夠清楚的,學生不明白。我們得要放很多層階梯,階梯的高度還得差很小,不然會有很多人跨不過去。具體的解題就不多說,照例筆者這邊解釋教學上的技巧,有經驗的老師應該一看就知道,學生的盲點在哪。
Thumbnail
一下的另一個單元,拆成一元一次不等式,還有屬於對數字敏銳度的比例與統計。這要分開講一下,首先談不等式,這跟之前的方程式有不小差距,許多同學會一下子轉不過來,尤其是正負號的轉變上。
Thumbnail
一下的另一個單元,拆成一元一次不等式,還有屬於對數字敏銳度的比例與統計。這要分開講一下,首先談不等式,這跟之前的方程式有不小差距,許多同學會一下子轉不過來,尤其是正負號的轉變上。
Thumbnail
  至今為止,本文都使用代數的方式來討論微分,並以生活、科學中的瞬間變化率,如:速度等,對微分的定義做出詮釋。這一系列主題文章「函數微分的幾何意義」將分多集探討,用幾何角度來了解函數微分。本文章第一集將先引入代數和幾何的觀念;在概略介紹函數的圖形定義。
Thumbnail
  至今為止,本文都使用代數的方式來討論微分,並以生活、科學中的瞬間變化率,如:速度等,對微分的定義做出詮釋。這一系列主題文章「函數微分的幾何意義」將分多集探討,用幾何角度來了解函數微分。本文章第一集將先引入代數和幾何的觀念;在概略介紹函數的圖形定義。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News