共變異數及相關係數(Covariance and Correlation)

更新於 發佈於 閱讀時間約 2 分鐘
我們都知道普遍來講身高越高的人體重越重,身高與體重彼此相關,且是呈現正相關。既然彼此相關,有沒有一個測量標準能夠告訴我們 它們有多相關? 我們不僅想知道彼此是正相關還負相關,還想要知道這個相關的強度。

共變異數及相關係數

共變異數及相關係數(Covariance and Correlation)就是很好的測量標準。
當我們想要探討兩個變數之間的關係時,一個很常見的手法就是去計算兩變數(身高和體重)之間的共變異數及相關係數。藉由共變異數及相關係數可以看出變數與變數之間的線性關係的強度。
但比起共變異數, 相關係數是一個更熱門的統計量 。其原因在於,雖然共變異數及相關係數都是代表兩變數之間線性關係強弱的量,但相關係數有經過標準化的轉化,使得不同相關係數之間有相同的單位,而共變異數則無這一特性。
這代表不同變數之間的相關係數是可以互相比較的,當一組變數的相關係數為0.8,那這組變數的線性相關就比另一組相關係數只有0.7的變數來的強。
但共變異數就沒辦法這樣比較,一組變數的共變異數是15,另一組變數的共變異數為8,這不意味著共變異數為15的那組變數其線性關係必然比另一組共變異數為8的變數強,因為我們並 不知道兩組共變異數的單位為何

Julia程式碼

using DataFrames, CSV, Statistics

# 匯入資料
data = CSV.read(".../temperatures.csv", copycols=true)

# 定義brisT為資料中Brisbane變數的數值
brisT = data.Brisbane
# 定義gcT為資料中GoldCoast變數的數值
gcT = data.GoldCoast

# 計算標準差
sigB = std(brisT)
sigG = std(gcT)

# 共變異數
covBG = cov(brisT, gcT)
# 相關係數
corBG = cor(brisT, gcT)

# 組成共變異數矩陣
covMat = [sigB^2 covBG
covBG sigG^2]
print(covBG, corBG, covMat)

Output

13.0
1.0
[16.0 13.0;
13.0 12.0]
Originally published at https://www.juliansweb.com on August 15, 2020.
為什麼會看到廣告
avatar-img
4會員
25內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
詹永裕的沙龍 的其他內容
樣本變異數的大小會影響樣本平均數嗎?事實上是會的!在大部分的情況底下,兩者是不獨立的,樣本平均和樣本變異的估值存在某些相關,換句話說,樣本平均的大小會影響樣本變異數的大小
樣本平均數及樣本變異數事實上是隨機變數,換句話說,這些樣本平均數及樣本變異數是服從某個機率分配的,它並不是一個固定的數字。
樣本變異數的大小會影響樣本平均數嗎?事實上是會的!在大部分的情況底下,兩者是不獨立的,樣本平均和樣本變異的估值存在某些相關,換句話說,樣本平均的大小會影響樣本變異數的大小
樣本平均數及樣本變異數事實上是隨機變數,換句話說,這些樣本平均數及樣本變異數是服從某個機率分配的,它並不是一個固定的數字。
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
我們做實驗的目的, 往往是想要量化「確定的不確定性 Certain Uncertainty」。 什麼是「不確定性 Uncertainty」? 其實就是無法透過控制各種變因來控制下來的現象。 在做實驗的時候, 就算你已經把實驗條件盡量控制一樣了, 其實實驗的結果每次還是會有一些差異。
比較的意義是什麼?這世界有人,就存在比較這件事。為了社會的遊戲規則而比較,或為了尋找自己的定位而比較,人們各司其職,不同的人有不同的專長與性格適合不同的位置,而這所謂的「不同」就是比較出來的。比較沒有不好,世人看待比較的心態負面了才會產生不好的行為和影響。
Thumbnail
除了享受行動方便、做事靈活、增加工作效率與個人的信心之外,合理的體重與身材具有它正面的社會價值, 也反應著社會整體的健康與幸福感。 兩種體重指數包括 BMI 與 WHR ("身體質量指數" 與 “腰臀比”)各有其參考價值。值得自己用布尺量一下取得 WHR,從另一個角度衡量自己體重的合理性。
瞭解如何透過Regression實作Classification,使用one-hot vector表示不同的類別,並透過乘上不同的Weight和加上不同的bias來得到三個數值形成向量。同時通過softmax的方式得到最終的y'值,並探討使用Cross-entropy來計算類別的loss。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
量體重是健康檢查的基本項目,而量測體重、BMI以及體脂率乃是可在家自行測量與追蹤的指標。 BMI(Body Mass Index) 根據國健署:成人健康體位標準,身體質量
Thumbnail
網友提問 25 身高會影響男人的性吸引力嗎?   網友提問: 「身高威力有那麼強嗎? 為什麼一脫離學生就把不到 身份不同會影響搭訕嗎?」   先講身高,女人挑男人,就像你公司面試員工,先把私立的學校給去掉,留下國立的再來篩選。   所以不是身高矮女生就不喜歡,而是身高矮,其他條件也很平
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
我們做實驗的目的, 往往是想要量化「確定的不確定性 Certain Uncertainty」。 什麼是「不確定性 Uncertainty」? 其實就是無法透過控制各種變因來控制下來的現象。 在做實驗的時候, 就算你已經把實驗條件盡量控制一樣了, 其實實驗的結果每次還是會有一些差異。
比較的意義是什麼?這世界有人,就存在比較這件事。為了社會的遊戲規則而比較,或為了尋找自己的定位而比較,人們各司其職,不同的人有不同的專長與性格適合不同的位置,而這所謂的「不同」就是比較出來的。比較沒有不好,世人看待比較的心態負面了才會產生不好的行為和影響。
Thumbnail
除了享受行動方便、做事靈活、增加工作效率與個人的信心之外,合理的體重與身材具有它正面的社會價值, 也反應著社會整體的健康與幸福感。 兩種體重指數包括 BMI 與 WHR ("身體質量指數" 與 “腰臀比”)各有其參考價值。值得自己用布尺量一下取得 WHR,從另一個角度衡量自己體重的合理性。
瞭解如何透過Regression實作Classification,使用one-hot vector表示不同的類別,並透過乘上不同的Weight和加上不同的bias來得到三個數值形成向量。同時通過softmax的方式得到最終的y'值,並探討使用Cross-entropy來計算類別的loss。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
量體重是健康檢查的基本項目,而量測體重、BMI以及體脂率乃是可在家自行測量與追蹤的指標。 BMI(Body Mass Index) 根據國健署:成人健康體位標準,身體質量
Thumbnail
網友提問 25 身高會影響男人的性吸引力嗎?   網友提問: 「身高威力有那麼強嗎? 為什麼一脫離學生就把不到 身份不同會影響搭訕嗎?」   先講身高,女人挑男人,就像你公司面試員工,先把私立的學校給去掉,留下國立的再來篩選。   所以不是身高矮女生就不喜歡,而是身高矮,其他條件也很平
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」