樣本平均及樣本變異數之關聯(Sample mean and Sample variance) — 朱利安的網

更新於 發佈於 閱讀時間約 5 分鐘
raw-image

樣本平均數及樣本變異數都是隨機變數,它們分別屬於同樣或不同的機率分配。

那樣本平均數及樣本變異數之間獨立嗎?

也就是說,樣本變異數的大小會影響樣本平均數嗎?它們之間會互相影響嗎?

事實上是會的!在大部分的情況底下,兩者是不獨立的,樣本平均和樣本變異的估值存在某些相關,換句話說, 樣本平均的大小會影響樣本變異數的大小 ,這是一個非常有趣的現象,大家也可以找個簡單的分配自己算算看。

但當常態假設成立時,樣本平均及樣本變異數就是互相獨立的!

該怎麼確認這一論述正確呢? 除了動手推導理論解去證明此一論述之外,我們也可以用Julia執行統計模擬來看看這樣的結論是不是合理的!

Julia程式碼

using Distributions, Plots, LaTeXStrings; pyplot()


# 定義函數statPair(),
# 計算給定不同分配及特定樣本大小的情況下的樣本平均及樣本變異數
function statPair(dist,n)
sample = rand(dist,n)
[mean(sample),var(sample)]
end


# uniform分配
stdUni = Uniform(-sqrt(3),sqrt(3))
n, N = 3, 10^5


# 模擬母體分配為uniform分配情況下其
# 抽樣得到的樣本平均及樣本變異數的數值
dataUni = [statPair(stdUni,n) for _ in 1:N]


# 模擬母體分配為uniform時
# 計算若樣本平均及樣本變異為獨立的數字
dataUniInd = [[mean(rand(stdUni,n)),var(rand(stdUni,n))] for _ in 1:N]


# 模擬母體分配為Normal分配情況下其
# 抽樣得到的樣本平均及樣本變異數的數值
dataNorm = [statPair(Normal(),n) for _ in 1:N]


# 模擬母體分配為Normal時
# 計算若樣本平均及樣本變異為獨立的數字
dataNormInd = [[mean(rand(Normal(),n)),var(rand(Normal(),n))] for _ in 1:N]


p1 = scatter(first.(dataUni), last.(dataUni),
c=:blue, ms=1, msw=0, label="Same group")
p1 = scatter!(first.(dataUniInd), last.(dataUniInd),
c=:red, ms=0.8, msw=0, label="Separate group",
xlabel=L"\overline{X}", ylabel=L"S^2")
p2 = scatter(first.(dataNorm), last.(dataNorm),
c=:blue, ms=1, msw=0, label="Same group")
p2 = scatter!(first.(dataNormInd), last.(dataNormInd),
c=:red, ms=0.8, msw=0, label="Separate group",
xlabel=L"\overline{X}", ylabel=L"$S^2$")
# 從圖中可以很清楚的看出在uniform分配時
# 若樣本平均及樣本變異為獨立抽樣,所計算出的數字的分布和
# 樣本平均及樣本變異由同一樣本一起計算出的數字的分布
# 有所差異。
# 而在Normal分配時
# 若樣本平均及樣本變異為獨立抽樣,所計算出的數字的分布和
# 樣本平均及樣本變異由同一樣本一起計算出的數字的分布
# 並無差別。
plot(p1, p2, ylims=(0,5), size=(800, 400))
raw-image

Originally published at https://www.juliansweb.com on August 6, 2020.

留言
avatar-img
留言分享你的想法!
avatar-img
詹永裕的沙龍
4會員
25內容數
詹永裕的沙龍的其他內容
2020/12/09
Almost every Uyghur has to experience the camps, which China’s government calls “vocational education and training centers.
Thumbnail
2020/12/09
Almost every Uyghur has to experience the camps, which China’s government calls “vocational education and training centers.
Thumbnail
2020/11/15
Flow is a state in which a person performing some activity is fully immersed in a feeling of energized focus, enjoyment, and lost a sense of time.
Thumbnail
2020/11/15
Flow is a state in which a person performing some activity is fully immersed in a feeling of energized focus, enjoyment, and lost a sense of time.
Thumbnail
2020/11/05
Only a “good leader” can help teams become better, promote group operations, and boost organizations’ performance.
Thumbnail
2020/11/05
Only a “good leader” can help teams become better, promote group operations, and boost organizations’ performance.
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
Thumbnail
「共變異數分析 (ANCOVA)」程序會比較一個連續應變數在兩個以上因素變數之間的平均數,並判定共變量的效應以及共變量與因素之間的交互作用。可以在控制共變數分析,可以調查因素之間的交互作用、以及主要效果。ANCOVA通常用於研究中,研究者希望控制控制變項探的情況下,檢驗一個或多個自變量對依變項。
Thumbnail
「共變異數分析 (ANCOVA)」程序會比較一個連續應變數在兩個以上因素變數之間的平均數,並判定共變量的效應以及共變量與因素之間的交互作用。可以在控制共變數分析,可以調查因素之間的交互作用、以及主要效果。ANCOVA通常用於研究中,研究者希望控制控制變項探的情況下,檢驗一個或多個自變量對依變項。
Thumbnail
Kolmogorov-Smirnov 適合度檢定,該方法為檢定樣本次數分配與某一特定母群體分配間的差異是否達到顯著性(一般用來檢定常態分配或是其他類型的連續性分配)。檢定統計量邏輯、計算流程、查表值請參考下列敘述
Thumbnail
Kolmogorov-Smirnov 適合度檢定,該方法為檢定樣本次數分配與某一特定母群體分配間的差異是否達到顯著性(一般用來檢定常態分配或是其他類型的連續性分配)。檢定統計量邏輯、計算流程、查表值請參考下列敘述
Thumbnail
Durbin-Watson test,對模組的殘差項進行相關聯性檢定,常應用於迴歸分析以及需要限制殘差項要為獨立常態分配。不過我在應用上更關心價格資料是否有聚集在均線附近,若有則可以判定盤整盤,反之則有趨勢發生,相關統計檢定計算步驟詳列如下
Thumbnail
Durbin-Watson test,對模組的殘差項進行相關聯性檢定,常應用於迴歸分析以及需要限制殘差項要為獨立常態分配。不過我在應用上更關心價格資料是否有聚集在均線附近,若有則可以判定盤整盤,反之則有趨勢發生,相關統計檢定計算步驟詳列如下
Thumbnail
承續前篇內容,另外使用第二種隨機性檢定方式,來判斷價格是否處於盤整盤,假若為盤整盤,價格應集中在均線位置附近或是前後相鄰的數值差異很小,數據計算方法如下
Thumbnail
承續前篇內容,另外使用第二種隨機性檢定方式,來判斷價格是否處於盤整盤,假若為盤整盤,價格應集中在均線位置附近或是前後相鄰的數值差異很小,數據計算方法如下
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News