Julia程式碼

樣本平均及樣本變異數之關聯(Sample mean and Sample variance) — 朱利安的網

詹永裕

2020/12/31 更新2020/08/06 發佈閱讀 5 分鐘

樣本平均數及樣本變異數都是隨機變數，它們分別屬於同樣或不同的機率分配。

那樣本平均數及樣本變異數之間獨立嗎?

也就是說，樣本變異數的大小會影響樣本平均數嗎?它們之間會互相影響嗎?

事實上是會的!在大部分的情況底下，兩者是不獨立的，樣本平均和樣本變異的估值存在某些相關，換句話說， 樣本平均的大小會影響樣本變異數的大小 ，這是一個非常有趣的現象，大家也可以找個簡單的分配自己算算看。

但當常態假設成立時，樣本平均及樣本變異數就是互相獨立的!

該怎麼確認這一論述正確呢? 除了動手推導理論解去證明此一論述之外，我們也可以用Julia執行統計模擬來看看這樣的結論是不是合理的!

Julia程式碼

using Distributions, Plots, LaTeXStrings; pyplot()


# 定義函數statPair()，
# 計算給定不同分配及特定樣本大小的情況下的樣本平均及樣本變異數
function statPair(dist,n)
    sample = rand(dist,n)
    [mean(sample),var(sample)]
end


# uniform分配
stdUni = Uniform(-sqrt(3),sqrt(3))
n, N = 3, 10^5


# 模擬母體分配為uniform分配情況下其
# 抽樣得到的樣本平均及樣本變異數的數值
dataUni     = [statPair(stdUni,n) for _ in 1:N]


# 模擬母體分配為uniform時
# 計算若樣本平均及樣本變異為獨立的數字
dataUniInd  = [[mean(rand(stdUni,n)),var(rand(stdUni,n))] for _ in 1:N]


# 模擬母體分配為Normal分配情況下其
# 抽樣得到的樣本平均及樣本變異數的數值
dataNorm    = [statPair(Normal(),n) for _ in 1:N]


# 模擬母體分配為Normal時
# 計算若樣本平均及樣本變異為獨立的數字
dataNormInd = [[mean(rand(Normal(),n)),var(rand(Normal(),n))] for _ in 1:N]


p1 = scatter(first.(dataUni), last.(dataUni),
    c=:blue, ms=1, msw=0, label="Same group")
p1 = scatter!(first.(dataUniInd), last.(dataUniInd),
    c=:red, ms=0.8, msw=0, label="Separate group",
    xlabel=L"\overline{X}", ylabel=L"S^2")
p2 = scatter(first.(dataNorm), last.(dataNorm),
    c=:blue, ms=1, msw=0, label="Same group")
p2 = scatter!(first.(dataNormInd), last.(dataNormInd),
    c=:red, ms=0.8, msw=0, label="Separate group",
    xlabel=L"\overline{X}", ylabel=L"$S^2$")
# 從圖中可以很清楚的看出在uniform分配時
# 若樣本平均及樣本變異為獨立抽樣，所計算出的數字的分布和
# 樣本平均及樣本變異由同一樣本一起計算出的數字的分布
# 有所差異。
# 而在Normal分配時
# 若樣本平均及樣本變異為獨立抽樣，所計算出的數字的分布和
# 樣本平均及樣本變異由同一樣本一起計算出的數字的分布
# 並無差別。
plot(p1, p2, ylims=(0,5), size=(800, 400))

Originally published at https://www.juliansweb.com on August 6, 2020.

留言

留言分享你的想法！

詹永裕的沙龍

5會員

25內容數

詹永裕的沙龍的其他內容

2020/12/09

Leadership — fear of losing safety

Almost every Uyghur has to experience the camps, which China’s government calls “vocational education and training centers.

2020/12/09

Leadership — fear of losing safety

Almost every Uyghur has to experience the camps, which China’s government calls “vocational education and training centers.

2020/11/15

Flow, the secret to happiness

Flow is a state in which a person performing some activity is fully immersed in a feeling of energized focus, enjoyment, and lost a sense of time.

2020/11/15

Flow, the secret to happiness

Flow is a state in which a person performing some activity is fully immersed in a feeling of energized focus, enjoyment, and lost a sense of time.

2020/11/05

Leaders with the highest approval ratings in 2020 — what they have done differently from President…

Only a “good leader” can help teams become better, promote group operations, and boost organizations’ performance.

2020/11/05

Leaders with the highest approval ratings in 2020 — what they have done differently from President…

Only a “good leader” can help teams become better, promote group operations, and boost organizations’ performance.

看更多

你可能也想看

Lala不只會露鳥🐦

【泥之家鳥物不私藏第二彈】禦寒對策！變天了，小鳥防寒對策完整攻略✨搭上雙11購物節順風車，直接一波帶走避寒神器❤️‍🔥

最近開始轉涼了，各位鳥奴們是否會開始擔心小鳥會著涼呢？不用擔心，今天這篇直接帶你看需要的商品，而且今天除了照片之外，我們也直接帶連結✨讓你的雙11購物不盲目，讓你想買直接加入購物車，除了長知識也可以直接下單避寒神器🫱🏼文章結尾也會告訴大家在花錢的同時也能省錢、賺錢的小撇步，請記得留到最後！！

#電暖器#蝦皮#雙11購物節

2025/11/05

Lala不只會露鳥🐦

【泥之家鳥物不私藏第二彈】禦寒對策！變天了，小鳥防寒對策完整攻略✨搭上雙11購物節順風車，直接一波帶走避寒神器❤️‍🔥

#電暖器#蝦皮#雙11購物節

2025/11/05

統計急救箱的沙龍

統計急救箱─樣本變異數與標準差

　　雖然平均數可以拿來代表一群數值，但一整群數字之中還有另一個很重要的資訊，那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation，簡寫為SD) 就是在描述一群數字的分散程度。

2023/07/30

2023/07/30

要觀察一個數值的集合有很多方法，透過這些方法得出數值集合的某些特徵，可以讓我們除了「感覺」外，能有更「理性客觀」的方式來理解這個數值集合的特徵。眾數：一個集合中出現最多次的那個元素，以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是，以眾數作為一個集合的標籤，我們無法透過眾數得知

2023/04/11

2023/04/11

「共變異數分析 (ANCOVA)」程序會比較一個連續應變數在兩個以上因素變數之間的平均數，並判定共變量的效應以及共變量與因素之間的交互作用。可以在控制共變數分析，可以調查因素之間的交互作用、以及主要效果。ANCOVA通常用於研究中，研究者希望控制控制變項探的情況下，檢驗一個或多個自變量對依變項。

2023/01/22

2023/01/22

Kolmogorov-Smirnov 適合度檢定，該方法為檢定樣本次數分配與某一特定母群體分配間的差異是否達到顯著性(一般用來檢定常態分配或是其他類型的連續性分配)。檢定統計量邏輯、計算流程、查表值請參考下列敘述

2022/01/19

2022/01/19

Durbin-Watson test，對模組的殘差項進行相關聯性檢定，常應用於迴歸分析以及需要限制殘差項要為獨立常態分配。不過我在應用上更關心價格資料是否有聚集在均線附近，若有則可以判定盤整盤，反之則有趨勢發生，相關統計檢定計算步驟詳列如下

2022/01/18

2022/01/18

承續前篇內容，另外使用第二種隨機性檢定方式，來判斷價格是否處於盤整盤，假若為盤整盤，價格應集中在均線位置附近或是前後相鄰的數值差異很小，數據計算方法如下

2022/01/13

2022/01/13

別讓統計數字騙了你（How to Lie wish Statistics)

別讓統計數字騙了你（How to Lie wish Statistics) 有內建偏差的樣本抽樣的樣本不足以代表全體，有代表性的樣本，這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果，樣本中會明顯少了總是開車出門的樣本。受訪者想要給一個會讓訪問員喜歡的答案，在

2021/10/09

中老年fc的指數化奇幻漂流

別讓統計數字騙了你（How to Lie wish Statistics)

2021/10/09

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News