詹永裕的沙龍

平均數及變異數的抽樣分配(Distribution of Mean and Variance)

更新於 2020/12/31發佈於 2020/08/06閱讀時間約 3 分鐘

平均數及變異數是兩個很常見也熱門的統計量，平均數被用來描述分配的位置，而變異數則是一個用來衡量分配之分散程度的指標。

一般來說，我們做資料分析時能夠用手上的資料來計算樣本平均數及樣本變異數，再用這些統計量進一步估計母體參數。而我們透過計算得出的樣本平均數及樣本變異數事實上是隨機變數，換句話說，這些樣本平均數及樣本變異數是服從某個機率分配的，它並不是一個固定的數字。

為什麼這些估計值會是隨機變數呢?

舉個例子，假設我們今天想要得知成大男學生的平均身高及身高的變異數，實際上我們很難(像是可能有些學生根本不來學校)把每一個學生的身高都記錄起來，所以進行抽樣是比較合適的做法。

首先，隨機抽取100個成大男學生的身高並計算其樣本平均及樣本變異數，假設我們手上就有一筆樣本平均及樣本變異數的資料了，我們可以用這個統計量去估計全成大男學生的身高，但樣本平均及樣本變異數並不是一個固定的數字，若我們重新做一次抽樣，抽到另100位成大男學生，這些統計量(樣本平均及變異)也會隨之改變。

因此，這些統計量(樣本平均及樣本變異數)是隨機變數，他們不是固定的數字而是屬於某個機率分配。

Julia程式碼

using Random, Distributions, Plots; pyplot()
Random.seed!(0)
# 假設母體分配為exponetial distribution
lambda  = 1/4.5
expDist = Exponential(1/lambda)
# n為每一次抽樣的樣本大小
# N為抽樣次數
n, N    = 10, 10^6
means     = Array{Float64}(undef, N)
variances = Array{Float64}(undef, N)
# 開始進行模擬抽樣，重複N次
for i in 1:N
    # 隨機(模擬)抽取樣本資料
    data = rand(expDist,n)
    # 計算樣本平均及變異數
    means[i] = mean(data)
    variances[i] = var(data)
end
# 理論的平均和抽樣得出的樣本平均
println("Actual mean: ",mean(expDist),
        "\nMean of sample means: ",mean(means))
println("Actual variance: ",var(expDist),
    "\nMean of sample variances: ",mean(variances))
# 用直方圖表示其分配
stephist(means, bins=200, c=:blue, normed=true,
    label="Histogram of Sample Means")
stephist!(variances, bins=600, c=:red, normed=true,
    label="Histogram of Sample Variances", xlims=(0,40), ylims=(0,0.4),
        xlabel = "Statistic value", ylabel = "Density")

Originally published at https://www.juliansweb.com on August 6, 2020.

為什麼會看到廣告

詹永裕的沙龍

4會員

25內容數

留言

留言分享你的想法！

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

詹永裕的沙龍的其他內容

樣本平均及樣本變異數之關聯(Sample mean and Sample variance) — 朱利安的網

樣本變異數的大小會影響樣本平均數嗎?事實上是會的!在大部分的情況底下，兩者是不獨立的，樣本平均和樣本變異的估值存在某些相關，換句話說，樣本平均的大小會影響樣本變異數的大小

#統計學 #程式設計 #程式語言

樣本平均及樣本變異數之關聯(Sample mean and Sample variance) — 朱利安的網

樣本變異數的大小會影響樣本平均數嗎?事實上是會的!在大部分的情況底下，兩者是不獨立的，樣本平均和樣本變異的估值存在某些相關，換句話說，樣本平均的大小會影響樣本變異數的大小

#統計學 #程式設計 #程式語言

你可能也想看

Google News 追蹤

The Nature of Code閱讀心得與Python實作：0.4 A Normal Distribution...

這一節的標題是0.4 A Normal Distribution of Random Numbers，介紹常態分布的基本概念，以及相關亂數產生器的使用方法與應用方式。

#python #Python #PYTHON

金融財務試煉之路的沙龍

【金融知識】基金投顧說的平均獲利，你知道是哪種平均嗎？

有學過統計的人都知道，所謂的平均有許多不同的定義，我們今天要來學習在金融財務當中常見的平均方法。這些平均方式可能是用在績效的結果，也可能是用在分析財務報表。這些統計有時候差之毫釐、失之千里，我們在理解不同的統計分析跟看其結果時，不可不慎。本篇文章簡單介紹5種平均數

#CFA #量化分析Quantity #平均

The Nature of Code閱讀心得與Python實作：0.3 Probability and Non...

在模擬自然界中的事物時導入隨機性，可以讓結果看起來比較自然，但如果導入的隨機性都是uniform distribution，那未免也太呆板了。這時候，我們需要nonuniform distribution亂數，來讓模擬出來的結果，更像真的一樣。

#python #pygame #機率

The Nature of Code閱讀心得與Python實作：Chap. 0 Randomness

在這一章中，會透過介紹在螢幕上模擬物體移動時，其背後的原理與實作方法，來介紹亂數(random number)、隨機分布(random distribution)、Perlin noise等，這些可以用來引入隨機性的工具。

#隨機性 #randomness #python

統計急救箱的沙龍

統計急救箱─抽樣分布與標準誤

　　前面說明了所謂「假設檢定」的邏輯，也就是推論統計的基礎。但前面都還只是概念的階段，目前沒有真正進行任何的操作──還沒有提到推論統計的技術。　　這篇其實有點像是一個過渡，是將前面的概念銜接到下一篇t分數之間的過程，也可以說是稍微解釋一下t檢定怎麼發展出來的。

#統計急救箱 #統計學 #常態分布

心理博士的筆記本

讀懂調查報告：樣本和母體

選舉民調是預測選舉結果的重要工具。然而，如果我們不了解樣本和母體的概念，就很容易被民調結果誤導。在本文中，我們將介紹樣本和母體的概念，以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。

#統計 #數據 #地區

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（下）

接續上一篇，繼續來講如何從常態分布的機率進行假設檢定，進而推論母體的平均數吧！這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。

#統計 #統計學 #社會科學

Martin Chiu的沙龍

選票驗偽統計分析的正當性與證據力

　當開啟試算表（EXCEL等）的累加（SUM）及離散度，標準差（STDEV）的運算功能後，逐一統計的累進報票式選票統計表就可以退休了，而且全國一萬七千多所的數據不待一所所列出，就可以用較小選區（例如嘉義市198所，宜蘭縣431所等）的統計過程證明統計結果都是正確的，尤其是將計算式列出（隱藏前面的

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（上）

　　在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率，而更之前也看過了抽樣分布是如何形成常態分布的過程，現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。

#統計急救箱 #統計學 #社會科學

走讀城市創生─許正賢的沙龍

統計學的知識與運用─第一堂

第一堂學生創新團隊的點評我們的統計在社會科學裡面，它到底是怎麼樣產生的，我們今天要算這個統計學，要送統計，他們本身要有Raw data，這樣才有辦法進行運用，如：我們要怎麼算平均身高如下是：「全部身高」除以「人數」等於每個人幾公分所以我們要設計如何用電腦計算，要「input」

#美術館 #統計 #性別

The Nature of Code閱讀心得與Python實作：0.4 A Normal Distribution...

這一節的標題是0.4 A Normal Distribution of Random Numbers，介紹常態分布的基本概念，以及相關亂數產生器的使用方法與應用方式。

#python #Python #PYTHON

金融財務試煉之路的沙龍

【金融知識】基金投顧說的平均獲利，你知道是哪種平均嗎？

有學過統計的人都知道，所謂的平均有許多不同的定義，我們今天要來學習在金融財務當中常見的平均方法。這些平均方式可能是用在績效的結果，也可能是用在分析財務報表。這些統計有時候差之毫釐、失之千里，我們在理解不同的統計分析跟看其結果時，不可不慎。本篇文章簡單介紹5種平均數

#CFA #量化分析Quantity #平均

The Nature of Code閱讀心得與Python實作：0.3 Probability and Non...

在模擬自然界中的事物時導入隨機性，可以讓結果看起來比較自然，但如果導入的隨機性都是uniform distribution，那未免也太呆板了。這時候，我們需要nonuniform distribution亂數，來讓模擬出來的結果，更像真的一樣。

#python #pygame #機率

The Nature of Code閱讀心得與Python實作：Chap. 0 Randomness

在這一章中，會透過介紹在螢幕上模擬物體移動時，其背後的原理與實作方法，來介紹亂數(random number)、隨機分布(random distribution)、Perlin noise等，這些可以用來引入隨機性的工具。

#隨機性 #randomness #python

統計急救箱的沙龍

統計急救箱─抽樣分布與標準誤

　　前面說明了所謂「假設檢定」的邏輯，也就是推論統計的基礎。但前面都還只是概念的階段，目前沒有真正進行任何的操作──還沒有提到推論統計的技術。　　這篇其實有點像是一個過渡，是將前面的概念銜接到下一篇t分數之間的過程，也可以說是稍微解釋一下t檢定怎麼發展出來的。

#統計急救箱 #統計學 #常態分布

心理博士的筆記本

讀懂調查報告：樣本和母體

選舉民調是預測選舉結果的重要工具。然而，如果我們不了解樣本和母體的概念，就很容易被民調結果誤導。在本文中，我們將介紹樣本和母體的概念，以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。

#統計 #數據 #地區

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（下）

接續上一篇，繼續來講如何從常態分布的機率進行假設檢定，進而推論母體的平均數吧！這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。

#統計 #統計學 #社會科學

Martin Chiu的沙龍

選票驗偽統計分析的正當性與證據力

　當開啟試算表（EXCEL等）的累加（SUM）及離散度，標準差（STDEV）的運算功能後，逐一統計的累進報票式選票統計表就可以退休了，而且全國一萬七千多所的數據不待一所所列出，就可以用較小選區（例如嘉義市198所，宜蘭縣431所等）的統計過程證明統計結果都是正確的，尤其是將計算式列出（隱藏前面的

統計急救箱的沙龍

統計急救箱─常態分布與假設檢定（上）

　　在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率，而更之前也看過了抽樣分布是如何形成常態分布的過程，現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。

#統計急救箱 #統計學 #社會科學

走讀城市創生─許正賢的沙龍

統計學的知識與運用─第一堂

第一堂學生創新團隊的點評我們的統計在社會科學裡面，它到底是怎麼樣產生的，我們今天要算這個統計學，要送統計，他們本身要有Raw data，這樣才有辦法進行運用，如：我們要怎麼算平均身高如下是：「全部身高」除以「人數」等於每個人幾公分所以我們要設計如何用電腦計算，要「input」

#美術館 #統計 #性別