平均數及變異數的抽樣分配(Distribution of Mean and Variance)

更新於 發佈於 閱讀時間約 3 分鐘
平均數及變異數是兩個很常見也熱門的統計量,平均數被用來描述分配的位置,而變異數則是一個用來衡量分配之分散程度的指標。
一般來說,我們做資料分析時能夠用手上的資料來計算樣本平均數及樣本變異數,再用這些統計量進一步估計母體參數。而我們透過計算得出的樣本平均數及樣本變異數事實上是隨機變數,換句話說,這些樣本平均數及樣本變異數是服從某個機率分配的,它並不是一個固定的數字。
為什麼這些估計值會是隨機變數呢?
舉個例子,假設我們今天想要得知成大男學生的平均身高及身高的變異數,實際上我們很難(像是可能有些學生根本不來學校)把每一個學生的身高都記錄起來,所以進行抽樣是比較合適的做法。
首先,隨機抽取100個成大男學生的身高並計算其樣本平均及樣本變異數,假設我們手上就有一筆樣本平均及樣本變異數的資料了,我們可以用這個統計量去估計全成大男學生的身高,但樣本平均及樣本變異數並不是一個固定的數字,若我們重新做一次抽樣,抽到另100位成大男學生,這些統計量(樣本平均及變異)也會隨之改變。
因此,這些統計量(樣本平均及樣本變異數)是隨機變數,他們不是固定的數字而是 屬於某個機率分配

Julia程式碼

using Random, Distributions, Plots; pyplot()
Random.seed!(0)
# 假設母體分配為exponetial distribution
lambda = 1/4.5
expDist = Exponential(1/lambda)
# n為每一次抽樣的樣本大小
# N為抽樣次數
n, N = 10, 10^6
means     = Array{Float64}(undef, N)
variances = Array{Float64}(undef, N)
# 開始進行模擬抽樣,重複N次
for i in 1:N
# 隨機(模擬)抽取樣本資料
data = rand(expDist,n)
# 計算樣本平均及變異數
means[i] = mean(data)
variances[i] = var(data)
end
# 理論的平均和抽樣得出的樣本平均
println("Actual mean: ",mean(expDist),
"\nMean of sample means: ",mean(means))
println("Actual variance: ",var(expDist),
"\nMean of sample variances: ",mean(variances))
# 用直方圖表示其分配
stephist(means, bins=200, c=:blue, normed=true,
label="Histogram of Sample Means")
stephist!(variances, bins=600, c=:red, normed=true,
label="Histogram of Sample Variances", xlims=(0,40), ylims=(0,0.4),
xlabel = "Statistic value", ylabel = "Density")
Originally published at https://www.juliansweb.com on August 6, 2020.
為什麼會看到廣告
avatar-img
4會員
25內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
詹永裕的沙龍 的其他內容
樣本變異數的大小會影響樣本平均數嗎?事實上是會的!在大部分的情況底下,兩者是不獨立的,樣本平均和樣本變異的估值存在某些相關,換句話說,樣本平均的大小會影響樣本變異數的大小
樣本變異數的大小會影響樣本平均數嗎?事實上是會的!在大部分的情況底下,兩者是不獨立的,樣本平均和樣本變異的估值存在某些相關,換句話說,樣本平均的大小會影響樣本變異數的大小
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
這一節的標題是0.4 A Normal Distribution of Random Numbers,介紹常態分布的基本概念,以及相關亂數產生器的使用方法與應用方式。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
在模擬自然界中的事物時導入隨機性,可以讓結果看起來比較自然,但如果導入的隨機性都是uniform distribution,那未免也太呆板了。這時候,我們需要nonuniform distribution亂數,來讓模擬出來的結果,更像真的一樣。
在這一章中,會透過介紹在螢幕上模擬物體移動時,其背後的原理與實作方法,來介紹亂數(random number)、隨機分布(random distribution)、Perlin noise等,這些可以用來引入隨機性的工具。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
這一節的標題是0.4 A Normal Distribution of Random Numbers,介紹常態分布的基本概念,以及相關亂數產生器的使用方法與應用方式。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
在模擬自然界中的事物時導入隨機性,可以讓結果看起來比較自然,但如果導入的隨機性都是uniform distribution,那未免也太呆板了。這時候,我們需要nonuniform distribution亂數,來讓模擬出來的結果,更像真的一樣。
在這一章中,會透過介紹在螢幕上模擬物體移動時,其背後的原理與實作方法,來介紹亂數(random number)、隨機分布(random distribution)、Perlin noise等,這些可以用來引入隨機性的工具。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」