樣本平均及樣本變異數之關聯(Sample mean and Sample variance) — 朱利安的網

閱讀時間約 4 分鐘
樣本平均數及樣本變異數都是隨機變數,它們分別屬於同樣或不同的機率分配。
那樣本平均數及樣本變異數之間獨立嗎?
也就是說,樣本變異數的大小會影響樣本平均數嗎?它們之間會互相影響嗎?
事實上是會的!在大部分的情況底下,兩者是不獨立的,樣本平均和樣本變異的估值存在某些相關,換句話說, 樣本平均的大小會影響樣本變異數的大小 ,這是一個非常有趣的現象,大家也可以找個簡單的分配自己算算看。
但當常態假設成立時,樣本平均及樣本變異數就是互相獨立的!
該怎麼確認這一論述正確呢? 除了動手推導理論解去證明此一論述之外,我們也可以用Julia執行統計模擬來看看這樣的結論是不是合理的!

Julia程式碼

using Distributions, Plots, LaTeXStrings; pyplot()

# 定義函數statPair(),
# 計算給定不同分配及特定樣本大小的情況下的樣本平均及樣本變異數
function statPair(dist,n)
sample = rand(dist,n)
[mean(sample),var(sample)]
end

# uniform分配
stdUni = Uniform(-sqrt(3),sqrt(3))
n, N = 3, 10^5

# 模擬母體分配為uniform分配情況下其
# 抽樣得到的樣本平均及樣本變異數的數值
dataUni = [statPair(stdUni,n) for _ in 1:N]

# 模擬母體分配為uniform時
# 計算若樣本平均及樣本變異為獨立的數字
dataUniInd = [[mean(rand(stdUni,n)),var(rand(stdUni,n))] for _ in 1:N]

# 模擬母體分配為Normal分配情況下其
# 抽樣得到的樣本平均及樣本變異數的數值
dataNorm = [statPair(Normal(),n) for _ in 1:N]

# 模擬母體分配為Normal時
# 計算若樣本平均及樣本變異為獨立的數字
dataNormInd = [[mean(rand(Normal(),n)),var(rand(Normal(),n))] for _ in 1:N]

p1 = scatter(first.(dataUni), last.(dataUni),
c=:blue, ms=1, msw=0, label="Same group")
p1 = scatter!(first.(dataUniInd), last.(dataUniInd),
c=:red, ms=0.8, msw=0, label="Separate group",
xlabel=L"\overline{X}", ylabel=L"S^2")
p2 = scatter(first.(dataNorm), last.(dataNorm),
c=:blue, ms=1, msw=0, label="Same group")
p2 = scatter!(first.(dataNormInd), last.(dataNormInd),
c=:red, ms=0.8, msw=0, label="Separate group",
xlabel=L"\overline{X}", ylabel=L"$S^2$")
# 從圖中可以很清楚的看出在uniform分配時
# 若樣本平均及樣本變異為獨立抽樣,所計算出的數字的分布和
# 樣本平均及樣本變異由同一樣本一起計算出的數字的分布
# 有所差異。
# 而在Normal分配時
# 若樣本平均及樣本變異為獨立抽樣,所計算出的數字的分布和
# 樣本平均及樣本變異由同一樣本一起計算出的數字的分布
# 並無差別。
plot(p1, p2, ylims=(0,5), size=(800, 400))
Originally published at https://www.juliansweb.com on August 6, 2020.
為什麼會看到廣告
avatar-img
4會員
25內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
詹永裕的沙龍 的其他內容
樣本平均數及樣本變異數事實上是隨機變數,換句話說,這些樣本平均數及樣本變異數是服從某個機率分配的,它並不是一個固定的數字。
樣本平均數及樣本變異數事實上是隨機變數,換句話說,這些樣本平均數及樣本變異數是服從某個機率分配的,它並不是一個固定的數字。
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
我們做實驗的目的, 往往是想要量化「確定的不確定性 Certain Uncertainty」。 什麼是「不確定性 Uncertainty」? 其實就是無法透過控制各種變因來控制下來的現象。 在做實驗的時候, 就算你已經把實驗條件盡量控制一樣了, 其實實驗的結果每次還是會有一些差異。
  今天來閒聊一下標準這件事。由於這裡畢竟是個以小說為主的網站,因此本篇就聚焦在寫作與閱讀這兩方面來討論。   「標準」這個東西其實是最不標準的了,每個人都有自己的標準,會受到喜好、興趣、環境等等的影響而有所不同,而且別說人與人之間,就連同一個人,在不同的時間或人生階段,對同一件事都可能會有不同的
Thumbnail
這一節的標題是0.4 A Normal Distribution of Random Numbers,介紹常態分布的基本概念,以及相關亂數產生器的使用方法與應用方式。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
在模擬自然界中的事物時導入隨機性,可以讓結果看起來比較自然,但如果導入的隨機性都是uniform distribution,那未免也太呆板了。這時候,我們需要nonuniform distribution亂數,來讓模擬出來的結果,更像真的一樣。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
我們做實驗的目的, 往往是想要量化「確定的不確定性 Certain Uncertainty」。 什麼是「不確定性 Uncertainty」? 其實就是無法透過控制各種變因來控制下來的現象。 在做實驗的時候, 就算你已經把實驗條件盡量控制一樣了, 其實實驗的結果每次還是會有一些差異。
  今天來閒聊一下標準這件事。由於這裡畢竟是個以小說為主的網站,因此本篇就聚焦在寫作與閱讀這兩方面來討論。   「標準」這個東西其實是最不標準的了,每個人都有自己的標準,會受到喜好、興趣、環境等等的影響而有所不同,而且別說人與人之間,就連同一個人,在不同的時間或人生階段,對同一件事都可能會有不同的
Thumbnail
這一節的標題是0.4 A Normal Distribution of Random Numbers,介紹常態分布的基本概念,以及相關亂數產生器的使用方法與應用方式。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
在模擬自然界中的事物時導入隨機性,可以讓結果看起來比較自然,但如果導入的隨機性都是uniform distribution,那未免也太呆板了。這時候,我們需要nonuniform distribution亂數,來讓模擬出來的結果,更像真的一樣。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。