統計急救箱─算術平均數

更新 發佈閱讀 5 分鐘

  就算是沒有學過統計學的人,對於平均數這個名詞一定也不陌生。在台灣的基礎教育裡面,一定有學過平均數要怎麼計算,可以說是一個眾所周知的統計概念。不過關於平均數的一些小知識並不是人人都知道,因此這篇文章就來簡單介紹一下大家都學過的平均數有哪些特性。


平均數的類型

  一般大眾口中所稱的平均數,正式名稱是「算術平均數」,是一種最通用的平均數。然而根據情況的不同,計算平均數的方式會有一些變化,產生了平均數的家族。例如調和平均數、幾何平均數、移動平均數等等。

  不過在統計學當中最常使用的還是算術平均數,所以沒有特別說明的情況下,約定成俗都會認為「平均數」指的就是算術平均數,英文名詞為Mean。


平均數是拿來幹嘛的?

  平均數的功能就是拿來代表一群數字的。假設今天有五個分數,將這五個分數平均之後就可以只用一個分數來代表這整群數字。

平均數的功能是用來代表一群數字

平均數的功能是用來代表一群數字


算術平均數的計算方式

  算術平均數的計算方式很簡單,就是把一群數字全部加起來,然後除以該群數字的個數。

  趁著這個機會,就用這種簡單的計算來解釋一下看起來可怕的數學公式。現在我們要先假設有五個數字,分別代表著1、2、5、7、11。

這裡有五個數字

這裡有五個數字

要計算這五個數字,第一個步驟就是把他們全部加起來:1 + 2 + 5 + 7 + 11 = 26。第二個步驟則是把他們除以這群數字的個數,也就是除以5:26 / 5 = 5.2。於是這五個數字的平均數就是5.2了。

1、2、5、7、11的平均數是5.2

1、2、5、7、11的平均數是5.2

如果用正式的數學公式表達,以下是算術平均數的數學公式:

算術平均數的數學式

算術平均數的數學式

  接下來就把這個數學公式翻譯成白話文吧!

  首先是那個看起來像是逆時針轉了90度的M的符號,是一個希臘字母,念作Sigma。其數學意義是「連加」,也就是把一群數字加起來的意思。Sigma的右側由下往上寫著小小的1和n,意思是把一群數字從第1個到第n個通通加起來。所以整個符號的完整念法是:Sigma從1到n。

  Sigma右邊的x,就是這一群數字裡面的每個數字,依照x旁邊小小的i來決定是哪個數。X1是這群數字的第1個數,X2是第2個...Xi是第i個,而Xn就是第n個數字(如果你想知道怎麼決定哪個數字是第1個數,哪個是第2個...答案是隨你喜歡,反正最後就是要把全部的數字加起來)。

  那我們要怎麼確定i代表的數字範圍到底是多大呢?答案是要看Sigma右邊那兩個小數字。Sigma右邊下方的小數字,就是i的起始值,上面的小數字則是終止值。所以當我們說:Sigma從1到n的Xi,就表示有一群數字(以Xi來表示),我們要把這群數字中的第1個到第n個都加起來。

  因此平均數的公式也可以這樣寫(把Sigma拿掉的版本):

把Sigma拿掉後的平均數公式

把Sigma拿掉後的平均數公式

最後分母的部分,因為分子是n個數字相加,所以分母就除以n。這裡的n表示的就是這群數字總共有n個。在上面舉的例子中,n就是5。

  所以Sigma符號並不可怕,只要看到Sigma就知道它指的其實是要把一群數字通通加起來就是了。換個方式說,其實Sigma就是Excel裡面的SUM函數,就是把一個範圍之內的數字全部都加起來。


算術平均數的特性

  1. 平均數類似於一群數值的中心點

  那為什麼算術平均數可以拿來代表一群數字呢?這是因為算術平均數類似於這群數字的中心點。

往左的藍色線段總長度和往右的藍色線段總長度相等

往左的藍色線段總長度和往右的藍色線段總長度相等

​我們可以把一群數值分為「比平均數小」和「比平均數大」兩類(跟平均數一樣大的就不管它)。如同上圖中,1、2、5都比平均數 (5.2) 小,而7、11則比平均數還要大。而每一個數字,和平均數之間都會有一個距離,也就是圖中的藍色線段。

  當我們計算所有「比平均數小」的數值和平均數之間的距離總和(上圖中平均數左邊的藍色線段總長度),也就是4.2 + 3.2 + 0.2 = 7.6。然後計算所有「比平均數大」的數值和平均之間的距離總和(上圖中平均數右邊的藍色線段總長度),也就是1.8 + 5.8 = 7.6。會發現兩邊距離總和是一樣的。

  因此平均數就有點類似於天平的支點,兩邊的距離總和會相等,也因此可以代表整群數值(這個特性也使平均數比較不容易受到隨機誤差的影響,這個等到推論統計的範圍再討論)。


  1. 平均數容易受極端值影響

  雖然平均數可以代表一整群數字,但平均數有另一個重要特性,就是它很容易受到極端值的影響。

  所謂的極端值,就是當一群數值中有一些超級大或者超級小的數值的時候,平均數就很容易因此變大或者變小。

  在上面的例子中,試試看把11從一整群數值中刪去,會發現平均值從5.2變成3.75。可以發現只差一個數值,平均值就差了1.45。但如果我們把7刪除,平均數只會從5.2變成4.75。很顯然的,極端的數值對於平均數的影響比非極端的數值更大。

把11刪掉和把7刪掉,對平均數的影響是不一樣的

把11刪掉和把7刪掉,對平均數的影響是不一樣的

  這個特性也是為什麼在算薪資結構的時候不應該用平均數,因為平均薪資太容易被賺很多很多錢的人給拉高,如果用平均薪資來當作國民所得的代表數,會高估大多數國民的收入,導致在政策上做出錯誤的決策。

  容易受極端值影響的特性對於資料分析來說是非常重要的,這代表當資料集當中存在極端值的時候,要好好考慮該怎麼處理。常見的處理方式包括刪除、資料轉換或者使用其他統計方式,這個就等未來再說吧。



  平均數的介紹其實非常的基礎,我也曾經想過要不要跳過這個部分。不過基於平均數的公式很好解釋,未來難免還是會需要在文章當中使用數學公式,就還是趁機寫一下好了。

  關於平均數特性的介紹,大多數統計課本當中都有,我就不特別放reference上來了。


留言
avatar-img
統計急救箱的沙龍
76會員
32內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
2024/12/29
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
2024/12/29
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
前面兩篇會刻意提到共變數,除了因為共變數在多變量統計裡面非常重要之外,最主要的原因其實是為了解釋皮爾森相關係數而做鋪陳。 相關係數的種類也相當的繁多,這裡介紹的皮爾森相關大概是最常看到的一種啦~
Thumbnail
前面兩篇會刻意提到共變數,除了因為共變數在多變量統計裡面非常重要之外,最主要的原因其實是為了解釋皮爾森相關係數而做鋪陳。 相關係數的種類也相當的繁多,這裡介紹的皮爾森相關大概是最常看到的一種啦~
Thumbnail
如果看過上一篇還不太確定共變數要怎麼計算,這篇會用圖像的方式來進行解釋,最後也會提及共變數的小缺點。
Thumbnail
如果看過上一篇還不太確定共變數要怎麼計算,這篇會用圖像的方式來進行解釋,最後也會提及共變數的小缺點。
Thumbnail
在知道平均數與標準差之後,就可以進一步了解什麼是所謂的「標準分數」了。 標準分數的重要用途是可以幫助我們比較不同單位、不同分散程度的數值。 以概念來說,跟百分等級(PR)有點類似的味道吧。 標準分數在後續的統計當中也很常會出現的。
Thumbnail
在知道平均數與標準差之後,就可以進一步了解什麼是所謂的「標準分數」了。 標準分數的重要用途是可以幫助我們比較不同單位、不同分散程度的數值。 以概念來說,跟百分等級(PR)有點類似的味道吧。 標準分數在後續的統計當中也很常會出現的。
Thumbnail
  雖然多數人應該都知道平均數是什麼,也會計算平均數,不過平均數是統計當中非常常使用的統計量,因此還是做一些基本的介紹吧。   順便趁這機會解釋一下令人頭痛的數學公式用白話文說起來是什麼。
Thumbnail
  雖然多數人應該都知道平均數是什麼,也會計算平均數,不過平均數是統計當中非常常使用的統計量,因此還是做一些基本的介紹吧。   順便趁這機會解釋一下令人頭痛的數學公式用白話文說起來是什麼。
Thumbnail
Python是一種廣泛使用的程式語言,它有許多內建的模組可以幫助我們進行各種數學運算,其中一個就是math模組,它提供了許多標準的數學函數,例如三角函數、對數函數、指數函數等,在這篇文章中,我們將介紹如何使用math模組。 導入math模組並計算圓周率的值: # 計算圓周率的值 math模組中
Thumbnail
Python是一種廣泛使用的程式語言,它有許多內建的模組可以幫助我們進行各種數學運算,其中一個就是math模組,它提供了許多標準的數學函數,例如三角函數、對數函數、指數函數等,在這篇文章中,我們將介紹如何使用math模組。 導入math模組並計算圓周率的值: # 計算圓周率的值 math模組中
Thumbnail
最後的統計機率,以及立體圖形,這大概是國中感到最輕鬆的章節。話是這麼說,因為學生到此通常都煮熟了,要死要活都定案,才感到沒差。筆者在這裡,只會針對一些常見的錯誤釐清,其他就不多說,國三這邊真的只是蜻蜓點水。圖形那邊則稍微提一下,立體概念照理說都有,還沒有的硬補也不行,不如回去先看小學高年級課程。
Thumbnail
最後的統計機率,以及立體圖形,這大概是國中感到最輕鬆的章節。話是這麼說,因為學生到此通常都煮熟了,要死要活都定案,才感到沒差。筆者在這裡,只會針對一些常見的錯誤釐清,其他就不多說,國三這邊真的只是蜻蜓點水。圖形那邊則稍微提一下,立體概念照理說都有,還沒有的硬補也不行,不如回去先看小學高年級課程。
Thumbnail
時輪是甚麼? 這是統全數理自創概念,用於確定所有算法的商數時使用 且能夠讓程式碼設計師「逐步檢查計算過程」
Thumbnail
時輪是甚麼? 這是統全數理自創概念,用於確定所有算法的商數時使用 且能夠讓程式碼設計師「逐步檢查計算過程」
Thumbnail
  至今為止,本文都使用代數的方式來討論微分,並以生活、科學中的瞬間變化率,如:速度等,對微分的定義做出詮釋。這一系列主題文章「函數微分的幾何意義」將分多集探討,用幾何角度來了解函數微分。本文章第一集將先引入代數和幾何的觀念;在概略介紹函數的圖形定義。
Thumbnail
  至今為止,本文都使用代數的方式來討論微分,並以生活、科學中的瞬間變化率,如:速度等,對微分的定義做出詮釋。這一系列主題文章「函數微分的幾何意義」將分多集探討,用幾何角度來了解函數微分。本文章第一集將先引入代數和幾何的觀念;在概略介紹函數的圖形定義。
Thumbnail
這是微積分科普系列:「從生活認識微積分」中的第一篇,在本文中將列舉數個生活例子,帶你逐一了解函數的概念,透過「長相」與「稱呼」,「商品」與「價格」、「原料」與「產品」帶你了解函數、定義域、值域的定義,並了解函數的數學標示方法,即使沒有學過函數概念的人也能讀懂。
Thumbnail
這是微積分科普系列:「從生活認識微積分」中的第一篇,在本文中將列舉數個生活例子,帶你逐一了解函數的概念,透過「長相」與「稱呼」,「商品」與「價格」、「原料」與「產品」帶你了解函數、定義域、值域的定義,並了解函數的數學標示方法,即使沒有學過函數概念的人也能讀懂。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News