統計急救箱─算術平均數

閱讀時間約 5 分鐘

  就算是沒有學過統計學的人,對於平均數這個名詞一定也不陌生。在台灣的基礎教育裡面,一定有學過平均數要怎麼計算,可以說是一個眾所周知的統計概念。不過關於平均數的一些小知識並不是人人都知道,因此這篇文章就來簡單介紹一下大家都學過的平均數有哪些特性。


平均數的類型

  一般大眾口中所稱的平均數,正式名稱是「算術平均數」,是一種最通用的平均數。然而根據情況的不同,計算平均數的方式會有一些變化,產生了平均數的家族。例如調和平均數、幾何平均數、移動平均數等等。

  不過在統計學當中最常使用的還是算術平均數,所以沒有特別說明的情況下,約定成俗都會認為「平均數」指的就是算術平均數,英文名詞為Mean。


平均數是拿來幹嘛的?

  平均數的功能就是拿來代表一群數字的。假設今天有五個分數,將這五個分數平均之後就可以只用一個分數來代表這整群數字。

平均數的功能是用來代表一群數字

平均數的功能是用來代表一群數字


算術平均數的計算方式

  算術平均數的計算方式很簡單,就是把一群數字全部加起來,然後除以該群數字的個數。

  趁著這個機會,就用這種簡單的計算來解釋一下看起來可怕的數學公式。現在我們要先假設有五個數字,分別代表著1、2、5、7、11。

這裡有五個數字

這裡有五個數字

要計算這五個數字,第一個步驟就是把他們全部加起來:1 + 2 + 5 + 7 + 11 = 26。第二個步驟則是把他們除以這群數字的個數,也就是除以5:26 / 5 = 5.2。於是這五個數字的平均數就是5.2了。

1、2、5、7、11的平均數是5.2

1、2、5、7、11的平均數是5.2

如果用正式的數學公式表達,以下是算術平均數的數學公式:

算術平均數的數學式

算術平均數的數學式

  接下來就把這個數學公式翻譯成白話文吧!

  首先是那個看起來像是逆時針轉了90度的M的符號,是一個希臘字母,念作Sigma。其數學意義是「連加」,也就是把一群數字加起來的意思。Sigma的右側由下往上寫著小小的1和n,意思是把一群數字從第1個到第n個通通加起來。所以整個符號的完整念法是:Sigma從1到n。

  Sigma右邊的x,就是這一群數字裡面的每個數字,依照x旁邊小小的i來決定是哪個數。X1是這群數字的第1個數,X2是第2個...Xi是第i個,而Xn就是第n個數字(如果你想知道怎麼決定哪個數字是第1個數,哪個是第2個...答案是隨你喜歡,反正最後就是要把全部的數字加起來)。

  那我們要怎麼確定i代表的數字範圍到底是多大呢?答案是要看Sigma右邊那兩個小數字。Sigma右邊下方的小數字,就是i的起始值,上面的小數字則是終止值。所以當我們說:Sigma從1到n的Xi,就表示有一群數字(以Xi來表示),我們要把這群數字中的第1個到第n個都加起來。

  因此平均數的公式也可以這樣寫(把Sigma拿掉的版本):

把Sigma拿掉後的平均數公式

把Sigma拿掉後的平均數公式

最後分母的部分,因為分子是n個數字相加,所以分母就除以n。這裡的n表示的就是這群數字總共有n個。在上面舉的例子中,n就是5。

  所以Sigma符號並不可怕,只要看到Sigma就知道它指的其實是要把一群數字通通加起來就是了。換個方式說,其實Sigma就是Excel裡面的SUM函數,就是把一個範圍之內的數字全部都加起來。


算術平均數的特性

  1. 平均數類似於一群數值的中心點

  那為什麼算術平均數可以拿來代表一群數字呢?這是因為算術平均數類似於這群數字的中心點。

往左的藍色線段總長度和往右的藍色線段總長度相等

往左的藍色線段總長度和往右的藍色線段總長度相等

​我們可以把一群數值分為「比平均數小」和「比平均數大」兩類(跟平均數一樣大的就不管它)。如同上圖中,1、2、5都比平均數 (5.2) 小,而7、11則比平均數還要大。而每一個數字,和平均數之間都會有一個距離,也就是圖中的藍色線段。

  當我們計算所有「比平均數小」的數值和平均數之間的距離總和(上圖中平均數左邊的藍色線段總長度),也就是4.2 + 3.2 + 0.2 = 7.6。然後計算所有「比平均數大」的數值和平均之間的距離總和(上圖中平均數右邊的藍色線段總長度),也就是1.8 + 5.8 = 7.6。會發現兩邊距離總和是一樣的。

  因此平均數就有點類似於天平的支點,兩邊的距離總和會相等,也因此可以代表整群數值(這個特性也使平均數比較不容易受到隨機誤差的影響,這個等到推論統計的範圍再討論)。


  1. 平均數容易受極端值影響

  雖然平均數可以代表一整群數字,但平均數有另一個重要特性,就是它很容易受到極端值的影響。

  所謂的極端值,就是當一群數值中有一些超級大或者超級小的數值的時候,平均數就很容易因此變大或者變小。

  在上面的例子中,試試看把11從一整群數值中刪去,會發現平均值從5.2變成3.75。可以發現只差一個數值,平均值就差了1.45。但如果我們把7刪除,平均數只會從5.2變成4.75。很顯然的,極端的數值對於平均數的影響比非極端的數值更大。

把11刪掉和把7刪掉,對平均數的影響是不一樣的

把11刪掉和把7刪掉,對平均數的影響是不一樣的

  這個特性也是為什麼在算薪資結構的時候不應該用平均數,因為平均薪資太容易被賺很多很多錢的人給拉高,如果用平均薪資來當作國民所得的代表數,會高估大多數國民的收入,導致在政策上做出錯誤的決策。

  容易受極端值影響的特性對於資料分析來說是非常重要的,這代表當資料集當中存在極端值的時候,要好好考慮該怎麼處理。常見的處理方式包括刪除、資料轉換或者使用其他統計方式,這個就等未來再說吧。



  平均數的介紹其實非常的基礎,我也曾經想過要不要跳過這個部分。不過基於平均數的公式很好解釋,未來難免還是會需要在文章當中使用數學公式,就還是趁機寫一下好了。

  關於平均數特性的介紹,大多數統計課本當中都有,我就不特別放reference上來了。


avatar-img
52會員
32內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
統計急救箱的沙龍 的其他內容
搞不懂變數的類型,統計就註定要跑失敗的。 至少要知道名義、次序與等距變數,未來選擇統計分析時才會有正確的結果。
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
  在回答過關於統計的問題裡面,有許多問題真正的癥結點其實不在統計能力上。所以就先從一些前情提要的觀念開始寫吧~   先搞懂統計才能做研究?量化與質化研究是什麼?顯著就是一切嗎?數學要很好才能學統計?這篇文章裡面都有討論。
最開始的想法其實只是想寫點筆記。 碩士畢業之後,隨著大數據的風潮而開始認真學起了統計學,過程中逐漸也弄懂了不少以前一知半解的事情。時常有著「當時要是有人告訴我這些就好了啊~」的感嘆,很怕自己沒寫下來就忘了,所以想記錄起來。
搞不懂變數的類型,統計就註定要跑失敗的。 至少要知道名義、次序與等距變數,未來選擇統計分析時才會有正確的結果。
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
  在回答過關於統計的問題裡面,有許多問題真正的癥結點其實不在統計能力上。所以就先從一些前情提要的觀念開始寫吧~   先搞懂統計才能做研究?量化與質化研究是什麼?顯著就是一切嗎?數學要很好才能學統計?這篇文章裡面都有討論。
最開始的想法其實只是想寫點筆記。 碩士畢業之後,隨著大數據的風潮而開始認真學起了統計學,過程中逐漸也弄懂了不少以前一知半解的事情。時常有著「當時要是有人告訴我這些就好了啊~」的感嘆,很怕自己沒寫下來就忘了,所以想記錄起來。
你可能也想看
Google News 追蹤
在前一篇概略的介紹了抽象代數的架構,而這一篇就是來細談在那些部分,術數其實帶有代數性質。 運氣的演算 基本上術數,或任何占卜,最直接的目的就是在於計算某個事件中的「運氣值」,進而判斷吉凶。 用神喜忌等等 在東方陰陽五行的占卜中,最核心的技術概念就是用神跟五行氣的喜忌,最簡單的以代數的方式表示
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
本文介紹了各種運算符的用法和優先級,包括算術運算符、比較運算符、賦值運算符、邏輯運算符、位元運算符、成員運算符和身份運算符。每種運算符都有詳細的描述和示例程式碼,幫助理解其功能和用法。
Thumbnail
電腦只做一件事情: 運算。 我們所看到的任何酷酷的應用: 不論是網頁動畫、遊戲特效、甚至是 AI 說的話,全部都 是由電腦的運算結果組合而成的。 首先我們來梳理一下各個名詞之間的關聯: 1. 運算分成兩個部分: 運算子 (運算的名稱,如: 加法) 和運算元 (運算的對象,如: 8)。運算就是對資
※ JavaScript的五種運算子: 我們希望操控這些值,來達成我們想要的結果。 運算式由運算元和運算子組成。運算元是指我們要拿去做運算的東西是什麼?例如:5和4。運算子是他要做什麼樣子的運算?例如:"+"。 算術運算子:"+加"、"-減"、"*乘"、"/除"、"%(mod餘數概念)"。
Thumbnail
生命是一道算術題,人的一生不過三萬多個日子,活一天就會減少一天。“從少到多——從多到簡——從簡到繁——從繁到真”的過程,分別就是通過“加減乘除”四種運算法則實現的。從出生開始,為生命做加法,增加灑脫,增加慈悲,增加財富,加入智慧的光芒,加入品格的力量,加入親情的溫馨,使人生更加豐盈。而人生的減法,「
Thumbnail
來看看 AVERAGE 怎麼寫!這篇教學是喜特先生為 Google 試算表新手而寫的「聚集函式御五家」系列文之一,會分享在 Google 試算表上簡單又實用的五種函式 SUM、AVERAGE、COUNT 與 COUNTA、MAX、 MIN ,每篇都會解釋語法、並且附上一個簡單的例子讓你可以一起練習。
Thumbnail
可能包含敏感內容
一起看看 SUM 是什麼吧! 這篇教學是喜特先生為 Google 試算表新手而寫的「聚集函式御五家」系列文之一,會分享在 Google 試算表上簡單又實用的五種函式 SUM、AVERAGE、COUNT 與 COUNTA、MAX、 MIN ,每篇都會解釋語法、並且附上一個簡單的例子讓你可以一起練習。
Thumbnail
在Python中,數值運算非常直觀,你可以使用標準的數學運算符號進行基本的數值運算。以下是一些基本的數值運算: 進行計算時,按照「先乘除後加減」的規則,並優先計算小括號刮起來的運算式。 print('答案:' ,(1+1)*2) #​答案: 4 復合型態的運算子 指定運算子 = 若是結合算術
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
在前一篇概略的介紹了抽象代數的架構,而這一篇就是來細談在那些部分,術數其實帶有代數性質。 運氣的演算 基本上術數,或任何占卜,最直接的目的就是在於計算某個事件中的「運氣值」,進而判斷吉凶。 用神喜忌等等 在東方陰陽五行的占卜中,最核心的技術概念就是用神跟五行氣的喜忌,最簡單的以代數的方式表示
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
本文介紹了各種運算符的用法和優先級,包括算術運算符、比較運算符、賦值運算符、邏輯運算符、位元運算符、成員運算符和身份運算符。每種運算符都有詳細的描述和示例程式碼,幫助理解其功能和用法。
Thumbnail
電腦只做一件事情: 運算。 我們所看到的任何酷酷的應用: 不論是網頁動畫、遊戲特效、甚至是 AI 說的話,全部都 是由電腦的運算結果組合而成的。 首先我們來梳理一下各個名詞之間的關聯: 1. 運算分成兩個部分: 運算子 (運算的名稱,如: 加法) 和運算元 (運算的對象,如: 8)。運算就是對資
※ JavaScript的五種運算子: 我們希望操控這些值,來達成我們想要的結果。 運算式由運算元和運算子組成。運算元是指我們要拿去做運算的東西是什麼?例如:5和4。運算子是他要做什麼樣子的運算?例如:"+"。 算術運算子:"+加"、"-減"、"*乘"、"/除"、"%(mod餘數概念)"。
Thumbnail
生命是一道算術題,人的一生不過三萬多個日子,活一天就會減少一天。“從少到多——從多到簡——從簡到繁——從繁到真”的過程,分別就是通過“加減乘除”四種運算法則實現的。從出生開始,為生命做加法,增加灑脫,增加慈悲,增加財富,加入智慧的光芒,加入品格的力量,加入親情的溫馨,使人生更加豐盈。而人生的減法,「
Thumbnail
來看看 AVERAGE 怎麼寫!這篇教學是喜特先生為 Google 試算表新手而寫的「聚集函式御五家」系列文之一,會分享在 Google 試算表上簡單又實用的五種函式 SUM、AVERAGE、COUNT 與 COUNTA、MAX、 MIN ,每篇都會解釋語法、並且附上一個簡單的例子讓你可以一起練習。
Thumbnail
可能包含敏感內容
一起看看 SUM 是什麼吧! 這篇教學是喜特先生為 Google 試算表新手而寫的「聚集函式御五家」系列文之一,會分享在 Google 試算表上簡單又實用的五種函式 SUM、AVERAGE、COUNT 與 COUNTA、MAX、 MIN ,每篇都會解釋語法、並且附上一個簡單的例子讓你可以一起練習。
Thumbnail
在Python中,數值運算非常直觀,你可以使用標準的數學運算符號進行基本的數值運算。以下是一些基本的數值運算: 進行計算時,按照「先乘除後加減」的規則,並優先計算小括號刮起來的運算式。 print('答案:' ,(1+1)*2) #​答案: 4 復合型態的運算子 指定運算子 = 若是結合算術
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」