好想告訴你的醫學統計-平均數、中位數與盒鬚圖

更新於 發佈於 閱讀時間約 3 分鐘
研究想探討某個疾病發生率跟年齡的關係,所以蒐集了11隻患病的狗做分析。如果我們將患犬的年齡從小到大依序排列可以得到下列的表格:
將數據依大小排列可輕鬆找出中位數、第一與第三四分位數。
這邊可以帶出幾個統計常用的名詞,首先是平均數(Mean)。平均數的算法很簡單,以這個範例而言,如果我們想知道患犬年齡的平均數,講白話些就是平均年齡(mean age),那麼我們只要把所有狗的年齡加起來再除以11就可以得到平均年齡為7.3歲。
接著是中位數(Medium),它代表的意義是一組數據如果依大小順序排列,那麼排在正中間的那個數字就是中位數;另外我們也可以把整個順序分為4個等分(Quartile),排在1/4的地方的數字稱作第一四分位數(Q1),排在3/4的數字稱作第三四分位數(Q3)。根據這種方式,排在中間的中位數也可被稱作第二四分位數(Q2),因為2/4就是1/2嘛!
如果我們想讓病犬年齡分布用更視覺化的方來呈現,這時候就可以用下面的盒鬚圖(box and whisker plot)來表示:
統計常用的盒鬚圖與其代表的意義
盒鬚圖顧名思義就是由一個盒形及上下延伸的鬚線所組成。盒子的底部代表第一四分位數,頂端就代表第三四分位數,而盒子內的橫線則是代表中位數。盒子的高度稱作四分位距(Interquartile range; IQR),也就是Q3減掉Q1所得到的數字。盒子上下方的鬚線則代表這組數據中「比較有參考意義」的最大與最小值,這邊必須要強調參考意義這四個字,因為如果單看數字的話你可能會有個疑問:年齡最小值不是編號1的2歲嗎?怎麼會變成編號2的4歲?一般來說盒鬚圖的鬚線是分別從Q1及Q3的地方上下延伸1.5倍IQR的距離,然後再從這個範圍內決定最大最小值,這種目的是要凸顯出離群值(outlier),也就是跟整體數據差異過大的極端數值;離群值在盒鬚圖上大多都是用圓圈來表示。不過我也有看過一些paper上的盒鬚圖最大最小值並不完全符合上述的方式(例如下面的圖),如果有人知道這其中的秘密的話歡迎留言幫忙補充。
節錄自Statistical analysis regarding the effects of height and weight
on life span of the domestic dog. doi:10.1016/j.rvsc.2006.06.005
最後來想來討論一下平均數跟中位數到底哪個比較重要?由於一組數據可能會包含一些極端值,因此如果單純只看平均數的話就會有點失真,在這種情況下看中位數可能會比較有意義。這點在存活分析的文章上就比較明顯。一般我們在看某個治療能夠延長壽命多久大多都是看到paper寫中位存活時間(median survival time),因為有些治療對象可能活得特別短或特別長,假使是用平均存活時間來計算的話很有可能會受到極端值的影響而拉低或拉高數字,因此使用中位存活時間是比較有意義的。中位存活時間也可以說是半數生存期,例如某個治療的中位存活時間是6個月,這就代表有50%的病患可以存活超過6個月。

參考文獻

  1. Deeper into Box Plots.
  2. 離群值的檢測
為什麼會看到廣告
有些長存飼主甚至獸醫腦中的觀念其實只有部分屬實。好想告訴你以實證醫學的角度剖析迷思,希望能矯正這些認知偏誤,讓我們能一起以更正確的觀念飼養照護。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
在這資訊爆炸的時代有許多獸醫學期刊蓬勃發展,不過對於忙碌的臨床獸醫來說實在是很難把期刊上的每篇文章都仔細閱讀過一遍。好想告訴你的獸醫師就來幫大家把期刊上比較實用的文章做個導讀,讓大家可以迅速瀏覽過一遍,如果發現有興趣的文章可以再細細品讀。
第一次看到aerodigestive這個詞我就跟aerophagia搞混,想說吞了一堆空氣到底有什麼好討論殊不知,原來是要討論斜槓器官來著! Aerodigestive organ 翻成中文叫作呼吸消化道器官,包括嘴唇、口腔、舌頭、鼻子、咽喉、聲帶、部分的食道與氣管。好想告訴你這些器官的疾病是如何?
腫瘤治療除了外科手術之外,內科藥物治療也是重要的環節,不過我們到底該如何去判斷藥物對腫瘤治療有沒有效?這個問題長久以來就一直困擾人醫的腫瘤專家。
前天,獸醫內科學會期刊發表了一篇研究,發現目前市面上的血液配對快篩,無法取代輸血前的交叉比對試驗。這邊要再次苦口婆心:雖然交叉比對試驗很冗長繁複、情急之下還是會花非常多時間,但配對之後再輸血能夠避免非常多的麻煩(輸血刺激的各種不良反應)所以一定要認真努力以及耐心等候
你知道檢測甲狀腺素除了能評估甲狀腺相關疾病之外,還能作為預後指標來使用嗎?!
先前,有認真的飼主讀了獸醫好想告訴你先前分享的:貓咪攝取高濃度磷的飲食會影響腎臟功能兩篇文獻的整理發問道: 那是不是盡可能減少磷的攝取比較好呢?
在這資訊爆炸的時代有許多獸醫學期刊蓬勃發展,不過對於忙碌的臨床獸醫來說實在是很難把期刊上的每篇文章都仔細閱讀過一遍。好想告訴你的獸醫師就來幫大家把期刊上比較實用的文章做個導讀,讓大家可以迅速瀏覽過一遍,如果發現有興趣的文章可以再細細品讀。
第一次看到aerodigestive這個詞我就跟aerophagia搞混,想說吞了一堆空氣到底有什麼好討論殊不知,原來是要討論斜槓器官來著! Aerodigestive organ 翻成中文叫作呼吸消化道器官,包括嘴唇、口腔、舌頭、鼻子、咽喉、聲帶、部分的食道與氣管。好想告訴你這些器官的疾病是如何?
腫瘤治療除了外科手術之外,內科藥物治療也是重要的環節,不過我們到底該如何去判斷藥物對腫瘤治療有沒有效?這個問題長久以來就一直困擾人醫的腫瘤專家。
前天,獸醫內科學會期刊發表了一篇研究,發現目前市面上的血液配對快篩,無法取代輸血前的交叉比對試驗。這邊要再次苦口婆心:雖然交叉比對試驗很冗長繁複、情急之下還是會花非常多時間,但配對之後再輸血能夠避免非常多的麻煩(輸血刺激的各種不良反應)所以一定要認真努力以及耐心等候
你知道檢測甲狀腺素除了能評估甲狀腺相關疾病之外,還能作為預後指標來使用嗎?!
先前,有認真的飼主讀了獸醫好想告訴你先前分享的:貓咪攝取高濃度磷的飲食會影響腎臟功能兩篇文獻的整理發問道: 那是不是盡可能減少磷的攝取比較好呢?
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
這個文章簡單介紹了什麼是中途,中途之家的公立與私有區別,以及中途之家提供的功能。
Thumbnail
小犬來到我們家中時,經獸醫判斷應該已經5-7歲間,狗的年齡以正常而言,也不可能超過人類,所以隨著他年紀越大,伴隨他本身長年的慢性病,即使晚年有看中醫調養,也如中醫所說,當器官都在慢性衰竭時,我們能做的是維持晚年的生活品質。 同時,我持續的在調整與練習,面對離別或關係的結束。 這也是在爸媽都反對繼續
本文深入淺出地解析均線使用技巧,包括均線排列、股價與均線關係、均線斜率及交叉等重點,幫助投資者掌握趨勢判斷的關鍵,提升投資決策能力。
Thumbnail
對於五月市場的交易記錄檢討和進步,強調調整次序對於交易結果的重要性,並且以人與狗的關係來比喻經濟與股市的關係。最後,強調追求中期成就和想像美好的重要性。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
生命週期是生命靈數學中一個重要的概念,它幫助我們了解在不同階段的生活中可能會遇到的挑戰和機遇。這裡,我們將簡單介紹如何計算你的生命週期,以及如何理解它們。生命週期通常分為三個階段:早期(出生至30歲)、中期(31至60歲)和晚期(61歲以後)。要計算這些週期。
Thumbnail
這次要介紹的圖表叫做蝴蝶圖,主要用來比較兩種數據之間的差異,並且以左右兩邊的方式來呈現比較結果。 那為什麼稱之為蝴蝶圖呢?阿就真的長的很像蝴蝶阿😆,兩邊的數列就很像蝴蝶的翅膀一樣。 這次用的範例是要比較兩個年度的數據關係,想要看出2022年與2023年各項目的變化。 一般的橫
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
這個文章簡單介紹了什麼是中途,中途之家的公立與私有區別,以及中途之家提供的功能。
Thumbnail
小犬來到我們家中時,經獸醫判斷應該已經5-7歲間,狗的年齡以正常而言,也不可能超過人類,所以隨著他年紀越大,伴隨他本身長年的慢性病,即使晚年有看中醫調養,也如中醫所說,當器官都在慢性衰竭時,我們能做的是維持晚年的生活品質。 同時,我持續的在調整與練習,面對離別或關係的結束。 這也是在爸媽都反對繼續
本文深入淺出地解析均線使用技巧,包括均線排列、股價與均線關係、均線斜率及交叉等重點,幫助投資者掌握趨勢判斷的關鍵,提升投資決策能力。
Thumbnail
對於五月市場的交易記錄檢討和進步,強調調整次序對於交易結果的重要性,並且以人與狗的關係來比喻經濟與股市的關係。最後,強調追求中期成就和想像美好的重要性。
Thumbnail
有學過統計的人都知道,所謂的平均有許多不同的定義,我們今天要來學習在金融財務當中常見的平均方法。 這些平均方式可能是用在績效的結果,也可能是用在分析財務報表。 這些統計有時候差之毫釐、失之千里,我們在理解不同的統計分析跟看其結果時,不可不慎。 本篇文章簡單介紹5種平均數
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
生命週期是生命靈數學中一個重要的概念,它幫助我們了解在不同階段的生活中可能會遇到的挑戰和機遇。這裡,我們將簡單介紹如何計算你的生命週期,以及如何理解它們。生命週期通常分為三個階段:早期(出生至30歲)、中期(31至60歲)和晚期(61歲以後)。要計算這些週期。
Thumbnail
這次要介紹的圖表叫做蝴蝶圖,主要用來比較兩種數據之間的差異,並且以左右兩邊的方式來呈現比較結果。 那為什麼稱之為蝴蝶圖呢?阿就真的長的很像蝴蝶阿😆,兩邊的數列就很像蝴蝶的翅膀一樣。 這次用的範例是要比較兩個年度的數據關係,想要看出2022年與2023年各項目的變化。 一般的橫
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」