生態學家的統計學素養

H-Jay

發佈於生態議題與科學研究評論

更新於 2024/12/11發佈於 2021/12/12閱讀時間約 4 分鐘

統計方法是生態學量化研究的重要工具。觀念不清、使用不慎，使分析結果貽笑大方就算了；若據以擴張解釋並影響決策，其後果就非同小可。最怕的是濫用統計工具，以期達到預設的研究結果，那就涉及科學態度與科學倫理了。

最常見的錯誤就是標準差(standard deviation)、標準誤(standard error)、以及邊際誤差(margin of error)的混淆不清。

東海大學生命科學系劉少倫教授臉書貼文宣揚藻礁碳封存的表現，但其論述有明顯統計學問題。

「珊瑚藻生態系每一公頃平均可以封存七百多萬克的碳，標準差正負約一百萬克的碳（最多可達八百萬，最低六百萬）」。文中「最多可達八百萬，最低六百萬」，顯然是把標準差當作邊際誤差，直接拿來與平均值加減。

標準差是在描述一組資料的離散程度；標準誤則是描述一組資料的平均值，其來自的抽樣分布(sampling distribution)之離散程度。如果單純描述一組資料的離散程度，要用標準差。如果要推論一組資料的平均值與某一特定數值，或與另一組資料的平均值之差異，則要用標準誤。如果要推論一組資料的平均值在某一信心水準之下的範圍，要用邊際誤差。邊際誤差是標準誤乘以所設定的信心水準對應之值。例如df=30的t分布，95%信心水準對應的t值是2.042；95%信心水準的邊際誤差就是標準誤乘以2.042。簡單說，標準差用在描述，標準誤用在推論。「最多可達八百萬，最低六百萬」這是在推論平均值，絕對不能使用標準差，不然就是非常非常低級的錯誤。另外，標準差與標準誤一定是正值，絕對不應該出現「標準差正負約一百萬」這樣的敘述。

該則臉書貼文又說「有人一定會說林惠真老師在大潭藻礁看到的螃蟹數量統計標準差有負值是有問題的，但會這樣想顯然不懂統計數字怎麼正確解讀，會有負值就是因為有許多數值為零的資料造成，但不代表海草床固碳能力不佳。同樣的，大潭藻礁螃蟹數量在標準差下會有負值，是因為有許多零的資料，但平均值是高的，仍然顯示大潭藻礁螃蟹數量是很高的。」

我們先來看看林惠真教授的大潭藻礁螃蟹數量是怎麼估計的。這是林務局農村再生基金補助計畫(107 農再-2.2.6-1.1-林-001-01(Z))的研究。該計畫結案報告的p.160敘述了螃蟹數量的估計。

該文中，沒有說明0.7±1.1及606.82±1117.65是甚麼統計值，但同份報告在表3-6(p.153)及表3-7(p.155)的螃蟹調查結果都以平均值±標準差呈現，所以p.160數量估計所呈現的數值，合理懷疑也是平均值±標準差，而非平均值±邊際誤差。而且，邊際誤差必須說明採用的信心水準，但報告中完全沒有；很顯然，作者習慣以平均值±標準差呈現結果，並直接以平均值加減一個標準差估計信賴區間。說實在，這是很不應該出現的錯誤。

劉少倫教授認為批評林惠真教授螃蟹數量估計不合理的人「顯然不懂統計數字怎麼正確解讀」。可惜真正不懂得的，卻是這兩位教授。首先，標準差是用在描述樣本數據的離散情形，不可直接用以推論樣本平均值範圍。其次，對於有許多零的極度右偏分布之樣本，以其統計值直接推論母體平均值的信賴區間也是非常不恰當的。這時候，可以用 bootstrapping 來解決；bootstrapping 的概念及方法，則是大學部的基礎生物統計學就會教的內容。

林惠真在劉少倫的臉書貼文回應「到底誰的統計學不及格啊？」，啊都拿標準差來推論信賴區間了，你說會是誰呢？！

H-Jay的沙龍生態議題與科學研究評論

留言

留言分享你的想法！

H-Jay的沙龍

7會員

3內容數

生態或環境議題常有許多不符合科學或生態學原理的論述。生態科學研究文獻則可能存在科學邏輯或統計分析方法謬誤，甚至有科學倫理問題。這個專題以討論環境議題的生態學面向，以及評述國內生態學研究文獻為主；期望國內的生態議題討論能更理性與就事論事，生態學科學研究則更精緻與完善。

你可能也想看

MC 統計的沙龍

點估計

最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?

#資訊#討論#政策

2023/07/09

MC 統計的沙龍

點估計

最近天氣特別炎熱, 如果今天你想出門搭訕, 你知道在西門北車信義還是中山哪個地點比較容易有收穫嗎? 你會怎麼做得知這個資訊呢?

#資訊#討論#政策

2023/07/09

🦙切の人生雜學

【閱讀回溯EP.8】邏輯思考 & 環遊世界

工程師環遊世界的書，給我很大的激勵，當時就是這本書，讓我訂下人生旅遊目標，把馬丘比丘和 PCT (太平洋屋脊步道) 列入人生清單。雖然更魯蛇的我，到現在來出國都沒有過，不過倒是沒想到竟然先徒步環島了，這也可以說是為以後的西班牙朝聖之路、PCT 先做練習吧~~~~~

#徒步#環遊世界#旅行

2023/07/02

🦙切の人生雜學

【閱讀回溯EP.8】邏輯思考 & 環遊世界

#徒步#環遊世界#旅行

2023/07/02

彼得潘的沙龍

積累的力量（下）

人文的積累上一篇匆忙疲睏中忘了提到珊瑚海面下珊瑚叢瑰麗多彩吸引浮潛人士趨之若鶩其實我們欣賞到的是“屍體” 由珊瑚蟲死後遺骸積累而成的和鐘乳石的成分“碳酸鈣”恰恰相同

2023/03/04

2023/03/04

這是很多統計學初學者會有的疑惑。大部分的統計數據呈現，像是人口調查、民調等等，都會利用抽樣來推估真實值，並在抽樣的結果附近加上一段信賴區間，可以簡單理解為誤差範圍（如果涉及統計推論則會呈現 p 值）。那個範圍會有他對應的信心水準，但很多人將其理解為「真實值落在這個範圍內的機率」，然而這其實是錯誤的。

#統計學#信賴區間#信心水準

2022/11/23