敘述統計 (Descriptive Statistics)

更新於 發佈於 閱讀時間約 4 分鐘

敘述統計 (Descriptive Statistics) 是統計學的一個分支,旨在以簡潔的方式總結和描述數據集的特徵。它主要關注收集、組織、呈現和分析數據,但不涉及對總體進行推斷或預測。敘述統計的主要目標是提供數據的清晰概覽,使其更容易理解和解釋。

敘述統計通常包括以下幾種主要的度量和方法:

1. 集中趨勢的度量 (Measures of Central Tendency): 這些度量用於識別數據集的典型值或中心位置。

  • 平均數 (Mean): 將數據集中所有數值加總後除以數據的個數。它是最常用的集中趨勢度量。
  • 中位數 (Median): 將數據集按大小排序後,位於中間位置的數值。如果數據個數為偶數,則為中間兩個數值的平均數。中位數不受極端值的影響。
  • 眾數 (Mode): 數據集中出現次數最多的數值。一個數據集可能有多個眾數或沒有眾數。

2. 離散程度的度量 (Measures of Dispersion) / 變異性的度量 (Measures of Variability): 這些度量用於描述數據集中數值的散佈或變異程度。

  • 全距 (Range): 數據集中最大值與最小值之間的差。它提供了一個簡單的數據散佈的度量,但容易受極端值的影響。
  • 四分位距 (Interquartile Range, IQR): 第 75 百分位數(第三四分位數)與第 25 百分位數(第一四分位數)之間的差。它衡量了中間 50% 數據的散佈程度,對極端值不太敏感。
  • 變異數 (Variance): 衡量數據點與平均數之間偏離程度的平均值。它是將每個數據點與平均數的差的平方求和,然後除以數據個數(或在樣本變異數中除以 n-1)。
  • 標準差 (Standard Deviation): 變異數的平方根。它以與原始數據相同的單位表示數據的散佈程度,更易於理解。
  • 平均絕對離差 (Mean Absolute Deviation, MAD): 衡量數據點與平均數之間絕對差值的平均值。它對極端值的敏感度不如變異數和標準差。

3. 分布形狀的描述 (Description of the Shape of the Distribution): 敘述統計也包括對數據分布形狀的描述。

  • 直方圖 (Histogram): 用於顯示連續數據分布的圖表。
  • 長條圖 (Bar Chart): 用於顯示類別數據頻率的圖表。
  • 盒鬚圖 (Box Plot): 一種標準化的方式,用於顯示數據集的最小值、第一四分位數、中位數、第三四分位數和最大值。
  • 偏度 (Skewness): 衡量數據分布的不對稱程度。正偏表示分布向右傾斜,負偏表示分布向左傾斜。
  • 峰度 (Kurtosis): 衡量數據分布的尖峭程度。高峰度表示數據更集中在平均數附近,且尾部更細;低峰度表示數據分布更平坦。

4. 相關性的描述 (Description of Relationships): 敘述統計還可以描述數據集中不同變數之間的關係。

  • 散佈圖 (Scatter Plot): 用於顯示兩個變數之間關係的圖表。
  • 相關係數 (Correlation Coefficient): 衡量兩個變數之間線性關係的強度和方向(例如,皮爾森相關係數)。

總結來說,敘述統計提供了一套工具和方法,用於總結數據的主要特徵,例如其中心位置、散佈程度和分布形狀。它是理解數據的第一步,為進一步的統計分析和推斷奠定基礎。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
4會員
229內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師
你可能也想看
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
數據分析是現代社會的核心技能,適用於各行各業。無論是在市場營銷、財務管理,還是產品開發中,數據分析都扮演著至關重要的角色。提升數據敏感度有助於提高分析的準確性和效率,使我們能夠迅速找到關鍵信息,進而做出明智的決策。本文將探討數據分析訓練方法,提供實用案例,幫助初學者快速掌握數據分析技術。
Thumbnail
數據分析是現代社會的核心技能,適用於各行各業。無論是在市場營銷、財務管理,還是產品開發中,數據分析都扮演著至關重要的角色。提升數據敏感度有助於提高分析的準確性和效率,使我們能夠迅速找到關鍵信息,進而做出明智的決策。本文將探討數據分析訓練方法,提供實用案例,幫助初學者快速掌握數據分析技術。
Thumbnail
這本書的起源來自於疫情期間,作者以數學家的角度,在網路上發表文章,幫大眾解讀疫情的統計數字是什麼意思,我看完這本書以後不禁感嘆,如果我更早理解這些概念就好了。
Thumbnail
這本書的起源來自於疫情期間,作者以數學家的角度,在網路上發表文章,幫大眾解讀疫情的統計數字是什麼意思,我看完這本書以後不禁感嘆,如果我更早理解這些概念就好了。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
本篇文章分享從製作數據分析報告到PPT簡報技巧,內容包括數據分析報告的構成要素、主體的清晰邏輯設定,以及製作精準PPT簡報的方法。提供從製作報告的過程到提升製作效率的建議,適合初入職場的數據分析新人們參考喔~
Thumbnail
本篇文章分享從製作數據分析報告到PPT簡報技巧,內容包括數據分析報告的構成要素、主體的清晰邏輯設定,以及製作精準PPT簡報的方法。提供從製作報告的過程到提升製作效率的建議,適合初入職場的數據分析新人們參考喔~
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News