分層抽樣（Stratified Sampling）

iPAS AI應用規劃師學習筆記

發佈於數據準備與模型選擇

2025/09/10 更新2025/09/10 發佈閱讀 2 分鐘

分層抽樣（Stratified Sampling）是一種統計抽樣方法，將總體按特定特徵或規則劃分為若干個同質的子群組（稱為層），然後對每個層內獨立進行隨機抽樣。這種方法結合了分組與隨機抽樣的優點，提高了樣本的代表性和估計的精度。

分層抽樣的原理與步驟

劃分層次：根據變量（如年齡、性別、地區）將總體劃分成互不重疊、內部相對均質的幾個層。
分層抽樣：在每個層內使用簡單隨機抽樣或系統抽樣抽取樣本。
合併樣本：將各層抽取的樣本綜合，即成為整體樣本。

分層抽樣的特點

提高代表性：保障不同層的特徵在樣本中有足夠比例，避免樣本偏倚。
減少變異性：各層內部均質，能減少抽樣誤差。
適合異質總體：當總體內部分組間差異較大時，分層抽樣更適合。

分層樣本數分配

比例分配：根據各層在總體中的比例分配樣本數。
最優（奈曼）分配：考慮層內變異和大小，分配樣本數最大限度降低變異。
非比例分配：針對小且重要的層適當增加樣本數，提升調查的精度。

應用場景

政府人口普查、社會調查
市場調研和意見採集
醫學臨床研研究分層分析

簡言之，分層抽樣通過將總體劃分為層，確保各層均被充分代表，提高抽樣結果的準確性和可靠性，特別適合於異質性較大的人口或調查對象。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記數據準備與模型選擇

留言

郝信華 iPAS AI應用規劃師學習筆記

46會員

572內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/09/10

robots.txt協議

robots.txt協議是一種網站用來指示網路爬蟲（如搜尋引擎機器人）哪些頁面可以爬取、哪些禁止訪問的標準協議。它通過在網站根目錄放置一個名為「robots.txt」的純文字文件，控制爬蟲的爬取行為，幫助網站控制流量和保護私有內容，同時優化搜尋引擎的爬取效率。 robots.txt的主要功能限

2025/09/10

robots.txt協議

2025/09/10

PR曲線（Precision-Recall Curve，精確率-召回率曲線）

PR曲線（Precision-Recall Curve，精確率-召回率曲線）是一種用來評估分類模型性能，特別是二分類任務中，通過不同分類閾值下的精確率（Precision）與召回率（Recall）的變化關係繪製而成的曲線。 PR曲線定義：橫軸（X軸）是召回率（Recall），表示模型在所有實際

2025/09/10

PR曲線（Precision-Recall Curve，精確率-召回率曲線）

2025/09/10

線性回歸的基本假設

線性回歸的基本假設是指在建立線性回歸模型時對數據和誤差項提出的前提條件，這些假設保證了模型的合理性和統計推論的有效性。主要有以下幾個核心假設： 1. 線性關係應變數（Y）和自變數（X）之間存在線性關係，即模型形式可表達為 2. 誤差項期望為零誤差項的期望值為零，表示誤差沒有系統性的偏差

2025/09/10

線性回歸的基本假設

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

JayRay 的沙龍

【資料分析】資料分析起手式，理解數據並使用python找到資料間的關聯

在資料分析過程中，透過衡量變數之間的線性或非線性關係，能有效探索數據集，篩選出重要特徵，並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性，以及利用互資訊評估變數之間的依賴程度，幫助資料科學家在建模過程中選擇適當的變數，提升模型效果。

#數據#資訊#模型

2024/08/07

JayRay 的沙龍

【資料分析】資料分析起手式，理解數據並使用python找到資料間的關聯

2024/08/07

2024/05/23

2024/05/23

使用R語言跑多層次模型:加入層次2預測變項

在進行多層次線性模型（MLM）當中，有時候我們不只會加入層次1的預測變項。我們也會想加入層次2預測變項。本文將介紹加入層次2預測變項的各種模型，並解釋其公式和R語言操作方法。因為內容比較多，所以篇幅比較長。多層次線性模型（MLM），截距是表示所有學校的平均值。斜率是指模型中自變量的係數，表

#R語言#隨機#成績

2024/07/30

教育心理博士的筆記本

使用R語言跑多層次模型:加入層次2預測變項

#R語言#隨機#成績

2024/07/30

果農的沙龍

如何用Python篩選每個人的第一筆紀錄？

用Python篩選每個人的第一筆紀錄

#python#資料分析#數據分析

2024/06/14

果農的沙龍

如何用Python篩選每個人的第一筆紀錄？

用Python篩選每個人的第一筆紀錄

#python#資料分析#數據分析

2024/06/14

果農的沙龍

如何用Python繪製群組直條圖

本文將介紹如何用Python繪製群組直條圖。

#python#資料分析#數據分析

2024/04/16

果農的沙龍

如何用Python繪製群組直條圖

本文將介紹如何用Python繪製群組直條圖。

#python#資料分析#數據分析

2024/04/16

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28