分層抽樣(Stratified Sampling)是一種統計抽樣方法,將總體按特定特徵或規則劃分為若干個同質的子群組(稱為層),然後對每個層內獨立進行隨機抽樣。這種方法結合了分組與隨機抽樣的優點,提高了樣本的代表性和估計的精度。
分層抽樣的原理與步驟
- 劃分層次:根據變量(如年齡、性別、地區)將總體劃分成互不重疊、內部相對均質的幾個層。
- 分層抽樣:在每個層內使用簡單隨機抽樣或系統抽樣抽取樣本。
- 合併樣本:將各層抽取的樣本綜合,即成為整體樣本。
- 提高代表性:保障不同層的特徵在樣本中有足夠比例,避免樣本偏倚。
- 減少變異性:各層內部均質,能減少抽樣誤差。
- 適合異質總體:當總體內部分組間差異較大時,分層抽樣更適合。
分層樣本數分配
- 比例分配:根據各層在總體中的比例分配樣本數。
- 最優(奈曼)分配:考慮層內變異和大小,分配樣本數最大限度降低變異。
- 非比例分配:針對小且重要的層適當增加樣本數,提升調查的精度。
應用場景
- 政府人口普查、社會調查
- 市場調研和意見採集
- 醫學臨床研研究分層分析
簡言之,分層抽樣通過將總體劃分為層,確保各層均被充分代表,提高抽樣結果的準確性和可靠性,特別適合於異質性較大的人口或調查對象。