階層線性模式(MLM) 或是多層次模式(HLM)可以說是當代社會科學研究重要的統計方法學。現實中,我們收集到的資料可能巢套在不同層層次的單位當中。這種巢套關係很容易違反資料獨立性的假設導致許多傳統統計方法無法使用,本文將從簡單的公式說明多層次資料的問題,並介紹HLM的概念。
階層線性模式 (Hierarchical Linear Model, HLM)或是多層次模式(Multilevel Model, MLM)是用於分析具有分層或嵌套結構的數據的統計模型。 這些模型被廣泛應用於社會科學、教育研究和其他領域,以分析複雜的數據結構,並在不同的分析層次上洞察變量之間的關係。
例如:某研究透過分層隨機抽樣選擇研究對象,該研究先隨機抽取縣市,再隨機抽取學校。然後針對這些學校的學生進行問卷蒐集。
上述研究範例是不是聽起來相當常見,範例中的學生是隸屬於學校,而學校又是巢套於縣市,這樣的巢套(nested)關係,導致許多傳統統計方法針對資料獨立性的假設被違反,因為同學校或縣市的學生,可能在回答尚有一些相似之處,這些相似之處並非來自研究變項,而是因為巢套(nested)關係造成的。而這樣的資料結構也違反傳統統計方法所假設的獨立性,忽視這樣的資料階層結構的特性,使得研究結果正確性降低。階層線性模式 (Hierarchical Linear Model, HLM)或是多層次模式(Multilevel Model, MLM)即考慮到這樣的資料特性,以確保統計分析結果的正確性。
多層次資料的問題
我們用簡單的公式來說明,假設一個多元迴歸方程式如下表示,每個受試者都是互相獨立的話,那大家之間的誤差(e)就會互相獨立,彼此誤差相關=0,這就是OLS regression 獨立假設。如果同一群體的個體有相似性呢,特別是這個相似性和自變項無關,例如:來自同個學校,彼此誤差可能就有關聯,這樣 OLS regression 獨立假設將被違反,結果將是有偏誤的。
y i = β 0 + β 1 x 1i + β 2 x 2i … + e
如下示意圖,在多層次資料中,獨立假設將被違反,雖然多元迴歸仍能跑出一條整體的線性關係(紅色),但若以多層次資料中不同群體,進行多元迴歸並也跑出一條線性關係(藍色),可能會跟紅色差異不小。
若從概念來說的話。以心理學來說,人並非是獨立的個體,而是群體中的一員,