付費限定

使用R語言跑多層次模型:估計法選擇和Random intercepts model

更新於 發佈於 閱讀時間約 11 分鐘

多層次模型中的 Random intercepts model with level-1 predictor 是層級 1 預測變量預測層級 1 結果變量的模型。本文將介紹該模型的一般方程式,並實際用R語言進行分析。最後介紹ML和REML估計法選擇。

公式

Random intercepts model with level-1 predictor 模型是一種具有隨機截距的多層次分析模型。假設第二層是學校,第一層是學生。Y是學生的數學成績,層級 1 預測變量為固定效果,代表層級 1 預測變量對結果變量的影響被限制為相同的固定值,不會隨著學校不同而不同;層級 1 截距(β0)為隨機效果,代表β0隨著學校不同而不同。數學公式可以表示如下:

Level 1:
層級 1 結果變量 = β0 + β1 * 層級 1 預測變量 + e
Level 2:
β0 = β00 + e00
β1 = β10

Combined:
層級 1 結果變量 = β00 + β10 * 層級 1 預測變量 + e00 + e​

其中:

  • β00 是層級 2截距,表示當層級 2 預測變量的斜率(β1 )為0時,所有群組的層級 1 結果變量的平均值。固定效果。
  • β1 是層級 1預測變項的斜率係數,表示層級 1 預測變量在層級 1 結果變量中每增加一個單位時的平均變化。固定效果。
  • e00 是層級 2截距的隨機效應,表示層級 2群組間截距的變異量。隨機效果。
  • e 是residual,層級 1變異量。隨機效果。
  • β10 是學校級斜率的總平均值。
  • e 是residual,層級 1變異量。
  • e 和e00 必須是不相關的才符合前提假設
  • e 和e00 必須是常態分配才符合前提假設
  • 如下圖,截距具有隨機效果就是認為截距會因為學校不同而有變化,所以每條線起點有差異。
raw-image


範例

# 載入相關套件
library(lme4)

lme4 套件提供了多層次分析的函數。

# 生成數據
set.seed(1234)

# 層級 1 結果變量
math_score <- rnorm(1000, mean = 50, sd = 10)

# 層級 1 預測變量
ses <- rnorm(1000, mean = 50, sd = 10)

# 學校ID
school_ID <- rnorm(100, mean = 50, sd = 10)

# 合併數據
df <- data.frame(math_score, ses, school_ID)

set.seed() 函數用於設定隨機數生成器的種子,以便可以重複生成相同的數據。rnorm() 函數用於生成常態分布的隨機數。以下是這三個變量的介紹:

層級 1 結果變量

  • 名稱:math_score
  • 描述:學生的數學成績
  • 層級:1
  • 值:從常態分佈中隨機抽取1000,平均值為 50,標準差為 10

層級 1 預測變量

  • 名稱:ses
  • 描述:學生的社會經濟地位
  • 層級:1
  • 值:從常態分佈中隨機抽取1000,平均值為 50,標準差為 10

學校 ID

  • 名稱:school_ID
  • 描述:學生所屬的學校
  • 層級:2
  • 值:從常態分佈中隨機抽取100,平均值為 50,標準差為 10

data.frame() 函數用於將數據合併到一個數據框中。數據內容如下:

    math_score      ses school_ID
1 37.92934 37.94667 40.26181
2 52.77429 53.01467 49.00369
3 60.84441 34.60855 48.89265
4 26.54302 56.35371 61.92195
5 54.29125 57.02952 33.44114
6 55.06056 30.94117 39.54357
7 44.25260 59.38921 32.59761
8 44.53368 47.75508 55.13121
9 44.35548 43.26183 45.54043
10 41.09962 54.45787 31.60806
11 45.22807 62.80617 41.80152
12 40.01614 65.65130 40.04790
13 42.23746 37.99454 52.97310
14 50.64459 45.62305 55.57416
15 59.59494 51.46381 37.26663
16 48.89715 50.66019 60.25073
17 44.88990 45.54964 54.66612
18 40.88805 26.57888 52.33918
19 41.62828 47.21618 52.64442
20 74.15835 38.18196 54.32420


# 跑模型
model <- lmer(math_score ~ ses + (1|school_ID), data = df)
  • lmer() 函數用於運行多層次線性混合效應模型。
  • 若不想使用REML估計法可以改用ML估計法:lmer(前面一樣..., REML = F)
  • math_score 是結果變量。ses 是預測變量。(1|school_ID) 表示模型包括一個隨機截距,採用school_ID
  • data = df 表示模型將在 df 數據中使用。
  • summary(model) 函數用於顯示模型的結果。
    以下是模型的結果:

Linear mixed model fit by REML. t-tests use Satterthwaite's method [
lmerModLmerTest]
Formula: math_score ~ ses + (1 | school_ID)
Data: df

REML criterion at convergence: 7439

Scaled residuals:
Min 1Q Median 3Q Max
-3.3188 -0.6397 -0.0229 0.6457 3.2576

Random effects:
Groups Name Variance Std.Dev.
school_ID (Intercept) 0.00 0.000
Residual 99.25 9.962
Number of obs: 1000, groups: school_ID, 100

Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
(Intercept) 46.84758 1.64136 998.00000 28.542 <2e-16 ***
ses 0.05756 0.03212 998.00000 1.792 0.0735 .
---
Signif. codes: 0***0.001**0.01*0.05.0.1 ‘ ’ 1

解釋

  • Formula 行顯示模型的公式。
  • Random effects:Residual = 99.25 = e = 殘差
  • Random effects:school_ID (Intercept) = 0.00 = e00 =截距的隨機效果,它表示每所學校的平均數學成績與總平均值之間的差異。
  • Fixed effects: (Intercept) = 46.84758 = β00 = 學校的數學總平均值
  • Fixed effects: ses = 0.05756 = β1 = β10 =社會經濟地位的斜率

結論

模型的結果表明,截距的隨機效果並不顯著,可以考慮將截距改為固定效果。社會經濟地位與數學成績之間為不顯著的正向關係。根據斜率表示,每增加一個單位的社會經濟地位,數學成績預計會增加 0.05756 個單位。但因為p值並未達到顯著水準,所以代表該斜率係數 = 0。


視覺化

以行動支持創作者!付費即可解鎖
本篇內容共 4576 字、0 則留言,僅發佈於統計分析 × 學術生涯你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
留言
avatar-img
留言分享你的想法!
avatar-img
教育心理博士的筆記本
244會員
139內容數
文章內容以圖像式和步驟化方式,教您如何在各種統計軟體中(例如:SPSS、R和Mplus),執行多種統計方法。此外,我還會分享一些學術和科技新知,幫助您在學術之路上走得更順利。
2025/04/15
Random Coefficients Model一種包含隨機截距和隨機斜率的多層線性模型 。它用於建模具有層次結構的數據。本文將介紹該模型之公式、R語言分析、視覺化。
Thumbnail
2025/04/15
Random Coefficients Model一種包含隨機截距和隨機斜率的多層線性模型 。它用於建模具有層次結構的數據。本文將介紹該模型之公式、R語言分析、視覺化。
Thumbnail
2025/03/14
多層次模型中的 Random intercepts model with level-2 predictor 是一種層級 2 預測變量預測層級 1 結果變量的模型。本文將介紹該模型的一般方程式,並實際用R語言進行分析並視覺化。
Thumbnail
2025/03/14
多層次模型中的 Random intercepts model with level-2 predictor 是一種層級 2 預測變量預測層級 1 結果變量的模型。本文將介紹該模型的一般方程式,並實際用R語言進行分析並視覺化。
Thumbnail
2025/01/14
本文介紹了 R 包中的 multilevLCA 進行多層次潛在類別模型的估計和繪圖的方法,該工具能有效分析多階層資料,進行分類誤差校正,以及半自動選擇出最佳組數。文中提供了實際操作的詳細步驟、報表及模型可視化。
Thumbnail
2025/01/14
本文介紹了 R 包中的 multilevLCA 進行多層次潛在類別模型的估計和繪圖的方法,該工具能有效分析多階層資料,進行分類誤差校正,以及半自動選擇出最佳組數。文中提供了實際操作的詳細步驟、報表及模型可視化。
Thumbnail
看更多
你可能也想看
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
Thumbnail
本文討論如何利用數據來判斷金融盤勢。重點關注非農就業指數(NFP)、採購經理人指數(PMI)、失業率、消費者物價指數(CPI)等相關重要數據,並提供相關數據公佈時間,以及例子操作模式。文章還著重於數據對交易者決策和交易策略的影響。
Thumbnail
本文討論如何利用數據來判斷金融盤勢。重點關注非農就業指數(NFP)、採購經理人指數(PMI)、失業率、消費者物價指數(CPI)等相關重要數據,並提供相關數據公佈時間,以及例子操作模式。文章還著重於數據對交易者決策和交易策略的影響。
Thumbnail
用多空趨勢線串聯股市金脈簡單來說內建一套投資邏輯,這套系統基於經濟學中的「適應性預期理論」發展而來,主要依賴過去的觀察和經驗來進行投資。這本書橫跨了產業面、基本面、技術面與籌碼面,我覺得下面的重點,你可以思考一下對你的投資有沒有幫助。
Thumbnail
用多空趨勢線串聯股市金脈簡單來說內建一套投資邏輯,這套系統基於經濟學中的「適應性預期理論」發展而來,主要依賴過去的觀察和經驗來進行投資。這本書橫跨了產業面、基本面、技術面與籌碼面,我覺得下面的重點,你可以思考一下對你的投資有沒有幫助。
Thumbnail
技術指標源自統計學原理,反映市場變化的概率分佈,而非預測工具。本文了解指標背後邏輯有利活學活用,甚至自行改良創新。
Thumbnail
技術指標源自統計學原理,反映市場變化的概率分佈,而非預測工具。本文了解指標背後邏輯有利活學活用,甚至自行改良創新。
Thumbnail
趨勢線1-2-3策略利用趨勢和轉折元素,通過線圖可視化關鍵點。可對策略做變換,藉此了解市場動能,並設置動態停損線。策略風險在於進場停損需確實,且可能因為提前出場而少賺。因對少賺風險,可以藉由一些停損點設置方式來改善績效。
Thumbnail
趨勢線1-2-3策略利用趨勢和轉折元素,通過線圖可視化關鍵點。可對策略做變換,藉此了解市場動能,並設置動態停損線。策略風險在於進場停損需確實,且可能因為提前出場而少賺。因對少賺風險,可以藉由一些停損點設置方式來改善績效。
Thumbnail
在上一篇中,我們在模型探討隨機截距交叉延宕在Extension 2中,可以使用的分類變量進行Multiple group分析。接下來,擴展 RI-CLPM 的另一種方法是為每個使用多個指標測量,本文將簡介兩種Multiple indicators模型。
Thumbnail
在上一篇中,我們在模型探討隨機截距交叉延宕在Extension 2中,可以使用的分類變量進行Multiple group分析。接下來,擴展 RI-CLPM 的另一種方法是為每個使用多個指標測量,本文將簡介兩種Multiple indicators模型。
Thumbnail
一般常見的時間架構分成三個:趨勢級別、分析級別、進場級別。 趨勢級別 週線 or 日線,目的是為了確認整體市場的方向,以及關鍵流動性區域(支撐、壓力位) 分析級別 4H or 1H,目的是確認市場當前方向、公允價值缺口、訂單塊、流動性區域、高期望值交易區域,需要花較多時間來分析。 進場級別
Thumbnail
一般常見的時間架構分成三個:趨勢級別、分析級別、進場級別。 趨勢級別 週線 or 日線,目的是為了確認整體市場的方向,以及關鍵流動性區域(支撐、壓力位) 分析級別 4H or 1H,目的是確認市場當前方向、公允價值缺口、訂單塊、流動性區域、高期望值交易區域,需要花較多時間來分析。 進場級別
Thumbnail
本文為技術分析進階,適合有技術分析基礎者閱讀,不建議未學過基礎技術分析者閱讀
Thumbnail
本文為技術分析進階,適合有技術分析基礎者閱讀,不建議未學過基礎技術分析者閱讀
Thumbnail
透過探討指數級增長、常態分布與冪律分布在選擇行業時的應用,強調了分析邊際成本和市場分布特性的重要性。作者挑戰傳統追隨者思維,提倡創新和尋找獨特優勢,並透過服務業例子展示如何應用這些底層邏輯進行前瞻性決策,幫助讀者識別增長機會,制定成功策略。
Thumbnail
透過探討指數級增長、常態分布與冪律分布在選擇行業時的應用,強調了分析邊際成本和市場分布特性的重要性。作者挑戰傳統追隨者思維,提倡創新和尋找獨特優勢,並透過服務業例子展示如何應用這些底層邏輯進行前瞻性決策,幫助讀者識別增長機會,制定成功策略。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News