驗證性因素分析簡介和Mplus操作

閱讀時間約 11 分鐘
驗證性因素分析(Confirmatory Factor Analysis, CFA)常被作為檢驗量表或測量工具之建構效度。做SEM前大多會要求每個工具的CFA結果。不僅如此,CFA也可能拿來檢驗測量衡等性的有效工具。本文將簡介驗證性因素分析概念,並介紹如何用MPLUS操作。
本文主要參考Mplus User’s Guide(Muthén & Muthén, 2017)
Muthén, L. K., & Muthén, B. O. (2017). Mplus User’s Guide (Eighth Edition). CA: Muthén & Muthén.

緒論

驗證性因素分析(Confirmatory Factor Analysis,CFA)是一種在社會科學中使用的統計方法,用於評估理論模型與現實收集到的數據集的擬合程度。 CFA的目的是測試模型中觀察指標與潛在變數(因素)間的關係,如下圖。我們根據理論或探索性因素分析,假設兩個因素,各有三題觀察變項,然後我們現實收集到的數據集。檢驗數據是否真的能匹配理論模型(兩個因素,各有三題觀察變項)。
f 是因素 y是觀察變項

驗證性因素分析(CFA)和探索性因素分析(EFA)之異同

驗證性因素分析(CFA)和探索性因素分析(EFA)有些相同和差異之處,兩者相同之處都做為檢驗建構效度的統計方法,並且都聚焦於觀察變項和因素(潛在購面)。但兩者差異之處在於:
  • 通常先做EFA,再用另一些樣本做CFA
  • EFA分析之前並不確定各個觀察變項和因素關係,但CFA分析之前就已經確定
  • CFA提供更多檢驗指標,用來檢驗模型的好壞
  • CFA並不鼓勵像EFA以數據驅動方式修正模型
  • CFA模型通常比EFA模型更加簡潔,通常在CFA中一個觀察變項只能和一個因素有關聯。

驗證性因素分析(CFA)之ML估計法假設:

  1. 觀察變項要是連續變項:問卷題目其實很難達到此要求,但只要選項有5個及以上就可以當作連續變項。若是類別變項,則違反此要求,改使用 WLSMV 估計法
  2. 多元常態分布:在實務中不容易做到,我們通常看每個觀察變項偏態為2.0,峰度為7.0以下就算符合標準。若違反需要使用MLM(無遺漏值)或MLR(可接受遺漏值和非獨立數據)估計法
  3. 數據之間獨立:在複雜研究中,變項之間獨立性可能受到威脅,可以考慮改用MLR(可接受遺漏值和非獨立數據)估計法
  4. 樣本數量:樣本數不可太低,通常會希望至少在200以上,模型越複雜要求的樣本數越多

語法操作

二因子且觀察變項為連續

TITLE:  CFA!你的檔案名稱 
DATA:  FILE IS ex5.1.dat; !你的資料檔
VARIABLE:  NAMES ARE y1-y6; !資料檔變項左到右命名為y1-y6
ANALYSIS: ESTIMATOR = ML; !選擇估計方法,可根據資料型態改估計法
MODEL:  
f1 BY y1-y3; !F1因素和Y1-Y3觀察變項有關聯
f2 BY y4-y6; !F2因素和Y4-Y6觀察變項有關聯
OUTPUT: MOD!要求輸出修正指標 
    STDYX;!要求給出標準化係數
  • !後面代表附註,給人看的,程式會跳過後面的話。程式就知道你的理論模型長下面這樣。
  • 在Mplus 中Output設定為STDYX: 會把觀察變項轉換成z分數,潛在變項的變異量設為1.0來估計參數。
  • 若你有遺漏值Mplus會自動採用FIML missing data estimation處理。無論遺漏值是連續或類別。

三因子且觀察變項為連續

TITLE:  CFA!你的檔案名稱
DATA: FILE IS ex5.1.dat; !你的資料檔
VARIABLE: NAMES ARE y1-y6; !資料檔變項左到右命名為y1-y6
ANALYSIS: ESTIMATOR = ML; !選擇估計方法,可根據資料型態改估計法
MODEL:
f1 BY y1-y2;
f2 BY y3-y4;
f3 BY y5-y6; 
OUTPUT: MOD!要求輸出修正指標
STDYX;!要求給出標準化係數
二因子且觀察變項為類別
若觀察變項為名義/二元/順序變量就要用下面語法。其他都上面一樣,估計方法會自動改為WLSMV 估計法。
VARIABLE:  NAMES ARE u1-u6; 
  CATEGORICAL ARE u1-u6;!指定類別變項 
MODEL:  f1 BY u1-u3; 
  f2 BY u4-u6; 
二因子且觀察變項為類別和連續
此類分析的默認估計是WLSMV。
VARIABLE:  NAMES ARE u1-u3 y4-y6; 
  CATEGORICAL ARE u1 u2 u3; 
MODEL:  f1 BY u1-u3; 
  f2 BY y4-y6; 

報表解讀

UNIVARIATE SAMPLE STATISTICS

報表出來後,先看UNIVARIATE SAMPLE STATISTICS,螢光標記就是看你每個變項是否常態分布,我們通常看每個觀察變項偏態為2.0,峰度為7.0以下就算符合標準。若違反需要使用MLM(無遺漏值)或MLR(可接受遺漏值和非獨立數據)估計法

MODEL FIT INFORMATION

得到MODEL FIT INFORMATION後,重要結果如螢光處所示
RMSEA可以提供90信賴區間,見紅色括弧處。
要如何檢驗模型好壞呢?經驗法則為RMSEA和SRMR<.08,CFI和TLI>.95。若要引用專家意見的話,Hair(2009)的專家意見常被接受,其判斷指標如下圖:
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2009). Multivariate Data Analysis (7 edition). Pearson.
此外我想要另外提一下,Chi-square (X2) 卡方統計量:其是最常見的指標,它是衡量觀察和估差covariance matrix之間差異的基本標準,若其顯著性<.05,代表我們觀察和估差covariance matrix之間差異具有統計顯著性,公式如下:
Chi-square (X2) = (N - 1) (Observed sample covariance matrix - CFA estimated covariance matrix)
公式可以得知,N 是總體樣本量。 需要注意的是,即使covariance matrix的差異保持不變,X2 值隨著樣本量的增加而增加。考慮到Chi-square (X2)對樣本數的敏感性,所以Chi-square (X2)在實際研究中,雖然參考,但仍會計算其它指標幫助我們了解模型的好壞。

模型修正

若模型不達標準時,可以檢視報表中的MI值列表,MI值越高代表該變項嚴重影響模型,表示讓它自由估計後改進的適配度愈大,所以可以先從MI最大的參數修訂可以考慮刪除,或是將變項殘差有相關(with)。一次只刪一個變項/連一次相關,接著再跑一次SEM,但建議除了考慮MI值,也要有理論可解釋性。但其實CFA並不鼓勵像像EFA以數據驅動方式修正模型,因為CFA是建立在理論基礎之上。
這裡我們採用變項殘差有相關(with)修正策略,我們看D10 跟D6的MI值非常高,我們就可以選擇將兩者變項殘差連上相關(with),但最好要能解釋兩者的關聯性。D10 跟D6變項殘差連上相關的CFA如下:
TITLE:  CFA!你的檔案名稱
DATA: FILE IS ex5.1.dat; !你的資料檔
VARIABLE: NAMES ARE d1-d10; !資料檔變項左到右命名為d1-d10
ANALYSIS: ESTIMATOR = ML; !選擇估計方法,可根據資料型態改估計法
MODEL:
f1 BY d1-d5;
f2 BY d6-d10;
d10 with d6;!D10 跟D6變項殘差連上相關
OUTPUT: MOD!要求輸出修正指標
    STDYX;!要求給出標準化係數,
若模型不達標準時,可以再次檢視報表中的MI值列表,若多次修改模型都無法達標,可能代表你的觀察到的模型和理論模型非常不匹配,可能要改用EFA檢查。

MODEL RESULTS

當模型符合標準時,代表模型是有意義的,就可以進一步看MODEL RESULTS。下圖為非標準化係數,STDYX Standardization開頭的就是標準化係數。圖中Estimate就是各個因素的factor loading,factor loading越高代表題目和因素關聯越高。但 P-Value要小於.05,factor loading才有統計意義。WITH是代表關聯程度,從下圖可得知F1和F2的共變量為0.588,且P-Value小於.05。因為CFA在每個因子中都要指定測量單位,所以軟體自動將每個因子第一題的因素負荷量設定成1,才可以識別模型。標準化參數(如λ)可以互相比較大小,看看哪個題目對因素的貢獻大

CR和AVE

Composite Reliability(CR)

這是研究人員在CFA中衡量項目內部一致性的另一種方式。建議CR至少為 0.70。高CR表明所有項目都在不斷地測量相同的因素購念。指標(題目)分享該因素的程度,屬內部一致性;此信度高表示題目間高關連,必須為每個因素計算 CR。

Average Variance Extracted (AVE)

當研究者有興趣知道,平均而言,他的題目有多少變異量可以被因素所解釋。作為經驗法則,強烈建議AVE 至少為 0.50 。也就是說,AVE 小於 0.50 意味著您的項目解釋的誤差多於因素變異量。對於任何測量模型,必須為每個因素計算 AVE。
例如:在A因素由四個項目來測量,這些項目的AVE為0.658,這意味著,平均來說,A因素的變異量有65.8%被這四個項目所解釋。另一方面,我們記得我們的測量項目有34.2%的誤差。

自動計算

該網站提供一個非常有用excel 文件可以自動計算AVE和CR。每個因素會計算出一個AVE和CR。所以你根據你因素擁有幾個觀察變項,選擇對應的excel分頁,貼上你的標準化factor loading,就可以算出結果。
例如:我要計算一個因素具有3題目,我選擇3分頁(下圖紅色1),貼上標準化factor loading(下圖螢光處),我就可以得知AVE和CR
您的研究遇到了統計分析的困難嗎?您需要專業的統計諮詢和代跑服務嗎?請點我看提供的服務
avatar-img
221會員
122內容數
文章內容以圖像式和步驟化方式,教您如何在各種統計軟體中(例如:SPSS、R和Mplus),執行多種統計方法。此外,我還會分享一些學術和科技新知,幫助您在學術之路上走得更順利。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
心理博士的筆記本 的其他內容
如同跨組比較一樣,跨時間時也需要考量縱向測量衡等性,在分析縱向數據時考慮 測量衡等性 很重要,因為不具有縱向測量衡等性的量表,對結果的有效性和正確性有所影響。縱向衡等性和多群組衡等性的分析策略相似,但在參數設定有些差異,本文將簡介其概念和和Mplus操作。
題目打包法(Item Parceling)是一種統計學方法,主要用於結構方程模式(SEM)中。打包法的基本思想是將多個觀察指標打包成一個新指標,以提高模型的擬合程度。打包法有很多優點,如提高模型的擬合程度和要求樣本數減少。但也有缺點,如不適合測量模型分析。本文將簡介題目打包法之策略。
本篇介紹Mplus的「結構方程模型(Structural Equation Modelling, SEM)」之語法內容,並透過例題向大家示範如何分析撰寫SEM的語法。本文為新手教學,輸入方式可能不是最有效率,但是比較簡單且不太會犯錯
如同跨組比較一樣,跨時間時也需要考量縱向測量衡等性,在分析縱向數據時考慮 測量衡等性 很重要,因為不具有縱向測量衡等性的量表,對結果的有效性和正確性有所影響。縱向衡等性和多群組衡等性的分析策略相似,但在參數設定有些差異,本文將簡介其概念和和Mplus操作。
題目打包法(Item Parceling)是一種統計學方法,主要用於結構方程模式(SEM)中。打包法的基本思想是將多個觀察指標打包成一個新指標,以提高模型的擬合程度。打包法有很多優點,如提高模型的擬合程度和要求樣本數減少。但也有缺點,如不適合測量模型分析。本文將簡介題目打包法之策略。
本篇介紹Mplus的「結構方程模型(Structural Equation Modelling, SEM)」之語法內容,並透過例題向大家示範如何分析撰寫SEM的語法。本文為新手教學,輸入方式可能不是最有效率,但是比較簡單且不太會犯錯
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
我們做實驗的目的, 往往是想要量化「確定的不確定性 Certain Uncertainty」。 什麼是「不確定性 Uncertainty」? 其實就是無法透過控制各種變因來控制下來的現象。 在做實驗的時候, 就算你已經把實驗條件盡量控制一樣了, 其實實驗的結果每次還是會有一些差異。
Thumbnail
這篇文章分享了作者在參與預估專案時的思考脈絡和學習點,透過兩個具體的案例,探討了預估方法中重要的假設和挑戰。
Thumbnail
技術指標源自統計學原理,反映市場變化的概率分佈,而非預測工具。本文了解指標背後邏輯有利活學活用,甚至自行改良創新。
Thumbnail
積聚/派送,資金流量指標,衡成交量指標和交易量是用於協助技術分析師評估股票或其他金融資產的市場走勢和價格動向的重要工具。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
在麥肯錫的邏輯裡,分析力是解決問題中最重要的因素,要正確分析問題,才有辦法從根本處置和防止復發。
Thumbnail
交易回測是執行各種交易重要一環,這裡主要採用自行開發的Excel回測工具進行歷史資料模擬各種市場情境,包括事件觸發、MSIC季度調整、聯準會升降息以及技術籌碼面的變化。透過反覆的回測過程,可以深入瞭解各種情況下的交易策略執行情況,並逐步優化其交易策略。這有助於建立交易的紀律性,
Thumbnail
我們常把研究分成量化與質性兩種不同的方法(當然不止這兩種方法),其中量化分析主要在討論變數與變數的關係,而質性分析則在變數間在的互動過程與事件。因此通常在進行質性研究時,我們需要收集大量田野調查或訪談資料。做過訪談的人都知道,訪談後需要反覆的聆聽訪談錄音並將其轉化為訪談逐字稿,這是一個大工程,還好現
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
我們做實驗的目的, 往往是想要量化「確定的不確定性 Certain Uncertainty」。 什麼是「不確定性 Uncertainty」? 其實就是無法透過控制各種變因來控制下來的現象。 在做實驗的時候, 就算你已經把實驗條件盡量控制一樣了, 其實實驗的結果每次還是會有一些差異。
Thumbnail
這篇文章分享了作者在參與預估專案時的思考脈絡和學習點,透過兩個具體的案例,探討了預估方法中重要的假設和挑戰。
Thumbnail
技術指標源自統計學原理,反映市場變化的概率分佈,而非預測工具。本文了解指標背後邏輯有利活學活用,甚至自行改良創新。
Thumbnail
積聚/派送,資金流量指標,衡成交量指標和交易量是用於協助技術分析師評估股票或其他金融資產的市場走勢和價格動向的重要工具。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
在麥肯錫的邏輯裡,分析力是解決問題中最重要的因素,要正確分析問題,才有辦法從根本處置和防止復發。
Thumbnail
交易回測是執行各種交易重要一環,這裡主要採用自行開發的Excel回測工具進行歷史資料模擬各種市場情境,包括事件觸發、MSIC季度調整、聯準會升降息以及技術籌碼面的變化。透過反覆的回測過程,可以深入瞭解各種情況下的交易策略執行情況,並逐步優化其交易策略。這有助於建立交易的紀律性,
Thumbnail
我們常把研究分成量化與質性兩種不同的方法(當然不止這兩種方法),其中量化分析主要在討論變數與變數的關係,而質性分析則在變數間在的互動過程與事件。因此通常在進行質性研究時,我們需要收集大量田野調查或訪談資料。做過訪談的人都知道,訪談後需要反覆的聆聽訪談錄音並將其轉化為訪談逐字稿,這是一個大工程,還好現