本文為閱讀Baker與Kim(2017)《The Basics of Item Response Theory using R》第三章之筆記,聚焦在試題特徵曲線(Item Characteristic Curve, ICC)之適配度。
ICC用於描述某一題目在不同能力水準下的正確機率。當中的試題參數(item parameter)可利用最大概似估計法進行估計。估計出試題參數之估計值後,我們可以利用卡方檢定去檢驗實際觀察之答題正確率與利用ICC所計算出之答題正確是否一致。

其中,G代表共有幾組;θ_g 表示第 g 組之能力值;f_g 表 第 g 組之人數;P(θ_g)表第 g 組通過ICC計算之答題正確率;p(θ_g) 表第 g 組觀察之答題正確率。
由於每組正確人數為R_g,其服從二項分配。

我們可以將其標準化近似標準常態分配,並透過標準常態分配隨機變數平方與卡方分配的關係,得到上述的式子。


從卡方值分子可看到,其是評估觀察值與理論值之差異。倘若大於臨界值(critical value)即代表此ICC適配度不佳,觀測之正確率與理論之正確率有顯著差異。其中,臨界值為χ^2(G - 模型參數數)。

模擬之三參數模型之卡方值與臨界值
參考資料:
Baker, F. B., & Kim, S. H. (2017). The Basics of Item Response Theory Using R (Vol. 10). New York: Springer.