更新於 2023/05/25閱讀時間約 1 分鐘

評量與測驗/信度與效度

台灣的考試制度引導教學。我們必須問考試的目的是什麼?但這個問題之前,又要區分評量(assessment)與測驗(testing)。台灣的大部分的考試既不是評量,也不是測驗,根本就是刁難。我記得大一微積分,教授讓我們10題考8小時,讓你有充裕的時間寫。台灣的考試是題數多、時間短、題意又不清。
效度(validity)又稱有效度(可自行查wiki)。愛因斯坦說:如果你用爬樹能力來斷定一條魚有多少才幹,牠整個人生都會相信自己愚蠢不堪。一語道盡測驗的本質。物理考卷真的能測出學生的物理程度嗎?我記得我以前可以為一道題目想一個晚上。我為了『物體在任意夾角θ的兩平面鏡之間會成幾個像?』花了至少五年的時間,而後發表於科學教育月刊。台灣物理段考的題目常常是考古題代代相傳,真的是為了傳承考試文化而考試。沒人在乎效度。物理分數與物理程度的相關係數是多少?台灣的教育制度,直接把物理分數與物理程度的相關係數,直接訂為1。 測驗的專家效度(Expert Validity)又是如何?台灣又直接把出題者,直接訂為專家,所以專家效度又是1。再舉了例子,在台灣有駕照跟敢開車上路是兩件事,效度我覺得只有0.5。敢上路跟開車有教養又是兩件事,相關係數=0。
信度(reliability)又稱可信度(可自行查wiki)。換言之,台灣不同老師對於『爬樹能力』的標準,並不一致,可憐的魚兒啊,每參加一次爬樹考試,成績可能還都不一樣。
教學是一項專業,測驗也是一項專業。我常問誰來評量大考中心?誰來測驗大考中心?台灣的考試,效度有多少?信度有多少?
分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.