[ 閱讀小札 ] 教育測驗與評量—教室學習觀點

閱讀時間約 8 分鐘

修讀教育學程和實施藝術教學的過程中,我發現「評量」這個環節總是有許多的困難,需要教學者不斷的思考、調整。在評量或測驗學生學習成果時,往往會以成果去做評估的基準,但是每位學生所適合的評量方式卻不盡相同,未必每位學生、每種科目都適合使用固定一種的評量標準。

在評量的環節裡,包含了兩個重大面向:信度和效度。不過在一開始的時候,我常常搞不清楚應該如何分辨哪些算是信度,哪些算是效度?這學期修了多元學習與評量的課程,授課老師推薦了這本書作為參考,閱讀後我發現它將內容做了詳細的整理,對於區分信度和效度的類型、細項很有幫助。

相信日後遇到需要檢測辦學效果的情形時,讀者都能仰賴自本書獲得的經驗值,藉由有系統、周延、效率的蒐集學生多方面的資料,以客觀分析來形成結論。



教育測驗與評量 : 教室學習觀點 (第2 版)

作者:王文中

出版社:五南圖書出版股份有限公司

出版日期:2004年9月


部分重點整理:


■ 要想檢測辦學效果,需要仰賴測驗與評量,其中必須有系統、周延、效率的蒐集學生多方面的資料,客觀分析以形成結論。

■ 測驗與評量時,需分為信度和效度

■ 測量分為直接測量(可直接觀察到的自然界特質)和間接測量(無法直接觀察到的心理特質或能力)

■ 信度的意義

→測量結果的可重複性(穩定性、一致性)程度

→不同人、不同時間測量的結果是否相同

→古典測驗理論(Classical Test Theory)

→真分數理論(True Score Theory) X=T+E 

X:observed score 觀察分數 

  T:true score 真分數

E:error 誤差

■ 測量一定會包含誤差

→測量誤差:會影響測驗分數的無關因素

       *評量所得結果和「真分數(true score)」間的差距

■ 誤差的種類:

→系統誤差systematic errors:偏離真值的現象在每次測量均會發生

→隨機誤差unsystematic errors:偏離真值的現象隨機產生,其出現的機率不可預測

■ 信度的特性:

信度在測量領域的意義,等於一致性;測量結果不受測量誤差影響的程度

信度並非「全有或全無」,而是程度的問題

信度是估計的

信度係數的定義

真分數變異量與觀察分數變異量之間的比值

■ 估計信度的方法:

➢ 再測信度:

  test-retest reliability,又稱穩定係數

在不同的時間,重複實施同一評量工具 

同一群受測者兩次施測所得分數間的相關

  目標在評估評量結果能類化到不同時間點的程度

誤差來源主要來自施測時間點的差異

➢ 複本信度:

equivalent-forms

估計複本信度須用兩個不同題本但內容等同的評量工具

在不同的時間,實施不同形式但內容相當的兩個評量工具

同一群受測者兩次施測所得分數間的相關

誤差來源為內容取樣誤差(content sampling):

因為題目選擇的隨機因素所造成的分數變異

➢ 內部一致性信度:

internal-consistency

受測者在同一測驗中的各評量試題上的表現一致的程度

同一群受測者一次施測所得分數間的相關

內部一致性信度的大小反映的是內容取樣的誤差,及題目的同質性程度

折半信度

Cronbach’salpha係數

內部一致性係數的特質與限制

不能用來估計速度測驗的信度

折半法無法得到單一的信度估計值

若某特質包含的次向度之間的相關性並不高,則Cronbach’s alpha係數會降低,

但不表示其信度低(如:生活品質可分為人際關係、居住品質…) 

→domain heterogeneity異質性

➢ 評分者間信度:

評分者信度即在估計不同評分者,對同一表現評分的一致性程度

相關係數:

著重不同評分者對於受評量者表現的排序是否相同

符合度(agreement):

重視不同評分者所給的絕對分數是否相同,能夠反映評分者給分嚴苛程度的一致性

符合度、Kappa係數

■ 效度的意義

→測驗是否測量到當初界定特質的程度

→從測驗分數推論出來的結論是否合適、有意義、有用

→是否與社會脈絡結合

■ 效度的性質

效度是一個整體的概念,包含各種形式的證據

效度是一個永遠在發展的連續過程→有效化歷程(validation)

效度並非全有或全無的狀態,而是程度上的問題

信度與效度的關係

■ 效度證據的來源

➢ 與內容有關聯的(content-related)效度

→測驗題目是否能代表欲測量的行為(內容)範疇

    效度證據:判斷方式(專家評估/雙向細目表)

內容證據的限制:

測驗題目在「內容」上具有代表性,但受評者在深度上不瞭解題意,可能導致題目

無法反映其能力/考試技巧的影響

表面效度:face validity,題目看起來是否符合測驗目的,影響受測者的作答意願

➢ 與效標有關聯的(criterion-related)效度→測驗表現與另一效標的關係程度

意義:指編製測驗結果(英文學習成績)與效標(英語學習能力)間的關係分為:

- 同時效度(concurrent validity):測驗與效標同時收集

- 預測效度(predictive validity):測驗與效標前後收集預測

計算方式:測驗與效標間的相關係數

僅從一個相關係數無法充分解釋效度

選取效標關聯證據的注意事項

→要確立效標本身的合適性和有效性(信效度),才能討論測驗工具所

  評量出的結果可推論至意圖要測的能力或特質

→不能有效標汙染(criterion contamination),例如:筆試、口試

→留意全距限制(restriction of range)

➢ 與建構有關聯的(construct-related)效度→測驗是否真的測得該特質

(範圍最廣的效度,可包含前兩項)

意義:

→測驗能夠測量到理論上的構念或特質的程度

→根據心理學或社會學中描述某種特質的理論,就測驗分數所代表的意義進行的分析和解釋

→任何效度證據,包括內容證據、效標關聯證據等都只是建構效度的部分證據

→當理論模糊未顯時,建構效度更顯重要,因為它是測驗所得結果的意義及詮釋的基礎

一個喜歡藝文、爬蟲並且努力生活的人♡
留言0
查看全部
發表第一個留言支持創作者!
「我們生活在一個逐漸被視覺文化滲透的世界」,現在隨著科技的日新月異,廣告媒體早已經從報章雜誌轉型到電視媒體,甚至是掌上媒介;過去需要栽培、訓練許久的演藝人員也隨著自媒體的興起被模糊了界線。視覺影像大量充斥在你我的眼球之中,就彷彿所見之處皆媒體、處處皆影像,正因四處皆影像,才更該學習如何觀看。
一本為「把讀書的主要目的當作是增進理解能力」的人而寫的書。
實際參與田野調查,能拓展學者的知識視野,讓我們深入了解不同文化、習俗和價值觀,這樣的跨領域學習方式可謂豐富的知識庫。我想,藝術教育與田野調查的結合能促進藝術與社會現實面的深度互動及對話,這種結合所培育出的藝術人才更具有創造力以及社會責任感,同時也能推動藝術在社會中的發展和影響力。
世上萬物的感情都是相通的,即使是原本相互厭惡的生命體,經歷了時間的洗練,一同經歷了人生的低潮,在這之中互相扶持,也會變成彼此生命中不可或缺的存在。
從十六歲到二十六歲,他們都曾有過最溫柔的歸處,彼此守候。然而時間的巨輪無情輾殺所有美善,各自零散,宣告了青春的畢業。「我們畢業了」,這是一句殘酷的話,可是每個人都必須要說。那些光陰的故事,全被折進了書頁的某個章節。 流年未亡,夏日已盡……
談到藝術,除了豐富的藝術風格和各種精彩的表現方式之外,作品背後關於精神分析的探討可以說是層出不窮,更可以說是一門大哉問,總是有探討不完、延伸不完的議題和內容能夠研究。 本書收錄了多篇精彩的精神分析相關文章,從大家耳熟能詳的佛洛依德,到當代藝術圈幾乎無人不知無人不曉的草間彌生,這裡面都有收錄其中!
「我們生活在一個逐漸被視覺文化滲透的世界」,現在隨著科技的日新月異,廣告媒體早已經從報章雜誌轉型到電視媒體,甚至是掌上媒介;過去需要栽培、訓練許久的演藝人員也隨著自媒體的興起被模糊了界線。視覺影像大量充斥在你我的眼球之中,就彷彿所見之處皆媒體、處處皆影像,正因四處皆影像,才更該學習如何觀看。
一本為「把讀書的主要目的當作是增進理解能力」的人而寫的書。
實際參與田野調查,能拓展學者的知識視野,讓我們深入了解不同文化、習俗和價值觀,這樣的跨領域學習方式可謂豐富的知識庫。我想,藝術教育與田野調查的結合能促進藝術與社會現實面的深度互動及對話,這種結合所培育出的藝術人才更具有創造力以及社會責任感,同時也能推動藝術在社會中的發展和影響力。
世上萬物的感情都是相通的,即使是原本相互厭惡的生命體,經歷了時間的洗練,一同經歷了人生的低潮,在這之中互相扶持,也會變成彼此生命中不可或缺的存在。
從十六歲到二十六歲,他們都曾有過最溫柔的歸處,彼此守候。然而時間的巨輪無情輾殺所有美善,各自零散,宣告了青春的畢業。「我們畢業了」,這是一句殘酷的話,可是每個人都必須要說。那些光陰的故事,全被折進了書頁的某個章節。 流年未亡,夏日已盡……
談到藝術,除了豐富的藝術風格和各種精彩的表現方式之外,作品背後關於精神分析的探討可以說是層出不窮,更可以說是一門大哉問,總是有探討不完、延伸不完的議題和內容能夠研究。 本書收錄了多篇精彩的精神分析相關文章,從大家耳熟能詳的佛洛依德,到當代藝術圈幾乎無人不知無人不曉的草間彌生,這裡面都有收錄其中!
本篇參與的主題策展
這篇文章探討了筆記的重要性和有效的筆記技巧,作者分享了自身在筆記方面的困惑及挑戰,並強調了筆記不僅是記錄,更是思考的過程。藉由介紹書中提到的改善方法,本文指出每個人的學習需求不同,筆記應該融入個人思考與反思,讓資訊的管理變得更有系統,最後給予讀者重新面對筆記能力的啟發與方法。
人與人之間的關係,像是一場舞蹈。每個人都在各自的人生舞台上起舞,時而靠近,時而退遠。有人選擇緊拉對方的手,生怕一鬆手就會失去;有人則選擇放開,讓彼此在自由中翩翩共舞。隨著歲月的沉澱,我漸漸明白,人生最美的關係,不是抓住,而是「沒關係」。 「沒關係」並非冷漠或疏離,而是一種智慧——在情感與理智中
寫信給聖誕老公公是一項充滿魔力的傳統,特別對小朋友而言更是一種期待的體驗。本文提供了撰寫精彩聖誕信的指南,包括開頭問候、表達感謝、分享願望及描述表現等。此外,還附上2024年各國聖誕老人的郵寄地址及建議的寄出時間,確保你不會錯過這神奇的節日時刻。讓我們一起動手寫下願望,期待來自北極的回信!
本文探討了汪志謙老師的《峰值體驗》對於品牌經營的啟示,並通過《黑白大廚-料理階級大戰》中崔鉉碩主廚的經營策略,分析如何透過精準的目標客群選擇、滿足消費者好奇心、展現餐廳魅力及快速反應來吸引顧客。透過策略,崔主廚不僅實現了盈利,還成功吸引了觀眾的注意,最終在激烈競爭中取得勝利。
這篇文章探討了筆記的重要性和有效的筆記技巧,作者分享了自身在筆記方面的困惑及挑戰,並強調了筆記不僅是記錄,更是思考的過程。藉由介紹書中提到的改善方法,本文指出每個人的學習需求不同,筆記應該融入個人思考與反思,讓資訊的管理變得更有系統,最後給予讀者重新面對筆記能力的啟發與方法。
人與人之間的關係,像是一場舞蹈。每個人都在各自的人生舞台上起舞,時而靠近,時而退遠。有人選擇緊拉對方的手,生怕一鬆手就會失去;有人則選擇放開,讓彼此在自由中翩翩共舞。隨著歲月的沉澱,我漸漸明白,人生最美的關係,不是抓住,而是「沒關係」。 「沒關係」並非冷漠或疏離,而是一種智慧——在情感與理智中
寫信給聖誕老公公是一項充滿魔力的傳統,特別對小朋友而言更是一種期待的體驗。本文提供了撰寫精彩聖誕信的指南,包括開頭問候、表達感謝、分享願望及描述表現等。此外,還附上2024年各國聖誕老人的郵寄地址及建議的寄出時間,確保你不會錯過這神奇的節日時刻。讓我們一起動手寫下願望,期待來自北極的回信!
本文探討了汪志謙老師的《峰值體驗》對於品牌經營的啟示,並通過《黑白大廚-料理階級大戰》中崔鉉碩主廚的經營策略,分析如何透過精準的目標客群選擇、滿足消費者好奇心、展現餐廳魅力及快速反應來吸引顧客。透過策略,崔主廚不僅實現了盈利,還成功吸引了觀眾的注意,最終在激烈競爭中取得勝利。
你可能也想看
Google News 追蹤
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
考教甄是一條漫漫長路,有些人很幸運也很有實力的應屆上岸,但也有些人在教學上有不錯的實力,可是在讀書方面可能沒那麼擅長,導致屢屢挫敗在教甄的筆試上,想藉由分享我自己當時準備教甄時的讀書規劃,希望能給予尚未上岸的老師們一些幫助。
每個人的讀書方式、規劃不同,希望藉由提供我自己準備教檢時的讀書計畫,來幫助準備考教檢的考生規畫出屬於自己的讀書計畫,讓考生們能順利通關。 上次有發了一篇「我是準教檢生,如何著手準備?」,內容主要在講述準教檢生在現在這個暑假可以先做哪些準備,那做完了那些準備後......
Thumbnail
最近孩子因為升上五年級,很多科目學的內容比較難了,原先不怎麼唸書也能拿到90多分的他,現在有些小考變成7、80分 其實我對於成績的「數字」沒什麼太大的感覺,我經常跟孩子說的是「每一次考試其實就是一次健康檢查,而每天寫作業跟唸書的方法就像是我們平日運動跟飲食的生活方式」
課後問卷調查對於企業講師和主辦單位具有多方面的重要性。 以下是幾個關鍵點,說明課後問卷調查的重要性: 1. 評估教學效果 收集學員反饋: 課後問卷調查能夠直接收集學員對於課程內容、講師表現以及教學方法的反饋。 通過這些反饋,講師可以了解學員對於課程的滿意度,判斷教學目標是否達成。 評估學
Thumbnail
教書也有20多年了,只能說,學生永遠都在測試老師的底線。而我的底線是什麼呢?
Thumbnail
上禮拜發表的生活紀錄,提到孩子剛入學,因為注音符號不熟,分數低落,這樣子看下來,似乎顯得我不太重視考試成績,成績真的不重要嗎?
Thumbnail
1.前言: 15分鐘,只有白色粉筆和板擦,要讓看了4~20個試教老師的評審委員,給你試教的最高分,的確不是一件簡單的事情。 但是,我常說:"報名都是自己去報的,不要沒考上就要說人家有內定,這樣太沒風度,輸不起。" 又說:"自己要是有機會,看整場試教的影片,會有很大的機率,也會這樣子給分"。
Thumbnail
比賽過程中,評審聽不懂意味著他們不太知道怎麼評分......
Thumbnail
瞭解如何透過系統化教學計劃、課前問卷調查、明確學習目標、互動和參與、應用和實踐、評估和反饋、以及學員反饋來確保教學的有效性和結構。
Thumbnail
一般在校的學習成果, 小考啊、段考啊什麼的, 家長與老師會較集中火力擔心「那些考不好的學生們」---怎麼成績一直上不去呢? 但是, 在模擬考啊、學測啊的時候, 段考時擔心低分群考太低,模考時, 家長與老師就又會改為較集中火力擔心「那些排名前面的學生們」---怎麼成績不能再更上去呢?。
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
考教甄是一條漫漫長路,有些人很幸運也很有實力的應屆上岸,但也有些人在教學上有不錯的實力,可是在讀書方面可能沒那麼擅長,導致屢屢挫敗在教甄的筆試上,想藉由分享我自己當時準備教甄時的讀書規劃,希望能給予尚未上岸的老師們一些幫助。
每個人的讀書方式、規劃不同,希望藉由提供我自己準備教檢時的讀書計畫,來幫助準備考教檢的考生規畫出屬於自己的讀書計畫,讓考生們能順利通關。 上次有發了一篇「我是準教檢生,如何著手準備?」,內容主要在講述準教檢生在現在這個暑假可以先做哪些準備,那做完了那些準備後......
Thumbnail
最近孩子因為升上五年級,很多科目學的內容比較難了,原先不怎麼唸書也能拿到90多分的他,現在有些小考變成7、80分 其實我對於成績的「數字」沒什麼太大的感覺,我經常跟孩子說的是「每一次考試其實就是一次健康檢查,而每天寫作業跟唸書的方法就像是我們平日運動跟飲食的生活方式」
課後問卷調查對於企業講師和主辦單位具有多方面的重要性。 以下是幾個關鍵點,說明課後問卷調查的重要性: 1. 評估教學效果 收集學員反饋: 課後問卷調查能夠直接收集學員對於課程內容、講師表現以及教學方法的反饋。 通過這些反饋,講師可以了解學員對於課程的滿意度,判斷教學目標是否達成。 評估學
Thumbnail
教書也有20多年了,只能說,學生永遠都在測試老師的底線。而我的底線是什麼呢?
Thumbnail
上禮拜發表的生活紀錄,提到孩子剛入學,因為注音符號不熟,分數低落,這樣子看下來,似乎顯得我不太重視考試成績,成績真的不重要嗎?
Thumbnail
1.前言: 15分鐘,只有白色粉筆和板擦,要讓看了4~20個試教老師的評審委員,給你試教的最高分,的確不是一件簡單的事情。 但是,我常說:"報名都是自己去報的,不要沒考上就要說人家有內定,這樣太沒風度,輸不起。" 又說:"自己要是有機會,看整場試教的影片,會有很大的機率,也會這樣子給分"。
Thumbnail
比賽過程中,評審聽不懂意味著他們不太知道怎麼評分......
Thumbnail
瞭解如何透過系統化教學計劃、課前問卷調查、明確學習目標、互動和參與、應用和實踐、評估和反饋、以及學員反饋來確保教學的有效性和結構。
Thumbnail
一般在校的學習成果, 小考啊、段考啊什麼的, 家長與老師會較集中火力擔心「那些考不好的學生們」---怎麼成績一直上不去呢? 但是, 在模擬考啊、學測啊的時候, 段考時擔心低分群考太低,模考時, 家長與老師就又會改為較集中火力擔心「那些排名前面的學生們」---怎麼成績不能再更上去呢?。