方格精選

【數據會說話】111年學測考生家長看過來:這週我們談學測改制。

閱讀時間約 12 分鐘
前幾日,111學年的學測成績出爐,五標、各科累積人數也跟著一起公布。公布之後,數學A、數學B由於第一年實施,國文題目也多有變革,甚至有人調侃「在數學考卷上看到的白話文比在國文考卷上看到的還要多」,因此媒體紛紛報導大家考得不好、考生信心崩盤等等。這是真的嗎?以下讓我們來檢驗看看。
然而,在此先呼籲:
知道自己考得好或不好,不代表自己真的優秀或差勁,只是表示自己的實力在這份題目面前展現得如何。
上列的心理建設是相當重要的。
請各位家長、考生與老師務必記得:考試只是一時的、片面的,只是大考中心為了服務升學體系的方便且兼顧公平性,盡可能出了一份「可能有鑑別度」的卷子來考驗考生。任何一場單一的考試都無法成為一個學生「德、智、體、群、美」的全方位檢測,因此請盡量不要用成績苛責人我。考得好固然可喜,可以討論接下來的申請大學策略;考得不好也無妨,還有很多事情可以繼續努力。
人生絕對不是只有升大學這個階段,請切記。
以下不廢話直接看大考中心公佈的表格,並切入重點,來看看國文題目出奇招、數學A、數學B的分流是否真的帶來衝擊。

一、如何看表

首先,作為考生/家長/家教老師/老師在判讀表格前要有兩點概念:級距和五標。搞清楚之後,我們才能客觀分析出(而不是通靈亂猜)考生實際成績在全體考生中有多好。

1.什麼是級距?

級距是一個很有趣的設計,大考中心為了兼顧全體考生的程度,在學測時並不以絕對分數為選才標準,而是以「前1%」考生的成績總和下去平均,然後除以15。也就是說,級距是隨著全體考生的應試狀況而浮動的,更可以根據各科級距跟前幾年的級距差異來判斷當年的考卷有沒有鑑別度。
一般而言,級距維持相當水準代表該科目近年來難度不變,級距縮小則難度增加、鑑別度變低(利於前1%考生而不利多數考生),反之亦然。

2.什麼是五標?

五標其實屬於統計學範疇,高中數學有教過,有商科背景的讀者應當也很容易就能理解:
  • 頂標:假設只有100名考生,第13名的考生之級分。
  • 前標:假設只有100名考生,第26名的考生之級分。
  • 均標:假設只有100名考生,第51名的考生之級分。
  • 後標:假設只有100名考生,第76名的考生之級分。
  • 底標:假設只有100名考生,第88名的考生之級分。
從五標的落點,我們可以畫出圖形,大概抓出考生們落在哪裡。如果不想自己畫,或是想要更精確的圖形,放心,大考中心全都公開了,我們可以用Excel跑出來詳細的分布圖來,只是除非真的是有打算把學測考生們的成績當對沖基金在玩,替每一個學生沖出最佳志願序,而你手頭上有大量學生(可能五十個或更多),否則這麼做的意義不大,看五標就很夠了。
而五標的分布能不能看出該年題目的難易度、鑑別度呢?當然也行!五標越集中,就表示有越大量的考生被畫在同一個級分區間內,也就是鑑別度較低,對前1%學生有利而對多數學生無利;頂標與前標接近、底標與低標接近,均標卻跟其餘四者不接近時,就會成M型分布,有「強者越強、弱者越弱」的現象,這份卷子的鑑別度可能也是需要檢討的。
因此在理想上,級距穩定,五標間距合宜,致使分布曲線平緩的卷子應該是鑑別度相對高、難易度適中,也對於多數學生較為公平的好卷子。

二、證偽時刻!

鏘!鏘!鏘!證偽時刻到來啦!
既然從各大媒體反應上來看,考卷出來時各路教育專家與磚家「觀者如山」,步出考場的學生們則是「色沮喪」(此處作現代字面意義解)。
但3/1公布成績了,一個多月以來的擔憂與猜測是否為真,就讓亞寧我來當一次流言終結者,用數學、科學來證偽吧!
首先,證偽之前是定義。我要驗證的東西有兩個:
  1. 國文、數學A、數學B考卷的爭議,從考生的實際考試結果來看,是否成立?
  2. 上列三份考卷在鑑別度、難易度上分別表現得如何?
數學的爭議在於第一次分成A(給對數學較有興趣的考生考)、B(給數學較沒興趣的考生),而題目又有許多以往所沒見過的長文敘述,所以造成了衝擊;國文爭議點則是在於:三年前大考中心與教育部承諾的改革方向是降低文言文比例,結果考題卻意外多題文言文,考生與教學前線的老師們在考前認知的是「文三白七」,實際考題卻將近「文七白三」。
為了保護學生與老師的權益,任何重大考招改制其實都要在三年之前就公布。但姑且在此擱置信賴保護(例如:國文「文白比例」)的問題,我們先讓數字說話,以下調出過往三年的學測五標,請諸君比較。

1.國文

從國文的五標來看:
  • 今年是:13、12、10、9、7
  • 去年是:13、12、11、9、8
  • 前年是:13、13、11、9、8
  • 大前年則是:13、13、11、9、8
從五標所畫出來的圖形/趨勢來看,底標確實有下滑一個級分,然而這還在勉強可以接受的範圍,考生的成績分布上反而分布得更加均勻,使得程度不同的考生得以被鑑別出來:也就是說,儘管學生們嘴巴上面說被嚇到了,但前1%的學生考得與過去三年差不多,整體考生也算是應對得宜,從五標分布來看,這份試卷達成過去三年都未曾做到的鑑別度來

2.數學A

從數學A的五標來看,就沒有這麼樂觀了(前三年採舊制數學級分):
  • 今年是:10、8、6、4、3
  • 去年是:11、9、6、4、3
  • 前年是:14、13、9、5、4
  • 大前年則是:14、12、9、5、4
我們可以從這裡看出什麼呢?先引用去年聯合報對於去年數學考試結果的報導。是的,相比起過去幾年,去年的分布(11、9、6、4、3)已經是四年內最難了,而數學A作為要出給「對數學比較有興趣的考生」考的數學考卷,卻出現了考生分布更加集中於10級到3級之現象,這顯示了兩點:
  • 數學A的難度是夠難了,79,834名應考生中只有11,798人(14.78%)到達了頂標10級分或更以上,但11級分以上卻只有8,065人(10.10%)(以上及以下相關數據皆出自大考中心)。從數據上,我們可以判定的事情是11級分以上的數學菁英們有福了,因為升學申請的優勢將是他們的!
  • 然而,從低標4級、底標3級及以下的個別人數來看,考4級分的考生有12,019人、考3級分的考生則有8,063人,考不到底標(0~2級分)的總人數也還有6,432人,這三者相加,足足佔全體數學A考生的33.21%。
一份出給對數學有興趣的考生(或者說白一點,出給理組考生)仍舊讓超過三成的考生考了4級不到,而只有前10%可以被細分成11到15級分,這份考卷是為誰服務?全體考生?還是頂尖大學的理工科系?
在我看來,數學A在鑑別度、難易度上,今年的表現從結果論都是利於前10%而忽略了多數考生利益的。但我們值得思索的點是,如果前10%學生要脫穎而出,需要透過一套讓其他考生陪著一起受損、非頂尖大學也跟著失去鑑別學生數學學科能力的考試制度來作為代價嗎?學測申請有二階測驗,同級分也有公開、公平、公正的超額篩選標準,為何要在對全體考生的考試上就施以如此嚴苛的手段?
這並不符合比例原則。

3.數學B

數學B則一樣以前三年的數學五標作為對照,卻會發現另一個有趣現象:
  • 今年是:13、11、8、4、3
  • 去年是:11、9、6、4、3
  • 前年是:14、13、9、5、4
  • 大前年則是:14、12、9、5、4
如果我們將這幾年的五標畫成圖,從模型上,其實他們分布得差不多。假設原先的學測數學出得適切且合宜,那麼我們可以說今年的數學B表現不俗,甚至取得了歷年的均衡,沒有前年過度M型化的弊病、也沒有去年分布均勻但偏難(以致於五標前三標都偏低)的困境。
但如果我們仔細去看,我們會發現另外兩個有趣的事實:
  • 首先,數學B難易度從分布來看應當是合格了,但他的鑑別度出來了嗎?我認為並沒有,更精確地說是,歷屆數學從來都沒有。數據上的論證比較後面談。
  • 再來,數學A的應考人數為79,834人、數學B的應考人數為90,556人,而同為最常被採納考科的國文、英文的應考人數分別為113,826人與113,756人。我們四捨五入到萬位吧:數A有8萬人考、數B則是9萬人考,但整體考生就11萬人,分科考的意義在哪裡?是突然一提到數學時,就突然多了六萬考生嗎?當然不是,而是多數考生根本不知道該怎麼選,只好兩個都考。

4.結果出爐!

綜合上三段的現象與觀察,我認為我們可以去想一件事。是不是今年的學測特別難呢?不全然是,從數據上來看,數學A真的又難又沒有鑑別度,數學B方面是制度一直有問題,國文則是錯誤的訊息和期待帶來了震撼,但學生其實消化得了,因此反而表現平穩。
證偽結果出爐:
  • 國文:雖然出題不講武德、文言文比例比說好的高,但學生處理得意外好,也許學生的閱讀理解能力比我們(甚至也比他們自己)想像得還要強大。綜合上述,本屆國文其實是難度與鑑別度都是表現相當優異的一屆。
  • 數學A:難且沒鑑別度,應該改善。
  • 數學B:承襲過往數學歷屆難度,但積弊要不要改,我們下一段談。

三、還看今朝

1.萬千教改集於一身的白老鼠

如前述,級分制乃是一個浮動的相對分數制度,如果分流了小部分(選擇相信大考中心的)考生,卻最後仍與考數學學測無異,那沒有「聰明」到在準備方向、考試作答心態上都兩面討好的學生不就是傻子?而志向明確,很清楚自己就是要念文科/理科的學生不就被兩科跨考的考生之表現影響,等於整個分數分配的市場機制都被這些進退失據的考生打亂,而考生是犯錯的人嗎?當然不是,問題是設計制度的人
今年是第一次試辦數學A、數學B分流,而且還要接軌新上路的分科測驗(取代指考),分科測驗中,國文、英文與數學乙將會採用學測分數(數學乙對應數學B)來對應級分,目前要如何對應級分過去尚有爭議,但國文、英文、數學B考砸了,在分科測驗上等於也砸了一部分,這點確實是已經拍版了(除非政策急轉彎)。
同時在一屆考生身上實測這麼多東西,同時應屆畢業生們還有高一就被迫開始積累的學習歷程,而近兩週又有新聞表示台大教授建議大家學習歷程中不要再放小論文上來(這點出於良善與務實的申請考量,但很顯然會讓很多高中生失望)。談白說,我如果是高中生,而且我不是學科成績極端(十項全能或十項全不能)的學生的話,我一定很不知所措,太多變數了。
我們固然可以拋一句「自身夠強,規則怎麼改都無所謂」,但如果這個不負責任的邏輯成立,那教育與考制改革做什麼?我們來這裡改革,不就是只為了三件事,公平、公平,還是TMD公平嗎?
如果不是為了公平,以及讓更多大學端可以鑑別學生、學生可以適才適所,我們改這些花樣作什麼?巧立名目、拉攏廠商、累死學生嗎?

2.數學優於自然、社會兩科嗎?

另外,如前面所提到的,我素來認為歷屆的數學題目都有問題:我們的數學題目數太少、作答時間不夠多,這直接導致考生可以犯錯的空間太少。
何以見得呢?我認為可以從考生要挑戰滿級分的正確率來檢視:
以今年的成績標準來舉例:
一個人要在社會科拿15級分,72題、每題兩分,116分以上都是15級分,他正確率只要80.5%就可以滿級;
自然科亦然,128分之中(不實施倒扣,當中部分多選題目提示應選幾項)只要獲得112.72分就可以滿級,換成正確率約為88.1%。
但數學從來都不是這樣,數學B秉持如此原則,要滿級正確率需要92.4%,全台考生只有3,008人做到,這可只佔了3%;頂標13級分則需要79.2%的正確率,但這個正確率在自然科、社會科已經是14級分了。
數學A呢,容錯率是夠高,今年考15級分只要大於77.86分,要頂標(10級分)更簡單,考超過50.5分就好,但換句話說就是這份考卷困難到全國有8成的人考不到50分啊!這份考卷是出給對數學有興趣的、理組的學生考的?自然科才是專門給理組考的,正確率有88.1%就是滿級分,然後一份給理組的數學考卷,我只要有78%的正確率就是滿級?
試問各位讀者,這是追求什麼樣的目標呢?是我們的數學考科長年都在汰選掉「數學不好的考生」進入好大學的資格,還是真的有在為了科系、專業把關?
老實說,我很懷疑。
-----
教育之謂也,不知者教之,未成者育之。
教育乃百年樹人之大計、國家社會之根本,考制設計則影響哪些人可以獲得教育資源、階級翻轉、階級之間的公平與正義,還希望大家謹慎思索,如果認同還請多多轉發、分享。
近來新聞多在關注烏俄戰爭,這很好:「生於憂患,死於安樂」但孟子也說:「出則無敵國外患、入則無法家拂士者,國恆亡。」我談烏俄、談國關,也談教育,左右都是要關心國家社會了,就讓我當個引路人,野人獻曝一下。
還請多多指教。
為什麼會看到廣告
13會員
70內容數
學院者,傳道、受教、切磋琢磨之地。 多數現代人從來不缺資訊,更不缺取得資訊的管道,但缺辨別真偽、鑑別優劣、演繹因果等知識方法而已。 於此平台開設專欄、成立沙龍而以「學院」名之,不求於此直接獲利,但求廣傳見聞以助人而已。
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
人工智慧(AI)和大數據已經徹底改變了許多行業,而會計行業也不例外。隨著技術的不斷進步,會計師必須不斷適應新的工具和方法,以滿足客戶的需求並保持競爭力。在這篇部落格文章中,我們將探討人工智慧和大數據對會計師職業的影響以及未來的前景。 首先,讓我們來看看人工智慧和大數據如何改變會計業務的運作方式
Thumbnail
許多人對於我的工作感到相當好奇,什麼叫做「數據社群分析」?其實這件事,在我的職涯摸索中,也讓我多次感到矛盾,在正統的工作中,數據分析是數據分析、社群是社群,什麼叫做「數據社群分析」。
Thumbnail
聽過一些朋友表示自己不喜歡與人打字聊天,比較偏好實體的聚會互動,而我自己則是相反,喜歡自由度較高的文字互動能讓我可以更充分運用時間,也可以在不需要舟車勞頓的情況下就能與朋友們聯繫感情。 在《遠距溝通最強術》這本書所提到的是另一種互動交流模式即是「視訊會議」,在疫情期間被廣為使用,即便現在多數人
Thumbnail
鮑爾演說:鷹鴿兩者皆有 上周五,聯準會主席鮑爾在傑克森洞演說中表達了鷹派和鴿派的兩面立場。他明確表示聯準會將堅持抗通膨的決心,包括進一步升息以及維持通膨目標2%不變。同時,他也強調經濟數據的重要性,並指出貨幣政策的實施可能會有滯後效應。這一演說使市場更加關注未來的政策走向,並對美元走勢產生影響。
Thumbnail
這次要來介紹「pytube」這套神器, 當我們需要對影音進行統計分析時就需要使用這把利器來破關, 尤其是AI時代的來臨, 我們會需要大量的資料來進行模型的訓練, 而我們總不可能海量的去撈取這些資料, 會非常沒有效率也浪費空間, 因此我們會先進行偵查的任務, 需要派出偵察隊來蒐集youtube的影音資
Thumbnail
檢討新春開紅盤這兩週的交易情況,先前利用年假的時間思考、釐清與調整自己的缺點與方向,一來是界定明確的限制,限制日內交易盈虧總量並轉向休息制度,二來是把交易損益作詳細妥當的分門別類,從數據中優化策略、強化心智的結構。
Thumbnail
111年學測的社會試題中有關經濟學的考題部分,有點意思,選擇題中出現非選擇題,是一種好的開始,但推論的細節恐怕不是出題者仔細推敲過的,而是心裡預先產生「標準答案」!
Thumbnail
不知道為什麼很多人寧願相信自己的主觀意見也不願相信實際銷售數據,雖然說特斯拉也是有一些負面消息,但是還是必須說他們的技術已經遙遙領先其他車廠,否則,最近福斯也不會召開會議討論,應該如何趕上特斯拉與中國製造商.
Thumbnail
藉由大考中心於發布的新課綱學測參考試卷,整理重要的觀念和解題方法。 題目:選擇二 觀念:特殊點的假設
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
人工智慧(AI)和大數據已經徹底改變了許多行業,而會計行業也不例外。隨著技術的不斷進步,會計師必須不斷適應新的工具和方法,以滿足客戶的需求並保持競爭力。在這篇部落格文章中,我們將探討人工智慧和大數據對會計師職業的影響以及未來的前景。 首先,讓我們來看看人工智慧和大數據如何改變會計業務的運作方式
Thumbnail
許多人對於我的工作感到相當好奇,什麼叫做「數據社群分析」?其實這件事,在我的職涯摸索中,也讓我多次感到矛盾,在正統的工作中,數據分析是數據分析、社群是社群,什麼叫做「數據社群分析」。
Thumbnail
聽過一些朋友表示自己不喜歡與人打字聊天,比較偏好實體的聚會互動,而我自己則是相反,喜歡自由度較高的文字互動能讓我可以更充分運用時間,也可以在不需要舟車勞頓的情況下就能與朋友們聯繫感情。 在《遠距溝通最強術》這本書所提到的是另一種互動交流模式即是「視訊會議」,在疫情期間被廣為使用,即便現在多數人
Thumbnail
鮑爾演說:鷹鴿兩者皆有 上周五,聯準會主席鮑爾在傑克森洞演說中表達了鷹派和鴿派的兩面立場。他明確表示聯準會將堅持抗通膨的決心,包括進一步升息以及維持通膨目標2%不變。同時,他也強調經濟數據的重要性,並指出貨幣政策的實施可能會有滯後效應。這一演說使市場更加關注未來的政策走向,並對美元走勢產生影響。
Thumbnail
這次要來介紹「pytube」這套神器, 當我們需要對影音進行統計分析時就需要使用這把利器來破關, 尤其是AI時代的來臨, 我們會需要大量的資料來進行模型的訓練, 而我們總不可能海量的去撈取這些資料, 會非常沒有效率也浪費空間, 因此我們會先進行偵查的任務, 需要派出偵察隊來蒐集youtube的影音資
Thumbnail
檢討新春開紅盤這兩週的交易情況,先前利用年假的時間思考、釐清與調整自己的缺點與方向,一來是界定明確的限制,限制日內交易盈虧總量並轉向休息制度,二來是把交易損益作詳細妥當的分門別類,從數據中優化策略、強化心智的結構。
Thumbnail
111年學測的社會試題中有關經濟學的考題部分,有點意思,選擇題中出現非選擇題,是一種好的開始,但推論的細節恐怕不是出題者仔細推敲過的,而是心裡預先產生「標準答案」!
Thumbnail
不知道為什麼很多人寧願相信自己的主觀意見也不願相信實際銷售數據,雖然說特斯拉也是有一些負面消息,但是還是必須說他們的技術已經遙遙領先其他車廠,否則,最近福斯也不會召開會議討論,應該如何趕上特斯拉與中國製造商.
Thumbnail
藉由大考中心於發布的新課綱學測參考試卷,整理重要的觀念和解題方法。 題目:選擇二 觀念:特殊點的假設