自從ChatGPT更新到第四版,討論度更甚以往。據新聞所說,它已經能在大型測驗上取得不錯的成績,對語言的處理與回應表現也比上個版本好。雖然我最近用它問數學問題,還是有錯誤的地方(例如:求等差級數但代入公式的數值錯誤),但在我指出有錯誤的地方時,有比以往高的機率能再給出正確的回覆。嗯,ChatGPT可教也。
先前我有提出AI對創作的影響,這次我想分享的是教育領域。在ChatGPT更會考試的同時,大家不免會想:ChatGPT能回答的問題很多,而且有問必答又快速,學生都想仰賴ChatGPT幫忙寫作業跟考試,該怎麼辦?
在還沒有發布第四版前,就已經有許多國家針對ChatGPT發布聲明,有的禁止,有的接納,更多的是沒有明確表態,還在觀望。像數學題目多數有標準答案,只要多加訓練,我相信ChatGPT總有一天能回答完一整本的會考或學測題本,因此請ChatGPT幫忙寫作業跟考試,對數學科的衝擊肯定不小。
身為跟數學題目研發和評量有關的工作者,我對目前ChatGPT的發展並不悲觀。
想請ChatGPT幫忙答題?你得先做它的老師
撇除剛才提到代數學公式錯誤的問題,即使是請ChatGPT回答論述型的問題,也是有可能出錯的。最常出現的是文不對題(你問A它很快地答B),就像最近我嘗試條列資訊請它出題的狀況:
這個時候,我會不斷地指出它明顯不合的地方,並修改我的提問,讓它能漸漸地回答出接近我想要的答案,或是出現新的idea讓我重新問別的問題。好在ChatGPT沒有耐性問題,只要它的運算資源充足,你可以無止境地接續問下去(說不定是人的耐性會先被ChatGPT的鬼打牆磨完🤣)。
這樣問答的過程,就像面對一個富有知識但表達能力不太好的學生,只要你願意跟它對話,總有機會得到還行的答案。
對現實學生來說,如果自己的基礎知識、技能不足,是沒辦法看出ChatGPT回答的內容是否符合所需,甚至是否有錯誤。因此,如果學生只是照抄ChatGPT給的答案,尤其只抄第一次回答的內容,要發現應該不難。
相反地,如果學生能透過不斷地問答,讓ChatGPT的回答正確率提高,表示他擁有知識判斷、選擇正確的答案。
不過,ChatGPT歷經這幾版的進化後,內容最佳化程度已經逐漸提升。它能一次答對所有類型的問題,或是給出滿足多數人的最佳解,我想只是時間早晚的問題。
回歸評量的目標,讓ChatGPT成為「幫手」而非「對手」
即使ChatGPT第一次給的答案就是正確的,還是有其他方法可以因應。回到學生寫作業、考試的根本目的,是希望他能理解、應用所學。既然無法從書面結果確認學生是否達到這個目的,那就從改變評量的形式開始。
「實作」類型的評量,是我第一個想到的方法。實作的評量不僅包含最後的成果,還能納入過程紀錄,像是目標、如何開始、設計方法、執行、結果呈現、詮釋與討論等等。這類型的評量更貼近解決現實問題的情境,且因為「過程紀錄」的必要,即使能向ChatGPT取得正確答案,也不足以完成評量。
但是,連過程都跟ChatGPT問到了呢?這時就要考慮過程紀錄的要求了。ChatGPT終究只生成了文字「說說而已」,應該要期待學生真正動手「做」出來,並以圖片、影片等更多元的方式,將這些過程記錄下來。
從親自經歷的過程中學習,肯定比只閱、聽內容來得有感,而有感的學習,正是深刻、持久且能夠啟發創新,讓學生將所學烙印在心頭的方法。
而且,學生在過程中搭配了ChatGPT,還能延伸更多的討論。最直接的例子如:為什麼ChatGPT所提的方案可行?找出背後讓它可行的理由;或者,為什麼ChatGPT所提的方案不可行?要怎麼修正它。這些延伸方向,也能更加鞏固學生對相關知識的理解,何樂而不為呢?
現在大家面對ChatGPT的疑慮,跟當初計算機、電腦出世的狀況很像。總會有些事務會被取代,但善用它們後,能夠發展更多、更好的機會。
ChatGPT的出世,或許能迫使大家重新思考教育的做法與環境,如何變得更符合大家的需求。無論是課程還是評量的改變,對象是學生、老師或是業界,我認為都值得開始探索,好好體驗ChatGPT帶來的效果。