付費限定文章
當ChatGPT 重新嘗試UPSC 時

閱讀時間約 2 分鐘

今年二月,第一次嘗試人工智慧聊天機器人ChatGPT 嘗試UPSC(被廣泛認為是世界上最難考試之一)時,它慘遭失敗。ChatGPT 無法通過UPSC 預賽,使許多人為自己感到驕傲。

但是,自從我們做了這個故事以來,人工智慧世界發生了許多新的更新和發展。最值得注意的是,OpenAI發布了GPT4,這是迄今為止最先進的大型語言模型(LLM)。

ChatGPT的先前版本由GPT3.5提供支持,幾個月前,OpenAI透過ChatGPT Plus訪問GPT-4 。


再次對GPT4進行了相同的實驗,但這次,我們向GPT-100 提出了相同的4 個問題,這次,它答對了86 個問題。


雖然前一年(2021 年)的截止值為87.54 分,但僅考慮試卷1,GPT-4 得分為162.76 分,這意味著ChatGPT Plus(由GPT-4 提供支援)通過了UPSC。


在先前的實驗中,ChatGPT 給了46 個錯誤的答案,從這個角度來看,我們看到GPT-4 有了巨大的改進,因為它只答錯了14 個答案。話雖如此,這也不是完全出乎意料的事情。


OpenAI在發布GPT-4的技術論文時,沒有提到任何關於架構(包括模型大小)、硬體、訓練計算、資料集建構、訓練方法等信息,引起了研究人員的軒然。


但有趣的是,OpenAI確實透露,他們在各種基準測試上測試了GPT-4,包括模擬最初為人類設計的考試。

raw-image

在技​​術論文中,OpenAI也指出,GPT-4在大多數測驗考試中的表現優於GPT-3.5(ChatGPT)。因此,GPT-4 在UPSC 中的得分高於ChatGPT 也就不足為奇了。


此外,重要的是要注意,這只是一個有趣的實驗,不應該根據這些結果做出具體的判斷。


雖然GPT-4 通過了GRE 和LSAT 等考試,但它在英國文學中失敗了。同樣,ChatGPT 儘管擁有世界上所有的知識,但在為六年級學生設計的考試中失敗了。


最後,同樣重要的是要注意,透過更改查詢,我們可以提示GPT-4 得出準確的回應。這意味著在某些情況下,改寫相同的問題可能會導致GPT-4 提供正確的答案,反之亦然。但是,在實驗中,只考慮了機器人的初始反應。


創作者正在準備中
請加入 男子漢聊AI的沙龍 了解最新動態!
19會員
186內容數
「秒懂AI提問指令」是您AI學習的社群首選,擁有專業的ChatGPT、MidJourney及stable diffusion知識分享。這裡不僅是學習AI內容的最佳平台,更是實戰與資源的寶庫。讓人工智能成為你的效率神器,助您深入了解AI各種面向。更重要的是,我們的社群中聚集了大量AI極客,讓您有機會與同好一同交流、學習。
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
閉關了,以及閒聊ChatGPT如何當我的寫作小助手人到中年,總是有些年輕時的夢想沒有實現,而現在是嘗試實現一些些夢想的時候了。而我年少時最大的夢想,就是認認真真寫一部長篇小說。
Thumbnail
avatar
子不語
2023-10-17
《運用Chatgpt當工具協助做創作時,我會去編輯跟修正的三個方法》當我們利用Chatgpt做工具來協助創作的過程當中,偶爾總會覺得,似乎內容當中少了一點靈魂,或者說少了點人味。 畢業他在邏輯跟架構上比較擅長,並且富有條理,但需要我們去做一些修正,並去補充一些字詞,讓文字更為順口跟流暢。 我自己的作法是三部份處理: 第一個是在問問題的時候,我們要盡量去要求他在
Thumbnail
avatar
捲毛阿喵
2023-08-12
[AI|情緒]讓ChatGPT當你的情緒樹洞,及心理諮詢師(入選"即時精選")生活中難免會遇到困擾。有些話、有些困擾,真的需要: 一個不會外傳的樹洞、一個客觀的傾聽者、 一個能夠提出有建設性回饋的幫助者。 但這樣的對象、管道,真的能..找得到嗎? 一、碰到困擾時可能的抒發求助管道:也許會有後遺症 (一)對親近的人?--可能會造成情緒負擔,並惡化問題 不想造成家人朋友的負擔、
Thumbnail
avatar
溫紅一杯
2023-06-28
ChatGPT可以拿來當翻譯機嗎?以前習慣用日文辭典app查資料,還是時常覺得很難查、不清楚、不是我要的答案,我試著把chatGPT拿來當翻譯機,結果,它顛覆我的想像……
Thumbnail
avatar
雨兒
2023-06-15
當ChatGPT這些人工智慧更聰明,代表一堆職業將被取代,還有哪些職場技能是無可取代? 美國晶片設計大廠輝達執行長黃仁勳說:我們即將面臨iphone時刻!這代表時代的變遷終於到來,殺手級的商品快出現了 此話一出,對於台積電是利多消息,因為要動用到最新製程2奈米。今年最火熱的產業就是人工智慧,美國的發展就是以微軟帶頭發展底下的open AI的ChatGPT,他多恐怖呢?人家臉書跟You
avatar
賢弟的期貨選擇權獲利引擎-劍賢
2023-03-25
如何把ChatGPT當專屬的塔羅占卜師【黑貓塔羅】上週黑貓出了一篇愛情占卜,就用了ChatGPT來協助撰寫答案的部分,如果你有興趣的話,可以先讀這篇 ⬇️ 占卜🔮 我欣賞的那個人,對愛情的態度|抽獎活動 🔔|方格子 vocus 這篇文章的最末我有提到會公布指令,讓一般人也可以使用ChatGPT來幫自己占卜,那麼以下就進入今天的正題 想要看到更多
Thumbnail
avatar
只是一個塔羅占卜師
2023-02-20
名人加持|請當紅ChatGPT為我的影片寫一篇推薦序!ChatGPT這樣推薦了我的影片 “這個影片介紹了KD指標,並以4年回測實例的方式來解析如何利用KD指標在股票投資中賺取更多的利潤。觀眾可以學習如何正確地解讀KD指標的信號,以及如何根據KD指標的變化來進行交易。影片還提供了一些實用的投資技巧和建議,對於正在尋求股票投資建議的觀眾來說,非常有幫助。”
Thumbnail
avatar
3droid 三卓金融科技
2023-02-18
【樂耳玩創陪你養孩子】12: 當AI神器Chat GPT與Midjourney遇上親子教養時最近不管是電視媒體還是自媒體的頻道,都在討論AI,還有未來可能會發生的問題,當大家都在討論時,這真的看起來未來應用AI工具應該是不可避免的一件事了。 舉例來說,像是以最簡單的圖像與文字而言,Chat GPT與Midjourney只要輸入一些關鍵字,還有下指令,甚至生成有趣的圖片。
Thumbnail
avatar
樂耳玩創
2023-02-17
當 ChatGPT 來襲,我們該如何面對這全新的挑戰呢?前陣子出現很多關於 ChatGPT 的討論以及文章,剛開始看到周遭的人都在討論 ChatGPT 時。 坦白說,當時我並不知道 ChatGPT 是什麼。 但為了不被輕易淘汰,我嘗試去了解 ChatGPT 到底是什麼東西?為什麼很多人說 ChatGPT 可以取代 Google?為什麼 OpenAI 這間
Thumbnail
avatar
尼斯丹
2023-02-09
如何適當地將ChatGPT用於學術寫作ChatGPT最近非常火紅,ChatGPT是一種大型語言模型,由OpenAI開發和訓練。其實它也能用在學術研究當中,本文介紹六種方法能適當地將ChatGPT用於學術寫作,讓你在學術寫作時,能在不違反學術倫理情況下,事半功倍。
Thumbnail
avatar
Dr. Rover
2023-01-28