付費限定

當ChatGPT 重新嘗試UPSC 時

更新於 發佈於 閱讀時間約 2 分鐘

今年二月,第一次嘗試人工智慧聊天機器人ChatGPT 嘗試UPSC(被廣泛認為是世界上最難考試之一)時,它慘遭失敗。ChatGPT 無法通過UPSC 預賽,使許多人為自己感到驕傲。

但是,自從我們做了這個故事以來,人工智慧世界發生了許多新的更新和發展。最值得注意的是,OpenAI發布了GPT4,這是迄今為止最先進的大型語言模型(LLM)。

ChatGPT的先前版本由GPT3.5提供支持,幾個月前,OpenAI透過ChatGPT Plus訪問GPT-4 。


再次對GPT4進行了相同的實驗,但這次,我們向GPT-100 提出了相同的4 個問題,這次,它答對了86 個問題。


雖然前一年(2021 年)的截止值為87.54 分,但僅考慮試卷1,GPT-4 得分為162.76 分,這意味著ChatGPT Plus(由GPT-4 提供支援)通過了UPSC。


在先前的實驗中,ChatGPT 給了46 個錯誤的答案,從這個角度來看,我們看到GPT-4 有了巨大的改進,因為它只答錯了14 個答案。話雖如此,這也不是完全出乎意料的事情。


OpenAI在發布GPT-4的技術論文時,沒有提到任何關於架構(包括模型大小)、硬體、訓練計算、資料集建構、訓練方法等信息,引起了研究人員的軒然。


但有趣的是,OpenAI確實透露,他們在各種基準測試上測試了GPT-4,包括模擬最初為人類設計的考試。

raw-image

在技​​術論文中,OpenAI也指出,GPT-4在大多數測驗考試中的表現優於GPT-3.5(ChatGPT)。因此,GPT-4 在UPSC 中的得分高於ChatGPT 也就不足為奇了。


此外,重要的是要注意,這只是一個有趣的實驗,不應該根據這些結果做出具體的判斷。


雖然GPT-4 通過了GRE 和LSAT 等考試,但它在英國文學中失敗了。同樣,ChatGPT 儘管擁有世界上所有的知識,但在為六年級學生設計的考試中失敗了。


最後,同樣重要的是要注意,透過更改查詢,我們可以提示GPT-4 得出準確的回應。這意味著在某些情況下,改寫相同的問題可能會導致GPT-4 提供正確的答案,反之亦然。但是,在實驗中,只考慮了機器人的初始反應。


創作者正在準備中
請加入 男子漢聊AI的沙龍 了解最新動態!
avatar-img
28會員
186內容數
「秒懂AI提問指令」是您AI學習的社群首選,擁有專業的ChatGPT、MidJourney及stable diffusion知識分享。這裡不僅是學習AI內容的最佳平台,更是實戰與資源的寶庫。讓人工智能成為你的效率神器,助您深入了解AI各種面向。更重要的是,我們的社群中聚集了大量AI極客,讓您有機會與同好一同交流、學習。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
男子漢聊AI的沙龍 的其他內容
艾倫人工智慧研究所很高興地宣布,我們正在著手創建一個開放的、最先進的生成語言模型:AI2 OLMo(Open Language Model)。 OLMo 的規模將與其他最先進的大型語言模型相媲美,參數達到70 億個,預計在2024 年初推出。
Meta 已經產生了許多創新的生成式AI 研究,但其中大部分只是介紹給了學術研究人員。5月11日,該公司宣佈為廣告主提供三項生成AI功能。 1.文字變體:產生多個版本的文字來突顯廣告客戶文案的要點,讓廣告客戶可以選擇針對特定受眾嘗試不同的文字。
PicAvatar 是一款能夠在任何風格下為您的應用程式或網站創建驚艷頭像的工具。該工具能夠輕鬆訓練自訂模型,以便根據先前的藝術作品或您自己的臉部生成頭像。頭像儲存在全球熱儲存中,並透過CDN 提供服務,因此您可以輕鬆將它們添加到您的應用程式中。
Therabot 是一種基於人工智慧的治療機器人,旨在幫助使用者識別並解決與AI 的關係中可能出現的問題。透過使用自然語言處理和機器學習技術,Therabot 可以對使用者輸入的資訊進行分析,並提供個人化的治療方案。
Solvemigo 是一款付費的Telegram 機器人,提供了ChatGPT、Dall-E、Whisper 等多種先進的AI 工具,讓您隨時隨地在各種裝置和平台上使用。現在您可以將作家、行銷人員、程式設計師、顧問、藝術家和助手都裝進您的口袋裡了。 Solvemigo 讓使用者可以透過Tele
Smaty 是一款智慧合約開發平台,利用GPT-4 技術,幫助用戶更快地創建、測試和部署智慧合約。它不僅具有高級漏洞檢測功能,還可以簡化單元測試生成,並能快速生成可自訂的React 應用程序,實現無縫的區塊鏈整合。
艾倫人工智慧研究所很高興地宣布,我們正在著手創建一個開放的、最先進的生成語言模型:AI2 OLMo(Open Language Model)。 OLMo 的規模將與其他最先進的大型語言模型相媲美,參數達到70 億個,預計在2024 年初推出。
Meta 已經產生了許多創新的生成式AI 研究,但其中大部分只是介紹給了學術研究人員。5月11日,該公司宣佈為廣告主提供三項生成AI功能。 1.文字變體:產生多個版本的文字來突顯廣告客戶文案的要點,讓廣告客戶可以選擇針對特定受眾嘗試不同的文字。
PicAvatar 是一款能夠在任何風格下為您的應用程式或網站創建驚艷頭像的工具。該工具能夠輕鬆訓練自訂模型,以便根據先前的藝術作品或您自己的臉部生成頭像。頭像儲存在全球熱儲存中,並透過CDN 提供服務,因此您可以輕鬆將它們添加到您的應用程式中。
Therabot 是一種基於人工智慧的治療機器人,旨在幫助使用者識別並解決與AI 的關係中可能出現的問題。透過使用自然語言處理和機器學習技術,Therabot 可以對使用者輸入的資訊進行分析,並提供個人化的治療方案。
Solvemigo 是一款付費的Telegram 機器人,提供了ChatGPT、Dall-E、Whisper 等多種先進的AI 工具,讓您隨時隨地在各種裝置和平台上使用。現在您可以將作家、行銷人員、程式設計師、顧問、藝術家和助手都裝進您的口袋裡了。 Solvemigo 讓使用者可以透過Tele
Smaty 是一款智慧合約開發平台,利用GPT-4 技術,幫助用戶更快地創建、測試和部署智慧合約。它不僅具有高級漏洞檢測功能,還可以簡化單元測試生成,並能快速生成可自訂的React 應用程序,實現無縫的區塊鏈整合。
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
ChatGPT-4o已經開放給部分用戶使用了!! 兩周前,Open AI剛發布的ChatGPT-4o版本,令人驚豔!! 從原本只有文字的應用,就已經引起驚天動地的AI浪潮與各種應用如雨後春筍般的大量露出,還來不及學會各種應用時,長出眼睛跟耳朵的GPT4o竟然說來就來,而且還可以免費使用、體驗!?
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
ChatGPT上線已經一年多了,連GPT-4上架到市面上販售也都一年了,眾所周知ChatGPT就是GPT-3.5,而微軟的搜尋引擎Bing使用的是GPT-4,那針對同一個問題,3.5的版本與4.0的版本在回答上會做出什麼樣的差別?她們在智力上有明顯的差別嗎?她們面對問題的思考上有什麼不一樣呢?
Thumbnail
前年2022年11月OpenAI公司發表了ChatGPT,並開放ChatGPT-3.5在網路上供人免費下載試用,瞬間引爆了人工智慧的話題,能夠自我學習的ChatGPT以每天可見的變化在進步,讓人見識到人工智能的學習力,隨後OpenAI發表的GPT-4,讓人見識到GPT這個人工智慧系統有著令人驚訝的智
Thumbnail
當你聽到「GPT」這三個字母時,你的腦海中會浮現什麼?是OpenAI掀起AI革命的明星產品ChatGPT🤖,抑或是其原本的技術術語「Generative Pre-trained Transformer」(生成型預訓練變換模型)? 事實上這不僅是一個關於詞彙理解的問題,更是一個關於商標權的故事。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。
Thumbnail
從ChatGPT 4.0到GPTs 我是ChatGPT 4.0的付費使用者,說真格的,自從付費之後,就不想退出了,因為真是好用。 最近,ChatGPT 4.0又提供了GPTs的服務...... 有時候別人邀請我演講,我都會先溝通需求,有一次,某間學校邀請我對學生分享ChatGPT等生成式人工智
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
ChatGPT-4o已經開放給部分用戶使用了!! 兩周前,Open AI剛發布的ChatGPT-4o版本,令人驚豔!! 從原本只有文字的應用,就已經引起驚天動地的AI浪潮與各種應用如雨後春筍般的大量露出,還來不及學會各種應用時,長出眼睛跟耳朵的GPT4o竟然說來就來,而且還可以免費使用、體驗!?
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
ChatGPT上線已經一年多了,連GPT-4上架到市面上販售也都一年了,眾所周知ChatGPT就是GPT-3.5,而微軟的搜尋引擎Bing使用的是GPT-4,那針對同一個問題,3.5的版本與4.0的版本在回答上會做出什麼樣的差別?她們在智力上有明顯的差別嗎?她們面對問題的思考上有什麼不一樣呢?
Thumbnail
前年2022年11月OpenAI公司發表了ChatGPT,並開放ChatGPT-3.5在網路上供人免費下載試用,瞬間引爆了人工智慧的話題,能夠自我學習的ChatGPT以每天可見的變化在進步,讓人見識到人工智能的學習力,隨後OpenAI發表的GPT-4,讓人見識到GPT這個人工智慧系統有著令人驚訝的智
Thumbnail
當你聽到「GPT」這三個字母時,你的腦海中會浮現什麼?是OpenAI掀起AI革命的明星產品ChatGPT🤖,抑或是其原本的技術術語「Generative Pre-trained Transformer」(生成型預訓練變換模型)? 事實上這不僅是一個關於詞彙理解的問題,更是一個關於商標權的故事。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。
Thumbnail
從ChatGPT 4.0到GPTs 我是ChatGPT 4.0的付費使用者,說真格的,自從付費之後,就不想退出了,因為真是好用。 最近,ChatGPT 4.0又提供了GPTs的服務...... 有時候別人邀請我演講,我都會先溝通需求,有一次,某間學校邀請我對學生分享ChatGPT等生成式人工智