付費限定

當ChatGPT 重新嘗試UPSC 時

男子漢聊AI

發佈於秒懂AI提問指令

更新於 2024/10/17發佈於 2023/10/18閱讀時間約 2 分鐘

今年二月，第一次嘗試人工智慧聊天機器人ChatGPT 嘗試UPSC（被廣泛認為是世界上最難考試之一）時，它慘遭失敗。ChatGPT 無法通過UPSC 預賽，使許多人為自己感到驕傲。

但是，自從我們做了這個故事以來，人工智慧世界發生了許多新的更新和發展。最值得注意的是，OpenAI發布了GPT4，這是迄今為止最先進的大型語言模型（LLM）。

ChatGPT的先前版本由GPT3.5提供支持，幾個月前，OpenAI透過ChatGPT Plus訪問GPT-4 。

再次對GPT4進行了相同的實驗，但這次，我們向GPT-100 提出了相同的4 個問題，這次，它答對了86 個問題。

雖然前一年（2021 年）的截止值為87.54 分，但僅考慮試卷1，GPT-4 得分為162.76 分，這意味著ChatGPT Plus（由GPT-4 提供支援）通過了UPSC。

在先前的實驗中，ChatGPT 給了46 個錯誤的答案，從這個角度來看，我們看到GPT-4 有了巨大的改進，因為它只答錯了14 個答案。話雖如此，這也不是完全出乎意料的事情。

OpenAI在發布GPT-4的技術論文時，沒有提到任何關於架構（包括模型大小）、硬體、訓練計算、資料集建構、訓練方法等信息，引起了研究人員的軒然。

但有趣的是，OpenAI確實透露，他們在各種基準測試上測試了GPT-4，包括模擬最初為人類設計的考試。

在技術論文中，OpenAI也指出，GPT-4在大多數測驗考試中的表現優於GPT-3.5（ChatGPT）。因此，GPT-4 在UPSC 中的得分高於ChatGPT 也就不足為奇了。

此外，重要的是要注意，這只是一個有趣的實驗，不應該根據這些結果做出具體的判斷。

雖然GPT-4 通過了GRE 和LSAT 等考試，但它在英國文學中失敗了。同樣，ChatGPT 儘管擁有世界上所有的知識，但在為六年級學生設計的考試中失敗了。

最後，同樣重要的是要注意，透過更改查詢，我們可以提示GPT-4 得出準確的回應。這意味著在某些情況下，改寫相同的問題可能會導致GPT-4 提供正確的答案，反之亦然。但是，在實驗中，只考慮了機器人的初始反應。

創作者正在準備中

請加入男子漢聊AI的沙龍了解最新動態！

#AI工具推薦

男子漢聊AI的沙龍秒懂AI提問指令AI工具推薦

男子漢聊AI的沙龍

32會員

186內容數

「秒懂AI提問指令」是您AI學習的社群首選，擁有專業的ChatGPT、MidJourney及stable diffusion知識分享。這裡不僅是學習AI內容的最佳平台，更是實戰與資源的寶庫。讓人工智能成為你的效率神器，助您深入了解AI各種面向。更重要的是，我們的社群中聚集了大量AI極客，讓您有機會與同好一同交流、學習。

留言

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

男子漢聊AI的沙龍的其他內容

科學家為科學家所開發的開放語言模型—「AI2 OLMo」

艾倫人工智慧研究所很高興地宣布，我們正在著手創建一個開放的、最先進的生成語言模型：AI2 OLMo（Open Language Model）。 OLMo 的規模將與其他最先進的大型語言模型相媲美，參數達到70 億個，預計在2024 年初推出。

#AI工具推薦

Meta 正在為廣告主推出生成式AI 功能

Meta 已經產生了許多創新的生成式AI 研究，但其中大部分只是介紹給了學術研究人員。5月11日，該公司宣佈為廣告主提供三項生成AI功能。 1.文字變體：產生多個版本的文字來突顯廣告客戶文案的要點，讓廣告客戶可以選擇針對特定受眾嘗試不同的文字。

#AI工具推薦

【AI工具分享】利用AI 創造驚人頭像「PicAvatar」

PicAvatar 是一款能夠在任何風格下為您的應用程式或網站創建驚艷頭像的工具。該工具能夠輕鬆訓練自訂模型，以便根據先前的藝術作品或您自己的臉部生成頭像。頭像儲存在全球熱儲存中，並透過CDN 提供服務，因此您可以輕鬆將它們添加到您的應用程式中。

#AI工具推薦

【AI工具分享】世界上第一個AI 治療機器人「Therabot 」

Therabot 是一種基於人工智慧的治療機器人，旨在幫助使用者識別並解決與AI 的關係中可能出現的問題。透過使用自然語言處理和機器學習技術，Therabot 可以對使用者輸入的資訊進行分析，並提供個人化的治療方案。

#AI工具推薦

【AI工具分享】隨時隨地存取最先進的AI 工具「Solvemigo」

Solvemigo 是一款付費的Telegram 機器人，提供了ChatGPT、Dall-E、Whisper 等多種先進的AI 工具，讓您隨時隨地在各種裝置和平台上使用。現在您可以將作家、行銷人員、程式設計師、顧問、藝術家和助手都裝進您的口袋裡了。 Solvemigo 讓使用者可以透過Tele

#AI工具推薦

【AI工具分享】使用GPT-4 更快地創建、測試和部署智能合約「Smaty 」

Smaty 是一款智慧合約開發平台，利用GPT-4 技術，幫助用戶更快地創建、測試和部署智慧合約。它不僅具有高級漏洞檢測功能，還可以簡化單元測試生成，並能快速生成可自訂的React 應用程序，實現無縫的區塊鏈整合。

#AI工具推薦

科學家為科學家所開發的開放語言模型—「AI2 OLMo」

#AI工具推薦

Meta 正在為廣告主推出生成式AI 功能

#AI工具推薦

【AI工具分享】利用AI 創造驚人頭像「PicAvatar」

#AI工具推薦

【AI工具分享】世界上第一個AI 治療機器人「Therabot 」

#AI工具推薦

【AI工具分享】隨時隨地存取最先進的AI 工具「Solvemigo」

#AI工具推薦

【AI工具分享】使用GPT-4 更快地創建、測試和部署智能合約「Smaty 」

你可能也想看

ChatGPT-4o搶先體驗~簡直酷斃了!!!

ChatGPT-4o已經開放給部分用戶使用了!! 兩周前，Open AI剛發布的ChatGPT-4o版本，令人驚豔!! 從原本只有文字的應用，就已經引起驚天動地的AI浪潮與各種應用如雨後春筍般的大量露出，還來不及學會各種應用時，長出眼睛跟耳朵的GPT4o竟然說來就來，而且還可以免費使用、體驗!?

#ChatGPT #ChatGPT4o #GPT4o

樂子

2024/05/21

ChatGPT-4o文字表現實測！

OpenAI最近進行了重大更新，ChatGPT-4o將開放給所有用戶，具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項，更換模型功能，並進行了功能測試。本文將針對用戶的實際體驗進行測評。

#GPT-4o #ChatGPT #OpenAI

程式輕鬆玩

2024/05/15

ChatGPT：人工智慧的對話夥伴

ChatGPT（全名：聊天生成預訓練轉換器）是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出，使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型，並以強化學習進行訓練。

#ChatGPT #AI #OpenAI

SHANE的行銷筆記

2024/05/15

GPT-4o免費升級，OpenAI最新模型讓ChatGPT變得更聰明

OpenAI在5/13春季發表會上宣佈，將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具，並有使用量限制。文章介紹了GPT-4o的功能和未來優化，並提到新的ChatGPT桌面應用程式和外觀改變。

#GPT-4o #ChatGPT #免費

德意志黑眼圈

2024/05/14

進化為GPT-4o 可以聊天兼翻譯，圖片辨識大有進展。不用十年，不到兩年AI已可取代許多人類庶務

2024年5月13日，Openai發布了新一代的模組GPT-4o，念法：GPT-four-O。強調即時對話以及圖像解析能力，官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析，以及幾乎可媲美真人的語音回應，包含調整語氣、用詞以及模仿機器人語音等，相當令人驚豔。

#GPT4o #ChatGPT #Openai

乙二浮想事務所

2024/05/07

想像力的看法 ChatGPT 對決 GPT-4

ChatGPT上線已經一年多了，連GPT-4上架到市面上販售也都一年了，眾所周知ChatGPT就是GPT-3.5，而微軟的搜尋引擎Bing使用的是GPT-4，那針對同一個問題，3.5的版本與4.0的版本在回答上會做出什麼樣的差別？她們在智力上有明顯的差別嗎？她們面對問題的思考上有什麼不一樣呢？

#科學 #想像力 #AI

乙二浮想事務所

2024/04/09

我如何與AI合作寫小說

前年2022年11月OpenAI公司發表了ChatGPT，並開放ChatGPT-3.5在網路上供人免費下載試用，瞬間引爆了人工智慧的話題，能夠自我學習的ChatGPT以每天可見的變化在進步，讓人見識到人工智能的學習力，隨後OpenAI發表的GPT-4，讓人見識到GPT這個人工智慧系統有著令人驚訝的智

#ChatGPT #OpenAI #AGI