2024-09-29|閱讀時間 ‧ 約 25 分鐘

GPT炸裂更新!OpenAI-o1問世!正式超越人類!

OpenAI突然發布全新AI模型o1,堪稱人工智能領域的原子彈

OpenAI在9月13日凌晨突然宣布正式發布全新AI模型系列o1,包括o1-preview和o1-mini兩個版本。這一消息震驚了整個AI界,o1的出現很可能給人工智能領域帶來一場史詩級變革。

o1到底有多強?它在多個高難度基準測試中不僅碾壓GPT-4,甚至在某些領域已經超越了人類專家。

在國際數學奧林匹克(IMO)資格考試中,o1能解決83%的問題,遠超GPT-4的13%,這意味著o1已經有能力獲得數學奧賽金牌。

更令人震撼的是,在測試化學、物理和生物學專業知識的GPQA Diamond基準上,o1首次超越了擁有博士學位的人類專家,準確率達到驚人的78%。

在編程方面,o1同樣表現驚艷。在模擬的Codeforces編程競賽中,o1的Elo評分高達1807,超過了93%的人類競爭對手。這意味著o1已經可以成為一名出色的軟件工程師。

但o1最讓人驚嘆的,是它的思考能力。o1學會了"慢思考",就像人類在回答難題前要深思熟慮一樣,o1會在給出答案前先進行大量的內部推理。

通過強化學習,它能不斷完善自己的思維過程,嘗試各種策略,甚至意識到自己的錯誤並加以修正。這種"深思熟慮"的能力,讓o1可以解決之前AI無法應對的複雜問題。

o1的出現無疑是一個重大突破。雖然它還不能稱為AGI(通用人工智能),但它的出現預示著,那個曾經只存在於科幻中的未來,正以前所未有的速度迫近我們。

o1或許暗示了一個全新AI時代的開啟,AGI的到來或許真的很近了。

如此強大的AI模型也引發了一些擔憂。OpenAI意識到了o1潛在的風險,採取了一系列安全措施,包括將安全規則整合到o1的思維鏈中,以及隱藏原始思維鏈等。但這些措施是否足夠?在AI越來越強大的今天,我們真的能完全掌控它嗎?

目前,OpenAI針對ChatGPT付費用戶開放了o1的兩個版本,o1-preview和o1-mini。o1-preview每週只能使用30次,o1-mini每週可以使用50次。從這裡不難看出,o1需要調用的算力有多強。

API的價格方面,o1-preview每百萬輸入15美元,每百萬輸出60美元,比GPT-4貴好幾倍。

o1的發布無疑將加速AI領域的競爭。OpenAI的API負責人表示:"如果你過去有個產品想法,當時的模型不太行,不夠智能,現在你再試試。"這句話暗示了o1可能帶來的巨大影響。

隨著o1的推出,我們似乎已經站在了AGI時代的門檻上。AI的能力正在以驚人的速度增長,而這可能只是開始。未來,AI將如何改變我們的世界?我們又該如何應對這一變革?這些問題值得我們深思。

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.