OpenAI 前幾天推出新的 AI 模型—OpenAI o1-preview,強調有更強的 “推理” 能力,能在回答前花更多時間思考,解決更複雜的問題。
接下來,我用簡單明瞭的方式,帶大家快速了解這款新模型的特點。
想每天收到最新AI新聞、與同好交流AI新知?快加入 [傑瑞AI讀書會]
o1-preview模型在科學、編程、數學等領域表現出色。這次的新模型能在國際數學奧林匹亞競賽的資格考試中正確解答83%的問題,而先前的GPT-4o僅解答了13%。在Codeforces編程競賽中,o1-preview更是達到了89百分位,讓我們看到AI在解決高難度問題上的巨大潛力。
o1-preview模型在物理、化學和生物學的挑戰中,表現已經接近博士生水準,能夠處理非常複雜的基準任務。這意味著它在未來科學研究和專業領域中有著廣泛的應用潛力。
為了讓這些AI模型在使用過程中更安全,OpenAI採用了新的訓練方法,強化模型的推理能力,確保其遵循安全和對齊指導方針。在模擬用戶試圖繞過安全規則的“越獄”測試中,o1-preview模型得分高達84分,相比GPT-4o的22分,有了明顯的進步。
為了滿足開發者的多樣化需求,OpenAI還推出了o1-mini模型。這個模型比o1-preview便宜80%,速度更快,非常適合編程任務。對於需要推理但不需大量世界知識的應用場景,o1-mini是一個強大且具成本效益的選擇。
想每天收到最新AI新聞、與同好交流AI新知?快加入 [傑瑞AI讀書會]
o1-preview特別適合解決科學、寫程式、數學等領域的複雜問題,無論是醫療研究人員註解細胞測序數據,還是物理學家生成量子光學公式,都能輕鬆應對。
ChatGPT Plus 和 Team 用戶從今天起可以在ChatGPT中使用o1-preview和o1-mini模型,初期每週訊息限制分別為30條和50條,未來會逐步提高。ChatGPT Enterprise 和 Edu 用戶則從下週開始使用。免費用戶也可期待未來能使用o1-mini。
API等級5的開發者今天就能使用這兩個模型進行原型設計,每分鐘速率限制為20 RPM。功能方面,目前API不包括功能調用、串流、支援系統訊息等。
這次推出的OpenAI o1-preview只是一個起點。未來,OpenAI計劃不斷更新這個系列,並加入更多實用功能,如網頁瀏覽、文件和圖片上傳等。
總結來說,OpenAI o1-preview開啟了AI推理能力的新篇章。這個系列不僅在專業領域展現出強大的解決問題能力,還引入了更高的安全標準,絕對是值得關注的全新突破!
想每天收到最新AI新聞、與同好交流AI新知?快加入 [傑瑞AI讀書會]