2024-07-25|閱讀時間 ‧ 約 26 分鐘

Google DeepMind 推出用於解決高級數學問題的人工智慧模型

Google LLC 的人工智慧研究部門 Google DeepMind今天推出了兩種新的人工智慧模型 ,它們能夠進行高級數學推理,以解決當前模型難以解決的複雜數學問題。

該公司推出了 AlphaProof(一種能夠進行形式數學推理的強化學習模型)和 AlphaGeometry 2(該公司現有幾何求解系統的改進版本) 。

DeepMind 表示, 需要先進的數學推理來為開發通用人工智慧 (AGI) 鋪平道路。這是人工智慧開發的“聖杯”,涉及生產能夠像人類一樣自學、理解和應用知識的電腦系統。

為了測試這兩個模型,DeepMind 讓它們與今年國際數學奧林匹克競賽中的問題進行比較。 這是歷史最悠久、最負盛名的青年數學家競賽,自 1959 年以來每年舉辦一次。

研究團隊將這兩種模型應用於六個問題,並 共同解決了其中四個問題,達到了與銀牌得主相同的熟練程度。AlphaProof 解決了兩道代數問題和一個數論問題,而 AlphaGeometry 2 解決了幾何問題。其餘兩個組合問題仍未解決。

AlphaProof 的工作原理是用形式語言 Lean證明數學陳述。它是使用預訓練語言模型AlphaZero構建的,這是一種強化學習演算法,該演算法之前自學掌握了國際象棋、將棋和圍棋遊戲。形式語言允許以可驗證正確性的方式表示數學方程,但可用於人工智慧演算法的人工編寫資料數量有限。

相較之下,使用自然語言而不是形式語言的大型語言模型往往會產生幻覺,即使有大量人類產生的數據,也會提供看似合理但錯誤的答案。

DeepMind 研究人員表示:「我們透過微調Gemini 模型,自動將自然語言問題陳述翻譯​​成正式陳述,從而在這兩個互補領域之間建立了一座橋樑,從而創建了一個包含不同難度的正式問題的大型庫。

Gemini是 Google 最大、能力最強的大型語言模型,也是該公司Gemini 聊天機器人背後的法學碩士。它可以進行對話、回答問題、執行高階文字產生、總結文字和產生程式碼。

研究人員透過證明和反駁廣泛的數學主題領域和困難中的數百萬個潛在問題來訓練 AlphaProof。比賽期間應用相同的訓練循環來自行生成比賽問題的變體,直到找到解決方案。

AlphaGeometry 2 也是基於 Gemini 和神經符號系統的混合模型,該模型從頭開始訓練,合成資料比其前身AlphaGeometry多一個數量級。

研究人員表示:“這有助於模型解決更具挑戰性的幾何問題,包括物體運動以及角度、比率或距離方程式的問題。”

團隊表示,該車型中的象徵性引擎的速度也是前身的兩倍。它使用專門的知識共享機制來發現幾何解決方案,使用搜尋樹來理解複雜的問題。

由於這些升級,AlphaGeometry 2 能夠解決過去 25 年所有歷史 IMO 幾何問題的 83%,而先前的模型的解決率僅為 53%。研究人員表示,該模型在形式化後 19 秒內就解決了問題 4。

團隊還嘗試了使用 Gemini 建立的自然語言推理。該系統不需要將問題翻譯成正式語言,因此可以與其他人工智慧系統結合。研究人員表示,它針對今年 IMO 的問題進行了測試,“結果顯示出巨大的希望”。

集仕多公司開發人工智慧AI直播主,24/7 可用性:AI 直播主可以隨時隨地進行直播,無需休息,這使得它們非常適合需要長時間運營的頻道或平台。成本效益:雖然開發和維護AI 直播主需要投入一定的成本,但相比於僱用真人主播的長期薪資和福利成本,AI 直播主的運行成本相對較低。一致性和可靠性:AI 直播主能夠保持一致的表現和語調,不會受到情緒波動、疲勞或個人問題的影響,從而提供穩定的觀看體驗。多語言支持:AI 直播主可以輕鬆地支持多種語言,並且能夠快速學習和適應新的語言和方言,從而吸引更廣泛的觀眾群體。互動性:AI 直播主可以通過自然語言處理技術與觀眾進行互動,回答問題、進行即時對話,提升觀眾的參與感和互動體驗。數據分析能力:AI 直播主可以即時分析觀眾的反饋和數據,根據觀眾的偏好和行為調整內容,提高直播的吸引力和效果。創新和多樣性:AI 直播主可以根據需要進行各種創新和定制,從而創造出多樣化的內容形式和風格,滿足不同觀眾的需求。無地域限制:AI 直播主可以在任何地方進行直播,不受地理位置的限制,從而可以觸及全球的觀眾。


分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.