Google DeepMind 推出用於解決高級數學問題的人工智慧模型

更新 發佈閱讀 4 分鐘

Google LLC 的人工智慧研究部門 Google DeepMind今天推出了兩種新的人工智慧模型 ,它們能夠進行高級數學推理,以解決當前模型難以解決的複雜數學問題。

該公司推出了 AlphaProof(一種能夠進行形式數學推理的強化學習模型)和 AlphaGeometry 2(該公司現有幾何求解系統的改進版本) 。

DeepMind 表示, 需要先進的數學推理來為開發通用人工智慧 (AGI) 鋪平道路。這是人工智慧開發的“聖杯”,涉及生產能夠像人類一樣自學、理解和應用知識的電腦系統。

為了測試這兩個模型,DeepMind 讓它們與今年國際數學奧林匹克競賽中的問題進行比較。 這是歷史最悠久、最負盛名的青年數學家競賽,自 1959 年以來每年舉辦一次。

研究團隊將這兩種模型應用於六個問題,並 共同解決了其中四個問題,達到了與銀牌得主相同的熟練程度。AlphaProof 解決了兩道代數問題和一個數論問題,而 AlphaGeometry 2 解決了幾何問題。其餘兩個組合問題仍未解決。

AlphaProof 的工作原理是用形式語言 Lean證明數學陳述。它是使用預訓練語言模型AlphaZero構建的,這是一種強化學習演算法,該演算法之前自學掌握了國際象棋、將棋和圍棋遊戲。形式語言允許以可驗證正確性的方式表示數學方程,但可用於人工智慧演算法的人工編寫資料數量有限。

相較之下,使用自然語言而不是形式語言的大型語言模型往往會產生幻覺,即使有大量人類產生的數據,也會提供看似合理但錯誤的答案。

DeepMind 研究人員表示:「我們透過微調Gemini 模型,自動將自然語言問題陳述翻譯​​成正式陳述,從而在這兩個互補領域之間建立了一座橋樑,從而創建了一個包含不同難度的正式問題的大型庫。

Gemini是 Google 最大、能力最強的大型語言模型,也是該公司Gemini 聊天機器人背後的法學碩士。它可以進行對話、回答問題、執行高階文字產生、總結文字和產生程式碼。

研究人員透過證明和反駁廣泛的數學主題領域和困難中的數百萬個潛在問題來訓練 AlphaProof。比賽期間應用相同的訓練循環來自行生成比賽問題的變體,直到找到解決方案。

AlphaGeometry 2 也是基於 Gemini 和神經符號系統的混合模型,該模型從頭開始訓練,合成資料比其前身AlphaGeometry多一個數量級。

研究人員表示:“這有助於模型解決更具挑戰性的幾何問題,包括物體運動以及角度、比率或距離方程式的問題。”

團隊表示,該車型中的象徵性引擎的速度也是前身的兩倍。它使用專門的知識共享機制來發現幾何解決方案,使用搜尋樹來理解複雜的問題。

由於這些升級,AlphaGeometry 2 能夠解決過去 25 年所有歷史 IMO 幾何問題的 83%,而先前的模型的解決率僅為 53%。研究人員表示,該模型在形式化後 19 秒內就解決了問題 4。

團隊還嘗試了使用 Gemini 建立的自然語言推理。該系統不需要將問題翻譯成正式語言,因此可以與其他人工智慧系統結合。研究人員表示,它針對今年 IMO 的問題進行了測試,“結果顯示出巨大的希望”。

集仕多公司開發人工智慧AI直播主,24/7 可用性:AI 直播主可以隨時隨地進行直播,無需休息,這使得它們非常適合需要長時間運營的頻道或平台。成本效益:雖然開發和維護AI 直播主需要投入一定的成本,但相比於僱用真人主播的長期薪資和福利成本,AI 直播主的運行成本相對較低。一致性和可靠性:AI 直播主能夠保持一致的表現和語調,不會受到情緒波動、疲勞或個人問題的影響,從而提供穩定的觀看體驗。多語言支持:AI 直播主可以輕鬆地支持多種語言,並且能夠快速學習和適應新的語言和方言,從而吸引更廣泛的觀眾群體。互動性:AI 直播主可以通過自然語言處理技術與觀眾進行互動,回答問題、進行即時對話,提升觀眾的參與感和互動體驗。數據分析能力:AI 直播主可以即時分析觀眾的反饋和數據,根據觀眾的偏好和行為調整內容,提高直播的吸引力和效果。創新和多樣性:AI 直播主可以根據需要進行各種創新和定制,從而創造出多樣化的內容形式和風格,滿足不同觀眾的需求。無地域限制:AI 直播主可以在任何地方進行直播,不受地理位置的限制,從而可以觸及全球的觀眾。


留言
avatar-img
留言分享你的想法!
avatar-img
Moi Writer Chu的沙龍
1會員
8內容數
2024/08/27
輝達 (NVIDIA, NVDA-US) 宣布推出四款全新的 NVIDIA NIM 微服務,專為台灣和日本市場量身定制,能夠根據當地語言和文化特點提供精確的理解和回應。這些服務旨在提升使用者互動,並使開發人員更輕鬆地構建和部署高效能的生成式 AI 應用。目前,台灣的和碩、欣興以及長春集團等公司已經採
2024/08/27
輝達 (NVIDIA, NVDA-US) 宣布推出四款全新的 NVIDIA NIM 微服務,專為台灣和日本市場量身定制,能夠根據當地語言和文化特點提供精確的理解和回應。這些服務旨在提升使用者互動,並使開發人員更輕鬆地構建和部署高效能的生成式 AI 應用。目前,台灣的和碩、欣興以及長春集團等公司已經採
2024/07/13
台南市長賴清德今(18)日出席校方記者會表示,非常樂見學校能繼續根留台南,讓在地學子免於外地奔波求學的辛苦,市府也會盡力協助學校改善周邊環境,包括交通、水利等措施,以造福更多師生及家長。 賴市長致詞表示,作為地方首長,他很高興真理大學能夠繼續根留台南,尤其真理大學在台南已經有16年歷史,頗有規模水
2024/07/13
台南市長賴清德今(18)日出席校方記者會表示,非常樂見學校能繼續根留台南,讓在地學子免於外地奔波求學的辛苦,市府也會盡力協助學校改善周邊環境,包括交通、水利等措施,以造福更多師生及家長。 賴市長致詞表示,作為地方首長,他很高興真理大學能夠繼續根留台南,尤其真理大學在台南已經有16年歷史,頗有規模水
2024/05/08
在當今的數位時代,文案寫作經歷了深刻的變革,為嶄露頭角的作家帶來了巨大的挑戰和光明的前景。隨著網路平台的無所不在和內容的不斷流動,掌握說服性寫作的藝術具有前所未有的重要性。這份詳盡的指南為有志於 2024 年從事文案寫作職業的個人提供了全面的路線圖。近年來更興起AI文案寫作。 文案寫作的演變 隨
2024/05/08
在當今的數位時代,文案寫作經歷了深刻的變革,為嶄露頭角的作家帶來了巨大的挑戰和光明的前景。隨著網路平台的無所不在和內容的不斷流動,掌握說服性寫作的藝術具有前所未有的重要性。這份詳盡的指南為有志於 2024 年從事文案寫作職業的個人提供了全面的路線圖。近年來更興起AI文案寫作。 文案寫作的演變 隨
看更多
你可能也想看
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
AlphaGo 的開發,讓人工智慧在圍棋的研究讓更多人被看到,也看到它成熟的結果。現代的圍棋教學和棋手訓練,也或多或少會借鏡各類的AI系統做學習。然而,教學的歷程,過度追求AI的棋步和棋法,有時會讓小朋友難以理解。一步登天的方式,有時反而會讓同學走得更坎坷。
Thumbnail
AlphaGo 的開發,讓人工智慧在圍棋的研究讓更多人被看到,也看到它成熟的結果。現代的圍棋教學和棋手訓練,也或多或少會借鏡各類的AI系統做學習。然而,教學的歷程,過度追求AI的棋步和棋法,有時會讓小朋友難以理解。一步登天的方式,有時反而會讓同學走得更坎坷。
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
Google最新發表了針對學習進行微調的Gemini新模型系列「LearnLM」,將學習科學原理融入模型及其支援的產品中,包括Google搜尋、Gems、YouTube和Google Classroom。這些新功能將對教育工作者和學習者產生深遠的影響。
Thumbnail
Google最新發表了針對學習進行微調的Gemini新模型系列「LearnLM」,將學習科學原理融入模型及其支援的產品中,包括Google搜尋、Gems、YouTube和Google Classroom。這些新功能將對教育工作者和學習者產生深遠的影響。
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News