Google DeepMind 推出用於解決高級數學問題的人工智慧模型

2024/07/25 更新2024/07/25 發佈閱讀 4 分鐘

Google LLC 的人工智慧研究部門 Google DeepMind今天推出了兩種新的人工智慧模型，它們能夠進行高級數學推理，以解決當前模型難以解決的複雜數學問題。

該公司推出了 AlphaProof（一種能夠進行形式數學推理的強化學習模型）和 AlphaGeometry 2（該公司現有幾何求解系統的改進版本）。

DeepMind 表示，需要先進的數學推理來為開發通用人工智慧 (AGI) 鋪平道路。這是人工智慧開發的“聖杯”，涉及生產能夠像人類一樣自學、理解和應用知識的電腦系統。

為了測試這兩個模型，DeepMind 讓它們與今年國際數學奧林匹克競賽中的問題進行比較。這是歷史最悠久、最負盛名的青年數學家競賽，自 1959 年以來每年舉辦一次。

研究團隊將這兩種模型應用於六個問題，並共同解決了其中四個問題，達到了與銀牌得主相同的熟練程度。AlphaProof 解決了兩道代數問題和一個數論問題，而 AlphaGeometry 2 解決了幾何問題。其餘兩個組合問題仍未解決。

AlphaProof 的工作原理是用形式語言 Lean證明數學陳述。它是使用預訓練語言模型AlphaZero構建的，這是一種強化學習演算法，該演算法之前自學掌握了國際象棋、將棋和圍棋遊戲。形式語言允許以可驗證正確性的方式表示數學方程，但可用於人工智慧演算法的人工編寫資料數量有限。

相較之下，使用自然語言而不是形式語言的大型語言模型往往會產生幻覺，即使有大量人類產生的數據，也會提供看似合理但錯誤的答案。

DeepMind 研究人員表示：「我們透過微調Gemini 模型，自動將自然語言問題陳述翻譯成正式陳述，從而在這兩個互補領域之間建立了一座橋樑，從而創建了一個包含不同難度的正式問題的大型庫。

Gemini是 Google 最大、能力最強的大型語言模型，也是該公司Gemini 聊天機器人背後的法學碩士。它可以進行對話、回答問題、執行高階文字產生、總結文字和產生程式碼。

研究人員透過證明和反駁廣泛的數學主題領域和困難中的數百萬個潛在問題來訓練 AlphaProof。比賽期間應用相同的訓練循環來自行生成比賽問題的變體，直到找到解決方案。

AlphaGeometry 2 也是基於 Gemini 和神經符號系統的混合模型，該模型從頭開始訓練，合成資料比其前身AlphaGeometry多一個數量級。

研究人員表示：“這有助於模型解決更具挑戰性的幾何問題，包括物體運動以及角度、比率或距離方程式的問題。”

團隊表示，該車型中的象徵性引擎的速度也是前身的兩倍。它使用專門的知識共享機制來發現幾何解決方案，使用搜尋樹來理解複雜的問題。

由於這些升級，AlphaGeometry 2 能夠解決過去 25 年所有歷史 IMO 幾何問題的 83%，而先前的模型的解決率僅為 53%。研究人員表示，該模型在形式化後 19 秒內就解決了問題 4。

團隊還嘗試了使用 Gemini 建立的自然語言推理。該系統不需要將問題翻譯成正式語言，因此可以與其他人工智慧系統結合。研究人員表示，它針對今年 IMO 的問題進行了測試，“結果顯示出巨大的希望”。

集仕多公司開發人工智慧AI直播主，24/7 可用性：AI 直播主可以隨時隨地進行直播，無需休息，這使得它們非常適合需要長時間運營的頻道或平台。成本效益：雖然開發和維護AI 直播主需要投入一定的成本，但相比於僱用真人主播的長期薪資和福利成本，AI 直播主的運行成本相對較低。一致性和可靠性：AI 直播主能夠保持一致的表現和語調，不會受到情緒波動、疲勞或個人問題的影響，從而提供穩定的觀看體驗。多語言支持：AI 直播主可以輕鬆地支持多種語言，並且能夠快速學習和適應新的語言和方言，從而吸引更廣泛的觀眾群體。互動性：AI 直播主可以通過自然語言處理技術與觀眾進行互動，回答問題、進行即時對話，提升觀眾的參與感和互動體驗。數據分析能力：AI 直播主可以即時分析觀眾的反饋和數據，根據觀眾的偏好和行為調整內容，提高直播的吸引力和效果。創新和多樣性：AI 直播主可以根據需要進行各種創新和定制，從而創造出多樣化的內容形式和風格，滿足不同觀眾的需求。無地域限制：AI 直播主可以在任何地方進行直播，不受地理位置的限制，從而可以觸及全球的觀眾。

留言

Moi Writer Chu的沙龍

1會員

8內容數

Moi Writer Chu的沙龍的其他內容

2024/08/27

輝達推出區域語言模型

輝達 (NVIDIA, NVDA-US) 宣布推出四款全新的 NVIDIA NIM 微服務，專為台灣和日本市場量身定制，能夠根據當地語言和文化特點提供精確的理解和回應。這些服務旨在提升使用者互動，並使開發人員更輕鬆地構建和部署高效能的生成式 AI 應用。目前，台灣的和碩、欣興以及長春集團等公司已經採

2024/08/27

輝達推出區域語言模型

2024/07/13

真理大學賴清德承諾給予最大協助

台南市長賴清德今(18)日出席校方記者會表示，非常樂見學校能繼續根留台南，讓在地學子免於外地奔波求學的辛苦，市府也會盡力協助學校改善周邊環境，包括交通、水利等措施，以造福更多師生及家長。賴市長致詞表示，作為地方首長，他很高興真理大學能夠繼續根留台南，尤其真理大學在台南已經有16年歷史，頗有規模水

2024/07/13

真理大學賴清德承諾給予最大協助

2024/05/08

如何成為 Copywriter

在當今的數位時代，文案寫作經歷了深刻的變革，為嶄露頭角的作家帶來了巨大的挑戰和光明的前景。隨著網路平台的無所不在和內容的不斷流動，掌握說服性寫作的藝術具有前所未有的重要性。這份詳盡的指南為有志於 2024 年從事文案寫作職業的個人提供了全面的路線圖。近年來更興起AI文案寫作。文案寫作的演變隨

2024/05/08

如何成為 Copywriter

看更多

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

vocus 最具指標性的創作者社群──「野格團」， 2026 年春季，這支充滿專業、熱情的團隊再次擴編，迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇，他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

#創作#創作者推薦#靈感

2026/03/25

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

Baozilla, Let's go!

20240726_TechNEws

OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」，由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布，該引擎能結合來自網路的即時資訊，讓使用者像與 ChatGPT 交談一樣搜尋。透過 SearchGPT，用戶能以自然語言提出問題（與使用 ChatGPT 交談方式相同

2024/07/26

Baozilla, Let's go!

20240726_TechNEws

2024/07/26

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

#ChatGPT#AlphaGo#人工智慧

2024/07/19

中央棋院

AlphaGo 的開發

AlphaGo 的開發，讓人工智慧在圍棋的研究讓更多人被看到，也看到它成熟的結果。現代的圍棋教學和棋手訓練，也或多或少會借鏡各類的AI系統做學習。然而，教學的歷程，過度追求AI的棋步和棋法，有時會讓小朋友難以理解。一步登天的方式，有時反而會讓同學走得更坎坷。

2024/07/17

2024/07/17

NotebookLM：Google 結合 AI 最新推出的筆記本工具，讓你生成問題、快速摘要，以及建立專屬知識庫

隨著 AI 技術的進步，Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔，還能幫助你建立專屬知識庫。今天，我將介紹 NotebookLM 是什麼、如何使用它，以及在三種不同情境中的應用方法。

#科技#學習#數位

2024/07/03

窩 World

NotebookLM：Google 結合 AI 最新推出的筆記本工具，讓你生成問題、快速摘要，以及建立專屬知識庫

#科技#學習#數位

2024/07/03

學習玩家｜啟動玩心學習

Google AI 發表：LearnLM 融入既有教育產品，很有潛力對教育產生大幫助

Google最新發表了針對學習進行微調的Gemini新模型系列「LearnLM」，將學習科學原理融入模型及其支援的產品中，包括Google搜尋、Gems、YouTube和Google Classroom。這些新功能將對教育工作者和學習者產生深遠的影響。

#Google#教育#GPT-4o

2024/05/15

學習玩家｜啟動玩心學習

Google AI 發表：LearnLM 融入既有教育產品，很有潛力對教育產生大幫助

#Google#教育#GPT-4o

2024/05/15

大勢男寫手的沙龍

在香港如何使用 Google Gemini？

什麼是 Google Gemini？ Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族，繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布，包括 Gemini Ultra、Pro 和 Nano，旨在超越 OpenAI 的 GPT-4

#AI#科技

2024/04/19

大勢男寫手的沙龍

在香港如何使用 Google Gemini？

#AI#科技

2024/04/19

Homeless Cosmopolitans' 實驗沙龍

【科學科技一科燙手報 Mk.2】：Google新發表的開源AI模型Gemma | 燙手度4天

大部分的人都知道Open AI的ChatGPT，部份的人知道Perplexity一類的生成式AI模型，還有一些人知道Google研發的生成式AI模型：Gemini (意思是拉丁文的雙生)。但幾小時前開放給開發者及研究者的開源AI模型Gemma（意思是拉丁文珍貴的石頭）大概沒什麼知道，

#Gemma#Google#AI

2024/02/25

Homeless Cosmopolitans' 實驗沙龍

【科學科技一科燙手報 Mk.2】：Google新發表的開源AI模型Gemma | 燙手度4天

#Gemma#Google#AI

2024/02/25

美國人力資源港 - 九思觀點

何謂「人工智能」？What is AI?

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

2024/02/23

2024/02/23

Google 發表新 AI 模型 Gemini 1.5，提供更大的「腦容量」和效率

今天 Google 發表了最新的 AI 模型 Gemini 1.5，不只提高模型訓練和服務效率，而且擁有更強大的理解力，每次能處理的 token 長度更是一口氣突破 100 萬大關，是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度)，可以處理更大量的資訊，也擁有更大

#Google#模型#GPT-4

2024/02/17

手哥科科

Google 發表新 AI 模型 Gemini 1.5，提供更大的「腦容量」和效率

#Google#模型#GPT-4

2024/02/17

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News