Google DeepMind 推出用於解決高級數學問題的人工智慧模型

閱讀時間約 4 分鐘

Google LLC 的人工智慧研究部門 Google DeepMind今天推出了兩種新的人工智慧模型 ,它們能夠進行高級數學推理,以解決當前模型難以解決的複雜數學問題。

該公司推出了 AlphaProof(一種能夠進行形式數學推理的強化學習模型)和 AlphaGeometry 2(該公司現有幾何求解系統的改進版本) 。

DeepMind 表示, 需要先進的數學推理來為開發通用人工智慧 (AGI) 鋪平道路。這是人工智慧開發的“聖杯”,涉及生產能夠像人類一樣自學、理解和應用知識的電腦系統。

為了測試這兩個模型,DeepMind 讓它們與今年國際數學奧林匹克競賽中的問題進行比較。 這是歷史最悠久、最負盛名的青年數學家競賽,自 1959 年以來每年舉辦一次。

研究團隊將這兩種模型應用於六個問題,並 共同解決了其中四個問題,達到了與銀牌得主相同的熟練程度。AlphaProof 解決了兩道代數問題和一個數論問題,而 AlphaGeometry 2 解決了幾何問題。其餘兩個組合問題仍未解決。

AlphaProof 的工作原理是用形式語言 Lean證明數學陳述。它是使用預訓練語言模型AlphaZero構建的,這是一種強化學習演算法,該演算法之前自學掌握了國際象棋、將棋和圍棋遊戲。形式語言允許以可驗證正確性的方式表示數學方程,但可用於人工智慧演算法的人工編寫資料數量有限。

相較之下,使用自然語言而不是形式語言的大型語言模型往往會產生幻覺,即使有大量人類產生的數據,也會提供看似合理但錯誤的答案。

DeepMind 研究人員表示:「我們透過微調Gemini 模型,自動將自然語言問題陳述翻譯​​成正式陳述,從而在這兩個互補領域之間建立了一座橋樑,從而創建了一個包含不同難度的正式問題的大型庫。

Gemini是 Google 最大、能力最強的大型語言模型,也是該公司Gemini 聊天機器人背後的法學碩士。它可以進行對話、回答問題、執行高階文字產生、總結文字和產生程式碼。

研究人員透過證明和反駁廣泛的數學主題領域和困難中的數百萬個潛在問題來訓練 AlphaProof。比賽期間應用相同的訓練循環來自行生成比賽問題的變體,直到找到解決方案。

AlphaGeometry 2 也是基於 Gemini 和神經符號系統的混合模型,該模型從頭開始訓練,合成資料比其前身AlphaGeometry多一個數量級。

研究人員表示:“這有助於模型解決更具挑戰性的幾何問題,包括物體運動以及角度、比率或距離方程式的問題。”

團隊表示,該車型中的象徵性引擎的速度也是前身的兩倍。它使用專門的知識共享機制來發現幾何解決方案,使用搜尋樹來理解複雜的問題。

由於這些升級,AlphaGeometry 2 能夠解決過去 25 年所有歷史 IMO 幾何問題的 83%,而先前的模型的解決率僅為 53%。研究人員表示,該模型在形式化後 19 秒內就解決了問題 4。

團隊還嘗試了使用 Gemini 建立的自然語言推理。該系統不需要將問題翻譯成正式語言,因此可以與其他人工智慧系統結合。研究人員表示,它針對今年 IMO 的問題進行了測試,“結果顯示出巨大的希望”。

集仕多公司開發人工智慧AI直播主,24/7 可用性:AI 直播主可以隨時隨地進行直播,無需休息,這使得它們非常適合需要長時間運營的頻道或平台。成本效益:雖然開發和維護AI 直播主需要投入一定的成本,但相比於僱用真人主播的長期薪資和福利成本,AI 直播主的運行成本相對較低。一致性和可靠性:AI 直播主能夠保持一致的表現和語調,不會受到情緒波動、疲勞或個人問題的影響,從而提供穩定的觀看體驗。多語言支持:AI 直播主可以輕鬆地支持多種語言,並且能夠快速學習和適應新的語言和方言,從而吸引更廣泛的觀眾群體。互動性:AI 直播主可以通過自然語言處理技術與觀眾進行互動,回答問題、進行即時對話,提升觀眾的參與感和互動體驗。數據分析能力:AI 直播主可以即時分析觀眾的反饋和數據,根據觀眾的偏好和行為調整內容,提高直播的吸引力和效果。創新和多樣性:AI 直播主可以根據需要進行各種創新和定制,從而創造出多樣化的內容形式和風格,滿足不同觀眾的需求。無地域限制:AI 直播主可以在任何地方進行直播,不受地理位置的限制,從而可以觸及全球的觀眾。


留言0
查看全部
發表第一個留言支持創作者!
Moi Writer Chu的沙龍 的其他內容
台南市長賴清德今(18)日出席校方記者會表示,非常樂見學校能繼續根留台南,讓在地學子免於外地奔波求學的辛苦,市府也會盡力協助學校改善周邊環境,包括交通、水利等措施,以造福更多師生及家長。 賴市長致詞表示,作為地方首長,他很高興真理大學能夠繼續根留台南,尤其真理大學在台南已經有16年歷史,頗有規模水
在當今的數位時代,文案寫作經歷了深刻的變革,為嶄露頭角的作家帶來了巨大的挑戰和光明的前景。隨著網路平台的無所不在和內容的不斷流動,掌握說服性寫作的藝術具有前所未有的重要性。這份詳盡的指南為有志於 2024 年從事文案寫作職業的個人提供了全面的路線圖。近年來更興起AI文案寫作。 文案寫作的演變 隨
從文字輸入建立 3D 頭像動畫代表了重大飛躍。想像一下,只需輸入幾句話,就可以看到一個詳細、栩栩如生的頭像在螢幕上栩栩如生,並以逼真的動畫移動。這項技術並不是科幻小說中的幻想;而是一種技術。這是由尖端人工智慧 (AI) 驅動的令人興奮的現實。文字描述向動畫角色的轉變正在重塑數位創造力,並為個
人工智慧去年讓科技界火熱起來,而且這種勢頭不會很快停止。 由於人工智慧,全球近四分之一的工作預計將在未來五年內發生變化,由於只有一小部分工人具備該領域的技能,因此急於了解人工智慧的詳細情況變得更加重要。 麻省理工學院斯隆管理學院工作與組織研究教授 Jared Curham 表示:“人工智慧正
人工智慧(AI)已成為社會流行語,尤其是近年來ChatGPT等先進人工智慧平台受到廣泛關注。然而,即使在人工智慧成為家喻戶曉的術語之前,它就已經透過 Google Ads 等平台嵌入到數位行銷策略的結構中。例如:AI廣告投手。 谷歌一直是利用人工智慧改變廣告格局的先驅,利用機器學習和自動化幫助企業
Google地圖上有評論功能,民眾能自行在各景點、餐廳上給予1至5顆星星,或留言點評店家。日本有63名醫師於18日表示曾遭人給過「1星負評」、發表不正確的評論,導致聲譽受損,礙於「保密義務」無法反駁,要求Google刪除也未全部獲准,因此集體向Google美國總公司提告,索賠140萬9千日圓(約
台南市長賴清德今(18)日出席校方記者會表示,非常樂見學校能繼續根留台南,讓在地學子免於外地奔波求學的辛苦,市府也會盡力協助學校改善周邊環境,包括交通、水利等措施,以造福更多師生及家長。 賴市長致詞表示,作為地方首長,他很高興真理大學能夠繼續根留台南,尤其真理大學在台南已經有16年歷史,頗有規模水
在當今的數位時代,文案寫作經歷了深刻的變革,為嶄露頭角的作家帶來了巨大的挑戰和光明的前景。隨著網路平台的無所不在和內容的不斷流動,掌握說服性寫作的藝術具有前所未有的重要性。這份詳盡的指南為有志於 2024 年從事文案寫作職業的個人提供了全面的路線圖。近年來更興起AI文案寫作。 文案寫作的演變 隨
從文字輸入建立 3D 頭像動畫代表了重大飛躍。想像一下,只需輸入幾句話,就可以看到一個詳細、栩栩如生的頭像在螢幕上栩栩如生,並以逼真的動畫移動。這項技術並不是科幻小說中的幻想;而是一種技術。這是由尖端人工智慧 (AI) 驅動的令人興奮的現實。文字描述向動畫角色的轉變正在重塑數位創造力,並為個
人工智慧去年讓科技界火熱起來,而且這種勢頭不會很快停止。 由於人工智慧,全球近四分之一的工作預計將在未來五年內發生變化,由於只有一小部分工人具備該領域的技能,因此急於了解人工智慧的詳細情況變得更加重要。 麻省理工學院斯隆管理學院工作與組織研究教授 Jared Curham 表示:“人工智慧正
人工智慧(AI)已成為社會流行語,尤其是近年來ChatGPT等先進人工智慧平台受到廣泛關注。然而,即使在人工智慧成為家喻戶曉的術語之前,它就已經透過 Google Ads 等平台嵌入到數位行銷策略的結構中。例如:AI廣告投手。 谷歌一直是利用人工智慧改變廣告格局的先驅,利用機器學習和自動化幫助企業
Google地圖上有評論功能,民眾能自行在各景點、餐廳上給予1至5顆星星,或留言點評店家。日本有63名醫師於18日表示曾遭人給過「1星負評」、發表不正確的評論,導致聲譽受損,礙於「保密義務」無法反駁,要求Google刪除也未全部獲准,因此集體向Google美國總公司提告,索賠140萬9千日圓(約
你可能也想看
Thumbnail
「設計不僅僅是外觀和感覺。設計是其運作的方式。」 — Steve Jobs 身為一個獨立文案,許多人會以為我們的生活只需要面對電腦,從無到有,用精巧的文字填滿空白的螢幕,呈現心目中獨具風格的作品。 ——有的時候可以如此,但其實這是我們夢寐以求的偶發日常。 更多的時候,白天的工作時間總被各種繁雜
Thumbnail
台股、美股近期明顯回檔,市場敘事發生改變,壞消息一樁接一樁出現,下一步該怎麼走呢?本文將探討近期的宏觀經濟事件,並分享個人的操作思考。
Thumbnail
在E70的影片中,Meiko跟大家分享Excel版本的十字光標設定,收到很多同學的回饋,最近有同學提到,也想在Google Sheets上執行光標標註的功能,Meiko原以為蠻簡單的,後來實操之後發現並不容易,於是請教了AI,意外的設計出一個光標控制面板,我覺得很方便,分享給大家~
Thumbnail
您有開店嗎? 如果有,本篇文章會一口氣讓您了解什麼是Google地圖廣告? 讓你了解Google廣告到底能幫助您什麼? Google地圖廣告又是如何成為店家們一定要有的武器!
Thumbnail
Struggling to decide between the current and latest app version on Google Play? This article explains both versions and helps you choose the right one
Thumbnail
來自 Google 威脅分析小組 (Threat Analysis Group,TAG) 和 Mandiant 的綜合數據顯示,2023 年有 97 宗零日漏洞攻擊; 較 2022 年發現的 62 宗零日漏洞數字大幅增加,但仍較 2021 年 106 宗零日漏洞攻擊的數字低。 TAG 和 Mand
Thumbnail
不知道什麼時候開始,養成了從Google評論挑選店家的習慣,不管是自己出門還是和朋友出門,不管走到哪,也不管是找吃的還是找景點。許多時候,都已經站在店家的門口了,還是得先站到距離店門有一點點位置的地方,打開手機先查一下評價如何。 這作法大部分的時候滿可靠的,只要能夠辨識出哪些評論是店家透過利誘獲得
Google Workspace 你會用了嗎?全面教學來啦!不管是團隊協作還是企業溝通,都可以通過Google Workspace的全套辦公軟體工具來完成!特別是深受企業歡迎的Gmail,我們也為你準備好了一系列設定攻略,簡單幾步就能完成!
Thumbnail
Google Cloud Professional Network Engineer 出題方向/學習資源/心得整理
在當今高度競爭的數字市場中,了解潛在客戶的搜索習慣和需求是成功的關鍵。而Google關鍵字規劃工具就是一個無價之寶,能夠幫助深入了解用戶行為,找到最佳的行銷策略。本篇文章介紹使用Google關鍵字規劃工具的幾大好處。
Thumbnail
本文介紹了 Google Cloud 的網絡服務層級之間的差異。讀者可以瞭解到 Google Cloud 的 VPC(Virtual Private Cloud)具有全球級的特點,以及 Premium Tier 和 Standard Tier 之間不同的差異。
Thumbnail
甲骨文曾控告 Google 違反其著作權,美國最高法院宣告 Google 勝訴,長達 10 年訴訟案終於落幕。 併購昇陽的甲骨文,在 2010 年控告 Google 侵犯其著作權,不僅影響數百億美金的手機市場,也牽動軟體業的運行方式,被稱為「十年來最重要的著作權案」。
Thumbnail
「設計不僅僅是外觀和感覺。設計是其運作的方式。」 — Steve Jobs 身為一個獨立文案,許多人會以為我們的生活只需要面對電腦,從無到有,用精巧的文字填滿空白的螢幕,呈現心目中獨具風格的作品。 ——有的時候可以如此,但其實這是我們夢寐以求的偶發日常。 更多的時候,白天的工作時間總被各種繁雜
Thumbnail
台股、美股近期明顯回檔,市場敘事發生改變,壞消息一樁接一樁出現,下一步該怎麼走呢?本文將探討近期的宏觀經濟事件,並分享個人的操作思考。
Thumbnail
在E70的影片中,Meiko跟大家分享Excel版本的十字光標設定,收到很多同學的回饋,最近有同學提到,也想在Google Sheets上執行光標標註的功能,Meiko原以為蠻簡單的,後來實操之後發現並不容易,於是請教了AI,意外的設計出一個光標控制面板,我覺得很方便,分享給大家~
Thumbnail
您有開店嗎? 如果有,本篇文章會一口氣讓您了解什麼是Google地圖廣告? 讓你了解Google廣告到底能幫助您什麼? Google地圖廣告又是如何成為店家們一定要有的武器!
Thumbnail
Struggling to decide between the current and latest app version on Google Play? This article explains both versions and helps you choose the right one
Thumbnail
來自 Google 威脅分析小組 (Threat Analysis Group,TAG) 和 Mandiant 的綜合數據顯示,2023 年有 97 宗零日漏洞攻擊; 較 2022 年發現的 62 宗零日漏洞數字大幅增加,但仍較 2021 年 106 宗零日漏洞攻擊的數字低。 TAG 和 Mand
Thumbnail
不知道什麼時候開始,養成了從Google評論挑選店家的習慣,不管是自己出門還是和朋友出門,不管走到哪,也不管是找吃的還是找景點。許多時候,都已經站在店家的門口了,還是得先站到距離店門有一點點位置的地方,打開手機先查一下評價如何。 這作法大部分的時候滿可靠的,只要能夠辨識出哪些評論是店家透過利誘獲得
Google Workspace 你會用了嗎?全面教學來啦!不管是團隊協作還是企業溝通,都可以通過Google Workspace的全套辦公軟體工具來完成!特別是深受企業歡迎的Gmail,我們也為你準備好了一系列設定攻略,簡單幾步就能完成!
Thumbnail
Google Cloud Professional Network Engineer 出題方向/學習資源/心得整理
在當今高度競爭的數字市場中,了解潛在客戶的搜索習慣和需求是成功的關鍵。而Google關鍵字規劃工具就是一個無價之寶,能夠幫助深入了解用戶行為,找到最佳的行銷策略。本篇文章介紹使用Google關鍵字規劃工具的幾大好處。
Thumbnail
本文介紹了 Google Cloud 的網絡服務層級之間的差異。讀者可以瞭解到 Google Cloud 的 VPC(Virtual Private Cloud)具有全球級的特點,以及 Premium Tier 和 Standard Tier 之間不同的差異。
Thumbnail
甲骨文曾控告 Google 違反其著作權,美國最高法院宣告 Google 勝訴,長達 10 年訴訟案終於落幕。 併購昇陽的甲骨文,在 2010 年控告 Google 侵犯其著作權,不僅影響數百億美金的手機市場,也牽動軟體業的運行方式,被稱為「十年來最重要的著作權案」。