【科技快報】《Gauss:自動形式化代理|AI 破解困擾人類數月的數學證明》(2025)

更新 發佈閱讀 4 分鐘





Math Inc. 剛剛推出 Gauss ,一個 AI 系統,它僅用 三週 就解決了一項名為 強質數定理(Strong Prime Number Theorem, PNT的複雜數學定理 —— 而頂尖數學家們之前花了 18 個月 仍在掙扎中。Math Inc. 團隊推出 Gauss,是一個首創的 自動形式化代理(autoformalization agent),用於協助數學專家進行形式驗證。透過 Gauss,完成了由費爾茲獎得主 陶哲軒(Terence Tao) 與 Alex Kontorovich 在 2024 年 1 月提出的挑戰 ,在 Lean(GitHub) 中形式化 強質數定理(Strong Prime Number Theorem, PNT)。

使用 Gauss,產出了 約 25,000 行 Lean 代碼,包含超過 1,000 個定理與定義。這類規模的形式化證明在歷史上常是重大里程碑,通常需多年努力才能完成。歷來最大型的單一形式化專案通常需要十年以上、堪稱研究生涯巔峰的成果,也僅比這大一個數量級(約 500,000 行代碼)。而 Lean 的數學標準函式庫 Mathlib 則大兩個數量級,擁有 約 2,000,000 行代碼35 萬個 Lean 定理與定義,並由 600 多名貢獻者歷經 8 年建構完成。


內容摘要:

  1. Gauss 完成了由知名數學家 陶哲軒(Terence Tao)Alex Kontorovich 在 2024 年提出的強質數定理形式化挑戰。
  2. 人類專家僅在該挑戰上取得「中期進展」,數學界在 18 個月後(2025 年 7 月)才完成較簡化的 中等版本(Medium version)
  3. Gauss 可自主連續工作數小時,並生成 25,000 行經過驗證的數學程式碼,其中包含 1,000 多個相互關聯的證明與定義
  4. Math Inc. 計劃在未來 12 個月內 將數學代碼量擴展 100 到 1,000 倍,以此作為訓練數據,推動「機器數學多面手(machine polymaths)」與「驗證型超級智慧(verified superintelligence)」的發展。



重要性:

複雜數學是 推理的基礎,而 AI 正快速掌握這一領域,這是 系統能創造新思想並加深我們對世界理解 的最強信號之一。隨著 Gauss 的突破,以及 Google、OpenAI 等 在國際數學奧林匹亞中獲得金牌,AI 在數學上的加速正在飛速發生。

Gauss 展現了形式化在未來如何擴展。目前,它仍依賴數學家提供的自然語言框架,並需要高階專家的指導與開發。預期未來版本的 Gauss 將更具能力與自主性。Math Inc. 團隊將開始部署這項技術,讓數學家與證明工程師能實際使用。目前Math Inc. 團隊正與部分數學家接洽,進行封測(beta testing)。你可以在此註冊 Gauss 早期使用權。若你有關於自動形式化的雄心計劃,歡迎與Math Inc. 團隊聯繫。(👉聯絡網址:https://www.math.inc/





  • 如果你對內容有共鳴、想分享想法,
  • 歡迎在下方留言互動 💬 你的支持就是我持續寫作的動力!
  • 📮 也歡迎來信交流:childbenefits@gmail.com


留言
avatar-img
留言分享你的想法!
avatar-img
開域空間讀書會
37會員
85內容數
中原大學室內設計研究所畢。 喜歡現代詩、推理、科普、有趣的人事物,人生光譜的代表色系:天青色。 連絡信箱:childbenefits@gmail.com
開域空間讀書會的其他內容
2025/09/13
阿爾巴尼亞成為全球第一個擁有 AI 部長的國家,由人工智慧驅動的 Diella,將負責公共採購。
Thumbnail
2025/09/13
阿爾巴尼亞成為全球第一個擁有 AI 部長的國家,由人工智慧驅動的 Diella,將負責公共採購。
Thumbnail
2025/09/13
加州大學聖地牙哥分校的研究揭示太空飛行加速人類血液幹細胞老化,導致細胞功能下降、DNA損傷和端粒縮短。該研究利用創新的奈米生物反應器系統,在國際太空站即時監測幹細胞變化,為長時間太空旅行的健康風險提供了新見解,並為地球上老化及相關疾病研究提供了新的模型。
Thumbnail
2025/09/13
加州大學聖地牙哥分校的研究揭示太空飛行加速人類血液幹細胞老化,導致細胞功能下降、DNA損傷和端粒縮短。該研究利用創新的奈米生物反應器系統,在國際太空站即時監測幹細胞變化,為長時間太空旅行的健康風險提供了新見解,並為地球上老化及相關疾病研究提供了新的模型。
Thumbnail
2025/09/13
探索神經建築學如何結合設計與神經科學,揭示空間對心智的影響。從幾何形狀、色彩、照明到材質,學習如何運用設計元素打造專注、放鬆或激發靈感的理想環境,提升生活品質。
Thumbnail
2025/09/13
探索神經建築學如何結合設計與神經科學,揭示空間對心智的影響。從幾何形狀、色彩、照明到材質,學習如何運用設計元素打造專注、放鬆或激發靈感的理想環境,提升生活品質。
Thumbnail
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
高中數學主題練習—對數方程式
Thumbnail
高中數學主題練習—對數方程式
Thumbnail
預計量子AI計算會在2032年左右來到,在這之前,我們還有充足的時間可以逐步去學習量子計算與演算法,讓我們按部就班,持續前進,做輕鬆無負擔的超前學習 !
Thumbnail
預計量子AI計算會在2032年左右來到,在這之前,我們還有充足的時間可以逐步去學習量子計算與演算法,讓我們按部就班,持續前進,做輕鬆無負擔的超前學習 !
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News