vocus logo

方格子 vocus

【科技快報】《Gauss:自動形式化代理|AI 破解困擾人類數月的數學證明》(2025)

更新 發佈閱讀 4 分鐘





Math Inc. 剛剛推出 Gauss ,一個 AI 系統,它僅用 三週 就解決了一項名為 強質數定理(Strong Prime Number Theorem, PNT的複雜數學定理 —— 而頂尖數學家們之前花了 18 個月 仍在掙扎中。Math Inc. 團隊推出 Gauss,是一個首創的 自動形式化代理(autoformalization agent),用於協助數學專家進行形式驗證。透過 Gauss,完成了由費爾茲獎得主 陶哲軒(Terence Tao) 與 Alex Kontorovich 在 2024 年 1 月提出的挑戰 ,在 Lean(GitHub) 中形式化 強質數定理(Strong Prime Number Theorem, PNT)。

使用 Gauss,產出了 約 25,000 行 Lean 代碼,包含超過 1,000 個定理與定義。這類規模的形式化證明在歷史上常是重大里程碑,通常需多年努力才能完成。歷來最大型的單一形式化專案通常需要十年以上、堪稱研究生涯巔峰的成果,也僅比這大一個數量級(約 500,000 行代碼)。而 Lean 的數學標準函式庫 Mathlib 則大兩個數量級,擁有 約 2,000,000 行代碼35 萬個 Lean 定理與定義,並由 600 多名貢獻者歷經 8 年建構完成。


內容摘要:

  1. Gauss 完成了由知名數學家 陶哲軒(Terence Tao)Alex Kontorovich 在 2024 年提出的強質數定理形式化挑戰。
  2. 人類專家僅在該挑戰上取得「中期進展」,數學界在 18 個月後(2025 年 7 月)才完成較簡化的 中等版本(Medium version)
  3. Gauss 可自主連續工作數小時,並生成 25,000 行經過驗證的數學程式碼,其中包含 1,000 多個相互關聯的證明與定義
  4. Math Inc. 計劃在未來 12 個月內 將數學代碼量擴展 100 到 1,000 倍,以此作為訓練數據,推動「機器數學多面手(machine polymaths)」與「驗證型超級智慧(verified superintelligence)」的發展。



重要性:

複雜數學是 推理的基礎,而 AI 正快速掌握這一領域,這是 系統能創造新思想並加深我們對世界理解 的最強信號之一。隨著 Gauss 的突破,以及 Google、OpenAI 等 在國際數學奧林匹亞中獲得金牌,AI 在數學上的加速正在飛速發生。

Gauss 展現了形式化在未來如何擴展。目前,它仍依賴數學家提供的自然語言框架,並需要高階專家的指導與開發。預期未來版本的 Gauss 將更具能力與自主性。Math Inc. 團隊將開始部署這項技術,讓數學家與證明工程師能實際使用。目前Math Inc. 團隊正與部分數學家接洽,進行封測(beta testing)。你可以在此註冊 Gauss 早期使用權。若你有關於自動形式化的雄心計劃,歡迎與Math Inc. 團隊聯繫。(👉聯絡網址:https://www.math.inc/





  • 如果你對內容有共鳴、想分享想法,
  • 歡迎在下方留言互動 💬 你的支持就是我持續寫作的動力!
  • 📮 也歡迎來信交流:childbenefits@gmail.com


留言
avatar-img
開域空間讀書會
57會員
108內容數
中原大學室內設計研究所畢。 喜歡現代詩、推理、科普、有趣的人事物,人生光譜的代表色系:天青色。 連絡信箱:childbenefits@gmail.com
開域空間讀書會的其他內容
2025/09/13
阿爾巴尼亞成為全球第一個擁有 AI 部長的國家,由人工智慧驅動的 Diella,將負責公共採購。
Thumbnail
2025/09/13
阿爾巴尼亞成為全球第一個擁有 AI 部長的國家,由人工智慧驅動的 Diella,將負責公共採購。
Thumbnail
2025/09/13
加州大學聖地牙哥分校的研究揭示太空飛行加速人類血液幹細胞老化,導致細胞功能下降、DNA損傷和端粒縮短。該研究利用創新的奈米生物反應器系統,在國際太空站即時監測幹細胞變化,為長時間太空旅行的健康風險提供了新見解,並為地球上老化及相關疾病研究提供了新的模型。
Thumbnail
2025/09/13
加州大學聖地牙哥分校的研究揭示太空飛行加速人類血液幹細胞老化,導致細胞功能下降、DNA損傷和端粒縮短。該研究利用創新的奈米生物反應器系統,在國際太空站即時監測幹細胞變化,為長時間太空旅行的健康風險提供了新見解,並為地球上老化及相關疾病研究提供了新的模型。
Thumbnail
2025/09/13
探索神經建築學如何結合設計與神經科學,揭示空間對心智的影響。從幾何形狀、色彩、照明到材質,學習如何運用設計元素打造專注、放鬆或激發靈感的理想環境,提升生活品質。
Thumbnail
2025/09/13
探索神經建築學如何結合設計與神經科學,揭示空間對心智的影響。從幾何形狀、色彩、照明到材質,學習如何運用設計元素打造專注、放鬆或激發靈感的理想環境,提升生活品質。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
高中數學主題練習—對數方程式
Thumbnail
高中數學主題練習—對數方程式
Thumbnail
預計量子AI計算會在2032年左右來到,在這之前,我們還有充足的時間可以逐步去學習量子計算與演算法,讓我們按部就班,持續前進,做輕鬆無負擔的超前學習 !
Thumbnail
預計量子AI計算會在2032年左右來到,在這之前,我們還有充足的時間可以逐步去學習量子計算與演算法,讓我們按部就班,持續前進,做輕鬆無負擔的超前學習 !
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News