在人工智慧領域不斷突破界限的競賽中,Google DeepMind 於2025年5月14日最新發表的 AlphaEvolve 系統再次吸引了全球的目光。這項創新技術不僅僅是一個新的 AI 模型,更像是一個不知疲倦的 AI 工程師,能夠自主編寫、測試和改進程式碼,以解決當今世界最複雜的挑戰 。AlphaEvolve 的出現,馬上解決了許多人類遇到的科技與數學問題,並預示著我們與 AI 的互動方式即將迎來重大轉變。

什麼是 AlphaEvolve?
AlphaEvolve 並非僅僅是另一個聊天機器人或程式碼助手,它代表著更強大的能力 。作為 Google DeepMind 開發的最新 AI 系統,是一個基於其先進 Gemini 模型的人工智慧編碼代理(Agent),其核心目標是設計和優化複雜的演算法 。AlphaEvolve不僅能夠生成程式碼,還能自主測試其效能,並隨著時間的推移不斷進行改進,以尋求解決那些即使對人類專家來說也極具挑戰性的問題,例如優化複雜的排程系統、設計創新的數學演算法,或是提升電腦晶片的效能 。
AlphaEvolve 是一個自動化研究助理,首先接收由人類提供的任務,這可以是從優化日常排程到設計全新的數學演算法,或是改進現有的電腦晶片效能等各種挑戰。與任務一同提供的,還有衡量成功與否的標準,稱為評估函數 。這個評估函數就像一個記分卡,AI 系統會根據它來判斷每個潛在解決方案的優劣。為了實現這一目標,AlphaEvolve 巧妙地結合了 Google 最新的 Gemini 模型中的兩種版本:Gemini Flash 和 Gemini Pro 。其中,Gemini Flash 以其速度見長,能夠快速探索大量的想法,而 Gemini Pro 則更為聰明,專注於提供更深入、更優質的解決方案 。這兩個模型協同工作,為特定的問題創建大量的不同程式碼版本。一旦 AlphaEvolve 生成程式碼,它就會使用評分系統對每個版本進行測試,這個分數會根據使用者提供的規則檢查程式碼的優良程度,例如速度、記憶體使用量或準確性 。得分最高的程式將進入下一輪,然後 AlphaEvolve 會基於這些優勝者創建新的程式碼。這個過程就像軟體的「適者生存」 。

圖片來源:AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms,Google Deepmind
AlphaEvolve 不僅能創建和改進單個程式碼片段,還能處理整個系統 ;可以編寫和完善長期的、多部分的程式,這意味著它可以重新設計電腦系統不同部分之間的工作方式。例如,它可以編寫和測試新的 AI 訓練程式的各個部分,或者優化晶片製造中的硬體設計 。這種能力使得 AlphaEvolve 能夠應對更複雜、更全面的挑戰。如同一個不知疲倦的 AI 工程師,AlphaEvolve 能夠嘗試成千上萬個想法,直到找到解決複雜問題的最佳方案 。它就像一個自動化的研究助理,能夠創建和改進整個系統,而不僅僅是單個程式碼片段 。AlphaEvolve 的目標是超越已知的解決方案,透過自動化的研究過程,進行數千個程式碼實驗,自動測試並持續變異候選方案,直到出現真正的突破 。
為了更清晰地理解 AlphaEvolve 相較於 Google DeepMind 過去的「Alpha」系列 AI 系統的獨特之處,我們可以參考下表:

這張表格展示了 AlphaEvolve 如何在應用領域、底層技術和創意輸出方面,相較於先前的 Alpha 系統有了顯著的擴展和演進,不再局限於特定的遊戲或數學問題,而是朝向更廣泛的演算法發現和優化邁進,結合了進化計算和大型語言模型的優勢,展現了更強大的自主性和實際應用潛力。
AlphaEvolve 目前取得的成功
儘管 AlphaEvolve 仍處於發展初期,但它已經在 Google 內部展現了令人印象深刻的成果 。其中一個最引人注目的例子是它對 Google 大型排程系統Borg的優化 。AlphaEvolve 提出了一種新的排程技巧,能夠在全球的 Google 資料中心節省約 0.7% 的計算能力 。雖然 0.7% 看似不多,但對於像 Google 這樣規模的公司來說,已是一個巨大的進步,意味著在相同的硬體基礎設施上可以完成更多的工作。這項由 AlphaEvolve 發現的解決方案已經投入生產超過一年,持續為 Google 節省大量的計算資源 。

圖片來源:AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms,Google Deepmind
除了資料中心優化,AlphaEvolve 還協助改進了 Google 用於訓練其最大 AI 模型的核心硬體——TPU(Tensor Processing Unit)晶片的設計 。工程師在檢查過 AlphaEvolve 的工作後,將其改進的設計應用於即將推出的 TPU 晶片中 ,AlphaEvolve 提出了一種 Verilog 的重寫方案,找到並移除關鍵的矩陣乘法算術電路中不必要的位元,這項改進不僅提升了晶片的效率,也展現了 AI 在硬體設計領域的巨大潛力。
Verilog 是一種硬體設計語言,用於描述數位電路。
此外,AlphaEvolve 還加速了 DeepMind 內部模型所使用的一些數學工具 。它找到了重組複雜程式碼(如矩陣乘法核心)的方法。其中一項改變將訓練速度提高了 1%,另一項則將 Transformer 模型中使用的注意力函數的速度提高了超過 30% 。這些都是顯著的改進,能夠節省大量的時間和金錢 。AlphaEvolve 透過更智慧的方式劃分大型矩陣乘法運算,將 Gemini 架構中的關鍵核心加速了 23%,從而將 Gemini 的訓練時間縮短了 1% 。更令人印象深刻的是,AlphaEvolve 還將 FlashAttention 核心的 GPU 指令速度提高了 32.5% 。這些優化不僅提高了 AI 模型的效能,還大幅縮短了工程師優化這些核心所需的時間,從原先的數週專家努力縮短到幾天的自動化實驗 。
除了在 Google 內部取得的成功,AlphaEvolve 在解決數學挑戰方面也展現了驚人的創新能力 。在一系列的 50題超高難度數學挑戰中,AlphaEvolve 在 75% 的情況下找到了已知的最佳解決方案,更厲害的是,在 20% 的情況下,它甚至超越了人類已知的最佳解決方案 。
其中一個突出的例子是,AlphaEvolve 找到了一種新的方法,僅用 48 次基本乘法步驟即可計算兩個 4x4 矩陣的乘積,這打破了自 1969 年以來 Strassen演算法一直保持的記錄,較經典演算法提升近 30%的效率。在另一個案例中,它改進了1694 年提出的 11 維空間中一個複雜幾何問題「親吻數問題」的已知下限,發現了一種包含 593 個外球的配置,破解了300 多年尚未解開的數學難題。這些都是頂尖研究人員數十年來一直在努力解決的問題,AlphaEvolve 的進展表明它不僅速度快,而且在解決問題的方式上真正具有創新性 。
AlphaEvolve 的未來願景
AlphaEvolve 目前主要在 DeepMind 和 Google 內部進行測試,但該公司計劃擴大其使用範圍,正在開發使用者友善的介面,並且很快將向選定的研究人員提供早期存取權限 。其願景是讓更多的人能夠利用 AlphaEvolve 來解決其他領域的棘手問題,例如材料科學、物流和藥物發現 。
任何可以被寫成程式碼並透過明確的指標進行測試的任務,都在 AlphaEvolve 的能力範圍之內 。
這項技術有望改變企業和科學家解決問題的方式 。與其手工編寫和測試想法,他們可以簡單地描述問題,然後讓 AlphaEvolve 完成須不斷從不同角度測試的繁重的工作,從而加速創新和知識的發現 。AlphaEvolve 不僅僅是一個編碼工具,更可能成為一種新型的 AI 隊友,它能夠快速嘗試數百甚至數千個選項,從錯誤中學習,並交付經過測試、可用的程式碼。對於企業來說,這意味著更快的創新;對於研究人員來說,這可能解鎖新的知識;而對於工程師來說,這是一個強大的新夥伴,可以承擔耗時的編碼和測試任務 。AlphaEvolve 的通用性使其能夠應用於任何可以演算法描述並自動驗證的問題,如果相關的問題能用演算法描述,且能夠給予能夠量化的驗證指標,他都可以持續去做改良與精進,未來潛在的應用領域包括材料科學、藥物發現、永續發展以及更廣泛的科技和商業應用 。
AI 「自我加速」的研究與 AlphaEvolve
近年來,人工智慧領域的一個重要研究方向是「自我加速」的概念 。這指的是 AI 系統透過自主改進自身的能力,從而加速其發展的過程 。這種自我改進可能涉及多種機制,包括優化自身的程式碼、演算法或架構,以及自主學習和整合新的知識 。如果人工通用智慧 (AGI) 能夠加速自身的進步,那麼我們可能會看到科技發展以驚人的速度飛躍 。
AlphaEvolve 開啟了一種「自我加速」的形式 。它利用進化演算法,透過不斷產生、測試和選擇最佳的程式碼變異,來迭代地改進其解決方案 。這個過程模仿了自然界的進化,最有效的演算法得以「生存」並被用於產生下一代更優化的解決方案 。
更重要的是,AlphaEvolve 已經展現了自我提升的潛力,它能夠優化其底層的 Gemini 模型訓練過程,例如,它加速了用於訓練 Gemini 模型的矩陣乘法庫 。這種能力代表著 AI 系統不僅能解決外部問題,還能改進自身運作的基礎設施,這正是遞迴自我提升的關鍵一步 。透過優化矩陣乘法等核心運算,AlphaEvolve 使得 Gemini 模型能夠更快、更有效率地進行訓練,這也進一步提升了 AlphaEvolve 本身的能力,形成一個潛在的良性循環 。
話說這種AI 「自我加速」 的 研究,怎麼覺得有點像「AI2027」描述的景象。
結論:AlphaEvolve 的重要性
總而言之,AlphaEvolve 是 Google DeepMind 開發的一款強大 AI 系統,它基於 Gemini 模型,能夠自主編寫、測試和改進程式碼,以解決複雜的問題 。它已經在優化 Google 的資料中心排程系統 Borg、協助改進 TPU 晶片設計、加速 DeepMind 內部模型的數學工具(如矩陣乘法核心),以及在解決複雜的數學挑戰(如改進 4x4 矩陣乘法和解決「親吻數問題」)方面取得了顯著的成功,甚至在某些情況下超越了人類已知的最佳解決方案 。
AlphaEvolve 的重要性不僅在於其已取得的成就,更在於其作為通用演算法發現和優化工具的巨大潛力 。AlphaEvolve 的通用性使其能夠應用於任何可以演算法描述並自動驗證的問題 ,展望未來,AlphaEvolve 有望在推動 AI 技術的進步以及材料科學、藥物發現、永續發展等其他領域的發展中發揮關鍵作用 。AlphaEvolve 的出現,標誌著 AI 從僅僅執行人類指令的工具,轉變為能夠自主創新和發現的智慧夥伴,預示著一個 AI 與人類協同合作、共同加速科學發現和技術創新的新時代即將到來。