Grok 4 發布懶人包:Elon Musk 再次出手,號稱「全球最聰明 AI」

更新於 發佈於 閱讀時間約 8 分鐘

xAI 最新推出的 AI 模型 Grok 4於 2025 年 7 月 10 日發布,直指 OpenAI 的 ChatGPT 和 Google 的 Gemini,TN科技筆記立刻帶各位看看本次的線上發布會重點!

Grok 4 Demo Livestream

本次 Grok4 發布會懶人包

  • 性能與功能:xAI 宣稱 Grok 4 是「全球最聰明的 AI」,在推理、程式碼編寫和多模態能力(處理文字與圖像)方面表現卓越。特別強調其在學術基準測試上的優異成績,例如在極具挑戰的「Humanity’s Last Exam (HLE)」中獲得 25.4% 的分數,這是一個包含超過 2,500 道數學、科學、語言學等博士等級的嚴苛測試。
  • 專業版本與語音特色:Grok 4 將提供多個專業版本,包括專為開發者設計的「Grok 4 Code」,以及具備自然語音能力的「Grok 4 Voice」,展現出高度擬人化的互動體驗。Elon Musk 在發布會上更誇口 Grok 4 能在四小時內修復完整的原始碼檔案,甚至從零開始構建一個第一人稱射擊遊戲。
  • 訂閱方案與定價策略:Grok 4 目前僅限付費的進階用戶使用。xAI 推出了兩種訂閱方案:「SuperGrok Heavy」每月 300 美元,可使用 Grok 4 及其多代理人版本 Grok 4 Heavy;另一方案每月 30 美元,可使用 Grok 4 和 Grok 3。
  • 未來展望與願景:Elon Musk 和 xAI 團隊對 Grok 4 的未來發展充滿信心,預計它將在短時間內實現技術、科學上的突破性發現,並最終透過與機器人的結合,實現與物理世界的深度互動,加速人類文明的進程,甚至改變全球經濟體系。

Grok 4 技術亮點

Grok 4 之所以讓 xAI 譽為「全球最聰明 AI」,其背後有著一系列的技術突破:

超越人類的學術表現

在發布會中,xAI 團隊不斷強調 Grok 4 在學術基準測試上的「超人類」表現。其中最受矚目的,莫過於「Humanity’s Last Exam (HLE)」。這是一套極其艱難的測試,總計包含 2500 道由各領域專家策劃的問題,涵蓋數學、自然科學、工程學,乃至人文學科。早期模型在這個測試中,通常只能達到個位數的準確度。

然而,Grok 4 在這個測試中達到了 25.4% 的成績。更令人驚訝的是,透過單一代理人模式,Grok 4 已經能解決 HLE 中 40% 的問題;而當啟用其多代理人版本 Grok 4 Heavy 時,在純文本子集測試上的解決率甚至能超過 50%。這項成績的重要性在於,這些問題的難度通常是博士級別甚至更深的研究級別,人類在其中任何單一學科能取得高分已屬不易,要像 Grok 4 這樣在所有學科達到「後研究生級別」(PhD level in everything),幾乎是不可想像的。Elon Musk 更直言,人類在此測試中的最佳表現可能只有 5%,而 Grok 4 甚至能完美通過 SAT 或 GRE 等考試。

強化學習與工具整合

Grok 4 的驚人表現並非偶然,團隊透露,Grok 4 的訓練量相較於 Grok 2 增加了高達 100 倍,並且在「推理」與「強化學習」(RL, Reinforcement Learning)方面投入了大量算力。這種「從第一性原理開始思考」、「糾正自身錯誤」的能力,正是強化學習的成果。

更值得注意的是 Grok 4 對「工具使用」的訓練。相較於 Grok 3 僅依賴泛化能力來使用工具(例如 Deep Search),Grok 4 將工具能力「原生」地整合到訓練流程中,顯著提升模型工具使用能力,使其更加可靠。雖然目前 Grok 4 使用的仍是相對「原始」的工具,但 xAI 承諾,後續將為 Grok 4 提供企業級的強大工具。最終的願景是讓 Grok 4 能透過人形機器人 Optimus 與真實世界互動,從現實中驗證假設、解決問題。

Grok 4 Heavy 的多代理人協作模式

Grok 4 Heavy 是 Grok 4 的多代理人(Multi-agent)版本,它在處理複雜問題時展現了更強大的能力。當 Grok 4 Heavy 面對困難任務時,它會同時啟動多個 AI 代理人,這些代理人獨立工作,然後像一個「學習小組」一樣,彼此比較並分享它們的思考過程與解決方案。這種模式並非簡單的多數決,而是能夠讓代理人之間相互啟發,找出問題的「關鍵訣竅」或獨特的解決路徑,最終綜合出最佳答案。

這種「測試時算力」(test-time compute)的顯著提升(約一個數量級),使得 Grok 4 Heavy 在 HLE 等測試中能取得更高的分數,證明了多代理人協作在解決複雜、多學科問題上的巨大潛力。

多模態能力與未來展望

Grok 4 不僅在文字和推理上表現出色,也具備初步的多模態能力,能夠處理圖像資訊。儘管團隊坦承目前 Grok 4 在圖像理解和生成方面仍有改進空間,但他們透露,基於最新版的基礎模型訓練即將完成,屆時,Grok 4 將能更像人類一樣「看見」世界。

除此之外,xAI 也明確了未來的發展路線:

  1. 專注於編碼能力:將推出一個專門為程式設計師設計的、兼具速度與智能的編碼模型。
  2. 全面提升多模態:除了視覺,還將強化音頻理解,讓 Grok 4 能夠「聽見」世界,為更多應用場景解鎖潛力。
  3. 影片生成:最終的目標是實現「像素輸入、像素輸出」(pixel in, pixel out),讓模型能夠生成影片,期望在今年底或明年帶來非常驚人的影片生成和理解能力。

Elon Musk 甚至將當前 AI 的快速發展比喻為一場「智能大爆炸」(intelligence big bang),認為我們正處於歷史上最有趣的時代。他預測 AI 將在今年或明年發現新的技術,並在兩年內發現新的物理學。他甚至大膽地從卡爾達肖夫指數(Kardashev scale,是根據一個文明所能夠利用的能源量級,來量度文明層次及技術先進程度的一種假說)的角度來預測未來文明,認為 AI 將把人類文明從目前僅佔 I 型文明 1-2% 的水平,推向 80-90%,甚至最終邁向 II 型文明。

TN科技筆記的觀點

  • 超越人類學術表現的意義: Grok 4 在 HLE 等頂級學術測試中的表現,尤其是多代理人模式下對複雜問題的分解與協作,不僅僅是分數高低的問題,更代表 AI 在「深度推理」和「跨領域知識整合」上取得了質的飛躍。這證明了 AI 不僅能處理極大量的資訊,更能理解其內在邏輯並生成連貫的解決方案,這種能力一旦普及,將會是科學、教育、產業研究的巨大加速器。
  • 工具使用與物理世界的連結: xAI 對 Grok 4 工具使用能力的強調,以及未來與 Tesla Optimus 機器人結合的願景,這意味著 AI 將不再是僅限於虛擬空間,而是能真正「動手」改造物理世界。從設計、製造到驗證,AI 將能形成一個閉環,這將是真正意義上的產業革命。

支持TN科技筆記,與科技共同前行

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
30會員
117內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/07/09
TN科技筆記帶各位解析AI教母李飛飛的最新洞見。從引爆深度學習革命的 ImageNet,到她全力投入的「空間智慧」。了解為何理解 3D 世界比語言模型更難,以及它如何成為通往 AGI 的關鍵拼圖。
2025/07/09
TN科技筆記帶各位解析AI教母李飛飛的最新洞見。從引爆深度學習革命的 ImageNet,到她全力投入的「空間智慧」。了解為何理解 3D 世界比語言模型更難,以及它如何成為通往 AGI 的關鍵拼圖。
2025/07/04
TN科技筆記將節錄重點介紹 Ilya 的獲勝策略,並分享其在實戰中積累的寶貴經驗,幫助讀者理解如何在企業級應用中實踐 RAG。
Thumbnail
2025/07/04
TN科技筆記將節錄重點介紹 Ilya 的獲勝策略,並分享其在實戰中積累的寶貴經驗,幫助讀者理解如何在企業級應用中實踐 RAG。
Thumbnail
2025/07/01
在這項實驗中,Anthropic 讓其大型語言模型 Claude Sonnet 3.7(化名「Claudius」)經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤,以及這項實驗為 AI 經濟應用帶來的啟示。
Thumbnail
2025/07/01
在這項實驗中,Anthropic 讓其大型語言模型 Claude Sonnet 3.7(化名「Claudius」)經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤,以及這項實驗為 AI 經濟應用帶來的啟示。
Thumbnail
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
2024 年,AI Boom 的第二年,我們總算可以撥開 AI 迷霧,逐一聊聊大型語言模型 (LLM) 的實際應用。On-Device AI 正快速進化,Google Gemini Nano 正式部署上手機,Apple 也發布最新論文彎道超車,改變了手機 AI 的未來發展。
Thumbnail
2024 年,AI Boom 的第二年,我們總算可以撥開 AI 迷霧,逐一聊聊大型語言模型 (LLM) 的實際應用。On-Device AI 正快速進化,Google Gemini Nano 正式部署上手機,Apple 也發布最新論文彎道超車,改變了手機 AI 的未來發展。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News