Grok 4 發布懶人包：Elon Musk 再次出手，號稱「全球最聰明 AI」

TN科技筆記(TechNotes)

發佈於科技領域筆記

更新於 2025/07/11發佈於 2025/07/11閱讀時間約 8 分鐘

xAI 最新推出的 AI 模型 Grok 4於 2025 年 7 月 10 日發布，直指 OpenAI 的 ChatGPT 和 Google 的 Gemini，TN科技筆記立刻帶各位看看本次的線上發布會重點！

Grok 4 Demo Livestream

本次 Grok4 發布會懶人包

性能與功能：xAI 宣稱 Grok 4 是「全球最聰明的 AI」，在推理、程式碼編寫和多模態能力（處理文字與圖像）方面表現卓越。特別強調其在學術基準測試上的優異成績，例如在極具挑戰的「Humanity’s Last Exam (HLE)」中獲得 25.4% 的分數，這是一個包含超過 2,500 道數學、科學、語言學等博士等級的嚴苛測試。
專業版本與語音特色：Grok 4 將提供多個專業版本，包括專為開發者設計的「Grok 4 Code」，以及具備自然語音能力的「Grok 4 Voice」，展現出高度擬人化的互動體驗。Elon Musk 在發布會上更誇口 Grok 4 能在四小時內修復完整的原始碼檔案，甚至從零開始構建一個第一人稱射擊遊戲。
訂閱方案與定價策略：Grok 4 目前僅限付費的進階用戶使用。xAI 推出了兩種訂閱方案：「SuperGrok Heavy」每月 300 美元，可使用 Grok 4 及其多代理人版本 Grok 4 Heavy；另一方案每月 30 美元，可使用 Grok 4 和 Grok 3。
未來展望與願景：Elon Musk 和 xAI 團隊對 Grok 4 的未來發展充滿信心，預計它將在短時間內實現技術、科學上的突破性發現，並最終透過與機器人的結合，實現與物理世界的深度互動，加速人類文明的進程，甚至改變全球經濟體系。

Grok 4 技術亮點

Grok 4 之所以讓 xAI 譽為「全球最聰明 AI」，其背後有著一系列的技術突破：

超越人類的學術表現

在發布會中，xAI 團隊不斷強調 Grok 4 在學術基準測試上的「超人類」表現。其中最受矚目的，莫過於「Humanity’s Last Exam (HLE)」。這是一套極其艱難的測試，總計包含 2500 道由各領域專家策劃的問題，涵蓋數學、自然科學、工程學，乃至人文學科。早期模型在這個測試中，通常只能達到個位數的準確度。

然而，Grok 4 在這個測試中達到了 25.4% 的成績。更令人驚訝的是，透過單一代理人模式，Grok 4 已經能解決 HLE 中 40% 的問題；而當啟用其多代理人版本 Grok 4 Heavy 時，在純文本子集測試上的解決率甚至能超過 50%。這項成績的重要性在於，這些問題的難度通常是博士級別甚至更深的研究級別，人類在其中任何單一學科能取得高分已屬不易，要像 Grok 4 這樣在所有學科達到「後研究生級別」（PhD level in everything），幾乎是不可想像的。Elon Musk 更直言，人類在此測試中的最佳表現可能只有 5%，而 Grok 4 甚至能完美通過 SAT 或 GRE 等考試。

強化學習與工具整合

Grok 4 的驚人表現並非偶然，團隊透露，Grok 4 的訓練量相較於 Grok 2 增加了高達 100 倍，並且在「推理」與「強化學習」（RL, Reinforcement Learning）方面投入了大量算力。這種「從第一性原理開始思考」、「糾正自身錯誤」的能力，正是強化學習的成果。

更值得注意的是 Grok 4 對「工具使用」的訓練。相較於 Grok 3 僅依賴泛化能力來使用工具（例如 Deep Search），Grok 4 將工具能力「原生」地整合到訓練流程中，顯著提升模型工具使用能力，使其更加可靠。雖然目前 Grok 4 使用的仍是相對「原始」的工具，但 xAI 承諾，後續將為 Grok 4 提供企業級的強大工具。最終的願景是讓 Grok 4 能透過人形機器人 Optimus 與真實世界互動，從現實中驗證假設、解決問題。

Grok 4 Heavy 的多代理人協作模式

Grok 4 Heavy 是 Grok 4 的多代理人（Multi-agent）版本，它在處理複雜問題時展現了更強大的能力。當 Grok 4 Heavy 面對困難任務時，它會同時啟動多個 AI 代理人，這些代理人獨立工作，然後像一個「學習小組」一樣，彼此比較並分享它們的思考過程與解決方案。這種模式並非簡單的多數決，而是能夠讓代理人之間相互啟發，找出問題的「關鍵訣竅」或獨特的解決路徑，最終綜合出最佳答案。

這種「測試時算力」（test-time compute）的顯著提升（約一個數量級），使得 Grok 4 Heavy 在 HLE 等測試中能取得更高的分數，證明了多代理人協作在解決複雜、多學科問題上的巨大潛力。

多模態能力與未來展望

Grok 4 不僅在文字和推理上表現出色，也具備初步的多模態能力，能夠處理圖像資訊。儘管團隊坦承目前 Grok 4 在圖像理解和生成方面仍有改進空間，但他們透露，基於最新版的基礎模型訓練即將完成，屆時，Grok 4 將能更像人類一樣「看見」世界。

除此之外，xAI 也明確了未來的發展路線：

專注於編碼能力：將推出一個專門為程式設計師設計的、兼具速度與智能的編碼模型。
全面提升多模態：除了視覺，還將強化音頻理解，讓 Grok 4 能夠「聽見」世界，為更多應用場景解鎖潛力。
影片生成：最終的目標是實現「像素輸入、像素輸出」（pixel in, pixel out），讓模型能夠生成影片，期望在今年底或明年帶來非常驚人的影片生成和理解能力。

Elon Musk 甚至將當前 AI 的快速發展比喻為一場「智能大爆炸」（intelligence big bang），認為我們正處於歷史上最有趣的時代。他預測 AI 將在今年或明年發現新的技術，並在兩年內發現新的物理學。他甚至大膽地從卡爾達肖夫指數（Kardashev scale，是根據一個文明所能夠利用的能源量級，來量度文明層次及技術先進程度的一種假說）的角度來預測未來文明，認為 AI 將把人類文明從目前僅佔 I 型文明 1-2% 的水平，推向 80-90%，甚至最終邁向 II 型文明。

TN科技筆記的觀點

超越人類學術表現的意義: Grok 4 在 HLE 等頂級學術測試中的表現，尤其是多代理人模式下對複雜問題的分解與協作，不僅僅是分數高低的問題，更代表 AI 在「深度推理」和「跨領域知識整合」上取得了質的飛躍。這證明了 AI 不僅能處理極大量的資訊，更能理解其內在邏輯並生成連貫的解決方案，這種能力一旦普及，將會是科學、教育、產業研究的巨大加速器。
工具使用與物理世界的連結: xAI 對 Grok 4 工具使用能力的強調，以及未來與 Tesla Optimus 機器人結合的願景，這意味著 AI 將不再是僅限於虛擬空間，而是能真正「動手」改造物理世界。從設計、製造到驗證，AI 將能形成一個閉環，這將是真正意義上的產業革命。

支持TN科技筆記，與科技共同前行

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～～～也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們，讓我更加有動力為各位帶來科技新知！

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言

留言分享你的想法！

TN科技筆記(TechNotes)的沙龍

30會員

117內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/07/09

AI教母李飛飛的下一個目標：從 ImageNet 到「空間智慧」，為何 3D 世界可能是 AGI 的最後一塊拼圖？

TN科技筆記帶各位解析AI教母李飛飛的最新洞見。從引爆深度學習革命的 ImageNet，到她全力投入的「空間智慧」。了解為何理解 3D 世界比語言模型更難，以及它如何成為通往 AGI 的關鍵拼圖。

2025/07/09

AI教母李飛飛的下一個目標：從 ImageNet 到「空間智慧」，為何 3D 世界可能是 AGI 的最後一塊拼圖？

2025/07/04

企業級 RAG 挑戰賽冠軍Ilya Rice：技術架構與實戰經驗解析

TN科技筆記將節錄重點介紹 Ilya 的獲勝策略，並分享其在實戰中積累的寶貴經驗，幫助讀者理解如何在企業級應用中實踐 RAG。

2025/07/04

企業級 RAG 挑戰賽冠軍Ilya Rice：技術架構與實戰經驗解析

TN科技筆記將節錄重點介紹 Ilya 的獲勝策略，並分享其在實戰中積累的寶貴經驗，幫助讀者理解如何在企業級應用中實踐 RAG。

2025/07/01

Anthropic Project Vend：由 AI 來擔任店長的有趣實驗

在這項實驗中，Anthropic 讓其大型語言模型 Claude Sonnet 3.7（化名「Claudius」）經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤，以及這項實驗為 AI 經濟應用帶來的啟示。

2025/07/01

Anthropic Project Vend：由 AI 來擔任店長的有趣實驗

#AI 的其他內容

🚀 Cursor 編輯器：無縫整合 VS Code，讓 AI 幫你寫程式｜安裝與操作教學

Money Talks

用AI做簡報，Gamma V.S. Canva誰比較好用？PR結案報告實測

MimiVsJames的美股投資分享

下一波接棒/佈局的半導體族群是什麼？

你可能也想看

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

孩子寫功課時瞇眼？小心近視！這款喜光全光譜TIONE⁺光健康智慧檯燈，獲眼科院長推薦，網路好評不斷！全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉，讓孩子學習更舒適、保護眼睛！

#方格新手#保護眼睛#閱讀

2025/06/21

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

#方格新手#保護眼睛#閱讀

2025/06/21

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

Baozilla, Let's go!

20240726_TechNEws

OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」，由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布，該引擎能結合來自網路的即時資訊，讓使用者像與 ChatGPT 交談一樣搜尋。透過 SearchGPT，用戶能以自然語言提出問題（與使用 ChatGPT 交談方式相同

2024/07/26

Baozilla, Let's go!

20240726_TechNEws

2024/07/26

智慧海的沙龍

整合主流AI 引擎的強大OpenGPTs正式發佈

據美聯社報導，OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs，便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。

#ChatGPT#OpenAI#Gemini

2024/06/23

智慧海的沙龍

整合主流AI 引擎的強大OpenGPTs正式發佈

#ChatGPT#OpenAI#Gemini

2024/06/23

私大王牌教授 (私人大學ACE) feat. mr gary

** OpenAI GPT-4o五大產業應用場景**

OpenAI 春季發布會推出了 GPT-4o 模型，免費且響應速度更快，具備文字、音訊、影像的多模態輸入功能。

#GPT-4o#OpenAI#心理

2024/05/18

私大王牌教授 (私人大學ACE) feat. mr gary

** OpenAI GPT-4o五大產業應用場景**

OpenAI 春季發布會推出了 GPT-4o 模型，免費且響應速度更快，具備文字、音訊、影像的多模態輸入功能。

#GPT-4o#OpenAI#心理

2024/05/18

德意志黑眼圈

進化為GPT-4o 可以聊天兼翻譯，圖片辨識大有進展。不用十年，不到兩年AI已可取代許多人類庶務

2024年5月13日，Openai發布了新一代的模組GPT-4o，念法：GPT-four-O。強調即時對話以及圖像解析能力，官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析，以及幾乎可媲美真人的語音回應，包含調整語氣、用詞以及模仿機器人語音等，相當令人驚豔。

#GPT4o#ChatGPT#Openai

2024/05/14

德意志黑眼圈

進化為GPT-4o 可以聊天兼翻譯，圖片辨識大有進展。不用十年，不到兩年AI已可取代許多人類庶務

#GPT4o#ChatGPT#Openai

2024/05/14

凱文馬拉穆の雪橇犬星球

1分鐘內了解OpenAI全新模型「GPT-4o」全部免費，速度翻倍成本減半

ChatGPT新模型GPT-4o即將推出，速度更快，並支援處理影片以及多種語言。免費用戶也可以使用ChatBots，而付費版本則限制頻寬並提高至原本的5倍。此外，還將推出ChatGPT桌面應用程式，讓使用者在電腦上進行各項工作時，更輕鬆地使用ChatGPT。

#ChatGPT#GPT-4#語言

2024/05/14

凱文馬拉穆の雪橇犬星球

1分鐘內了解OpenAI全新模型「GPT-4o」全部免費，速度翻倍成本減半

#ChatGPT#GPT-4#語言

2024/05/14

GPT工作術｜與你一起補給工作的AI能量沙龍

誼郎開源不是說假的！可再開發、可商用的Grok-1開源了，將改變什麼？

人工智慧（AI）發展一日千里，年初OpenAI的Sora，三月初Anthropic的Cloude3，都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源，不僅展現了對AI技術開放共享的承諾，也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。

#OpenAI#模型#GPT-4

2024/03/20

GPT工作術｜與你一起補給工作的AI能量沙龍

誼郎開源不是說假的！可再開發、可商用的Grok-1開源了，將改變什麼？

#OpenAI#模型#GPT-4

2024/03/20

筱涵｜Hannah的沙龍

關於AI人工智慧所帶來的設計影響｜Adobe Firefly｜OpenAI的GPT-4一周年

去年的今天，OpenAI發表了GPT-4的版本。

#AI人工智慧#設計#Adobe

2024/03/15

筱涵｜Hannah的沙龍

關於AI人工智慧所帶來的設計影響｜Adobe Firefly｜OpenAI的GPT-4一周年

去年的今天，OpenAI發表了GPT-4的版本。

#AI人工智慧#設計#Adobe

2024/03/15

米奇幻世界

人工智能：未來的新篇章

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

米奇幻世界

人工智能：未來的新篇章

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

手哥科科

Google 發表新 AI 模型 Gemini 1.5，提供更大的「腦容量」和效率

今天 Google 發表了最新的 AI 模型 Gemini 1.5，不只提高模型訓練和服務效率，而且擁有更強大的理解力，每次能處理的 token 長度更是一口氣突破 100 萬大關，是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度)，可以處理更大量的資訊，也擁有更大

#Google#模型#GPT-4

2024/02/17