Grok 3:馬斯克稱「地球上最聰明的AI」,性能超越GPT-4與Gemini?(上)

更新於 發佈於 閱讀時間約 3 分鐘

馬斯克的AI公司 xAI 正式發布了Grok 3,被馬斯克稱為「地球上最聰明的AI」。該模型現已向X平台的Premium+訂閱用戶開放。經測試Grok 3在數學、科學和程式設計等基準測試中表現優於現有模型,如OpenAI的GPT-4o、Google的Gemini、DeepSeek的V3和Anthropic的Claude。它的開發使用了比前代產品更強大的計算能力,並包括DeepSearch功能,以及即將推出的語音模式。xAI還計劃在Grok 3成熟後開源其前代產品Grok 2。

raw-image



Grok 3的開發過程特別之處:

  • 計算能力:Grok 3使用了令人印象深刻的計算基礎設施。它在名為「Colossus」的超級計算機集群上訓練,該集群包含約20萬個GPU。這比Grok 2的計算能力增加了十倍,能夠更快、更高效地處理大型數據集。
  • 開發速度:Grok 3的開發速度非常快,馬斯克指出,首批10萬個GPU的訓練花了122天,隨後在92天內擴展到了全容量。
  • 人類反饋和情境訓練:xAI融入了人類反饋循環和情境訓練,通過多重驗證步驟提高回應的自然性和準確性,專注於減少幻覺。




Grok 3的特點:

  • 進階推理:Grok 3設計有明顯改進的推理能力,特別是在數學、科學和程式設計方面,比前代產品更好地處理複雜的邏輯問題和情境合成。
  • DeepSearch:對標OpenAI的Deep Research,讓Grok 3有即時資訊的研究能力,為用戶查詢提供全面的摘要,增強其在研究和訊息收集方面的實用性。
  • 語音模式:雖然在發布時尚未提供,但已預計很快會推出語音互動模式,允許更自然的對話互動。
  • 自我修正和邏輯一致性:Grok 3能夠反思其錯誤以達到邏輯一致性,減少其回應中的錯誤。
  • 多模態互動:Grok 3設定為處理文本、圖像和音頻,使其在不同類型的數據互動中具有多功能性。
  • 合成數據學習:為了提高性能,Grok 3使用合成數據集和真實世界數據,可能增強其生成創新解決方案的能力。
  • 倫理層面:Grok 3被描述為「最大限度地追求真相」,即使這一真相可能不符合政治正確,這使其與採用更保守內容審核的模型有所區別。
  • 遊戲和代碼生成:在物理問題解決和遊戲代碼生成方面展現了能力,暗示在遊戲和軟件開發中的潛在應用。



Grok 3與其他AI模型的測試比較:

  • 數學:Grok 3在AIME 2024基準測試中得分達52%,超過了GPT-4o (47%)、Claude 3.5 (44%)及其他模型。
  • 科學:在GPQA基準測試中,Grok 3達到了75%的得分,顯著高於Claude 3.5的68%,以及DeepSeek V3和Gemini 2.0 Pro等其他模型的分數。
  • 程式設計:Grok 3在LiveCodeBench等程式設計基準測試中的表現為57%,高於Gemini 2.0 Pro的49%,同時也優於GPT-4o、Claude 3.5和DeepSeek V3。
  • 一般知識與推理:Grok 3在聊天機器人競技場等平台上展現出有競爭力的結果,得分高於Gemini 2.0 Flash Thinking、DeepSeek的R1,甚至超過了OpenAI的o1和o3模型。
raw-image


raw-image



Grok 3無疑是當前AI領域的重要突破,其在計算力、開發速度和功能上都顯示出顯著進步。這些都代表著AI技術正朝著更聰明、更多功能的方向快速發展。下篇文章我將整理馬斯克在Grok 3發布期間的評論,以及這些評論如何顯示他對AI未來發展的獨特願景。

發表會影片:

Grok3 Launch


我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心給我支持鼓勵~

也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!

>>>請我喝一杯咖啡


留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
37會員
141內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/04/29
OpenAI近日為ChatGPT推出了一系列更新以提升用戶體驗並挑戰傳統搜尋引擎的地位。本文將介紹ChatGPT的最新功能,並分析這些更新如何改變我們的線上搜尋與購物方式。
Thumbnail
2025/04/29
OpenAI近日為ChatGPT推出了一系列更新以提升用戶體驗並挑戰傳統搜尋引擎的地位。本文將介紹ChatGPT的最新功能,並分析這些更新如何改變我們的線上搜尋與購物方式。
Thumbnail
2025/04/23
介紹TTS模型(文字轉語音)的運作原理與應用,比較Google NotebookLM Podcast、ElevenLabs Studio、Sesame CSM-1B與Nari Labs Dia的特色、優勢與限制。從對話逼真度到語音複製,幫助您選擇最適合的TTS解決方案。
Thumbnail
2025/04/23
介紹TTS模型(文字轉語音)的運作原理與應用,比較Google NotebookLM Podcast、ElevenLabs Studio、Sesame CSM-1B與Nari Labs Dia的特色、優勢與限制。從對話逼真度到語音複製,幫助您選擇最適合的TTS解決方案。
Thumbnail
2025/04/19
隨著 AI 的快速發展,大型語言模型的性能不斷提升,但顯卡等硬體需求往往讓一般用戶望而卻步。Google 於 2025 年 4 月 18 日發布的 Gemma 3 系列量化模型,透過 Quantization-Aware Training(QAT) 技術,成功將頂尖 AI 性能帶入消費級硬體,如 N
Thumbnail
2025/04/19
隨著 AI 的快速發展,大型語言模型的性能不斷提升,但顯卡等硬體需求往往讓一般用戶望而卻步。Google 於 2025 年 4 月 18 日發布的 Gemma 3 系列量化模型,透過 Quantization-Aware Training(QAT) 技術,成功將頂尖 AI 性能帶入消費級硬體,如 N
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
隨著AI技術的普及,瞭解AI工具的重要性。本文介紹AI工具的應用,分享最新的GPT-4o的功能和優勢,並提出AI與人類智慧相結合的見解。
Thumbnail
隨著AI技術的普及,瞭解AI工具的重要性。本文介紹AI工具的應用,分享最新的GPT-4o的功能和優勢,並提出AI與人類智慧相結合的見解。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
Thumbnail
隨著AI板塊的爆發,各大科技巨頭之間的競爭愈發激烈。尤其是Google與微軟這兩個搜尋引擎的老對手,都想借AI的東風,升級各自的科技服務。微軟背後有OpenAI的ChatGPT技術加持,始終壓Google一頭。
Thumbnail
隨著AI板塊的爆發,各大科技巨頭之間的競爭愈發激烈。尤其是Google與微軟這兩個搜尋引擎的老對手,都想借AI的東風,升級各自的科技服務。微軟背後有OpenAI的ChatGPT技術加持,始終壓Google一頭。
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
前言 今年Q4都在大陸出差,不好意思,有一段時間沒有更新文章了,因為我是希望文章是有深思熟慮才發出的,新的一年也祝福大家新年快樂,萬事如意。 AI PC 題材介紹 這邊我用淺顯易懂的方式介紹給大家看這個題材,首先要先知道微軟就是ChatGPT的最大投資者。 而微軟也出了一個AI叫做Copil
Thumbnail
前言 今年Q4都在大陸出差,不好意思,有一段時間沒有更新文章了,因為我是希望文章是有深思熟慮才發出的,新的一年也祝福大家新年快樂,萬事如意。 AI PC 題材介紹 這邊我用淺顯易懂的方式介紹給大家看這個題材,首先要先知道微軟就是ChatGPT的最大投資者。 而微軟也出了一個AI叫做Copil
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News