Google Gemini 3超智慧!推理、多模態理解直接領跑AI榜單! #115

更新 發佈閱讀 19 分鐘

哈囉!這邊是科技碎碎念,資訊 x AI時代下,我們將從海量的全球新聞與新知中,透過生成式 AI 彙整出精華懶人包,聚焦全球科技關鍵話題,讓您輕鬆透過閱讀或聆聽掌握趨勢變革。

科技碎碎念 傳送門
Youtube 傳送門
「大肚報報」社群傳送門

快速重點摘要

  • 人工智慧領導者推出頂尖模型並將作業系統轉變為代理人核心
    • Google 發表了 Gemini 3,這是其最智慧的模型,在推理、多模態理解和「有譯氛圍編程」(vibe coding)方面均達到最先進水準。
    • 微軟(Microsoft)正將 Windows 11 轉變為「代理人作業系統」(Agentic OS),將人工智慧助理(如 Microsoft 365 Copilot)深度整合到工作列中,使代理人能夠在獨立、受控的環境中執行任務。
  • 人工智慧投資熱潮推動大規模融資與基礎設施建設,但市場擔憂風險
    • AI 資料中心供應商 Lambda 成功籌集了 15 億美元,此前與微軟達成了一項數十億美元的基礎設施供應協議。
    • Google 暨 Alphabet 執行長 Sundar Pichai 警告,當前的 AI 投資熱潮中存在「非理性因素」,但他認為 Google 憑藉其從晶片到模型的「全端技術」優勢,能更好地度過市場波動
  • 網路核心基礎設施的脆弱性導致服務大規模中斷,用戶資料面臨風險
    • Cloudflare 在 2025 年 11 月 18 日發生了一次大範圍服務中斷,影響了包括 ChatGPT 和 X 在內的多個熱門網站。
    • WhatsApp 曾有一個漏洞,允許研究人員未經授權提取 35 億用戶的電話號碼,其中約 57% 的用戶的個人資料照片也因此暴露。
  • 硬體創新提升行動裝置 Wi-Fi 效能與高密度電路板布線速度
    • 蘋果(Apple)客製化的 N1 晶片在 iPhone 17 系列上實現了 Wi-Fi 性能的實質性提升,全球中位下載和上傳速度比前一代高出達 40%。
    • OrthoRoute 專案展示了利用 GPU 加速 PathFinder 演算法,在 41 小時內成功完成擁有 8,192 條網路的複雜印刷電路板(PCB)背板布線,證明了高密度布線的可行性
  • 社群媒體平台面臨反壟斷挑戰、法規限制及內容真實性的轉變
    • Meta 在一項里程碑式的反壟斷訴訟中勝訴,法院裁定聯邦貿易委員會(FTC)未能證明 Meta 擁有壟斷地位,此裁決受到 TikTok 和 YouTube 市場主導地位的影響。
    • 維吉尼亞州立法限制 16 歲以下未成年人每日社交媒體使用時間,科技貿易組織 Net Choice 已提起訴訟,認為該法案違反了憲法第一修正案。

人工智慧模型的突破與「代理人化」的作業系統

  • Google Gemini 3 的領先地位與能力拓展
    • Gemini 3 被 Google 譽為其最智慧的模型,旨在幫助使用者實現任何想法
    • Gemini 3 Pro 在推理、多模態理解和「有譯氛圍編程」(vibe coding)方面表現卓越。它能夠更好地理解使用者請求的背景和意圖,從而減少提示詞需求,並在 LMArena 領先榜上以 1501 Elo 分數位居榜首。
    • Google 同時推出 Gemini 3 Deep Think 模式,透過增強的推理和多模態理解能力,解決更複雜的問題,其在 Humanity’s Last Exam(未搭配工具)中的得分提升至 41.0%。
    • Gemini 3 正在大規模推廣到 Google 搜尋中的「人工智慧模式」(AI Mode in Search)、Gemini 應用程式、Vertex AI,以及新的「代理人開發平台」Google Antigravity。
  • 人工智慧代理人能力的深化與應用
    • Gemini 3 Pro 結合更深層次的推理和更一致的工具使用,使其能夠代為執行複雜的多步驟工作流程,例如預訂本地服務或組織電子郵件,這些「代理人能力」已開放給 Google AI Ultra 訂閱者試用。
    • Google Antigravity 平台提升了開發者的體驗,使人工智慧從工具轉變為積極的合作夥伴。該平台的代理人被提升到專門的介面,並可直接存取編輯器、終端機和瀏覽器,以自主規劃和執行端對端軟體任務。
    • Gemini 3 是 Google 有史以來最安全的模型,已接受最全面的安全評估,且展現出減少諂媚、增強抵抗提示注入(prompt injections)和改進防範網路攻擊的能力
  • 微軟將 Windows 11 轉變為人工智慧畫布
    • 微軟正在把 Windows 轉變為「代理人作業系統」,其目標是讓每個用戶都能獲得人工智慧的「超能力」(superpowers)。
    • 人工智慧代理人(包括 Microsoft 365 Copilot 和第三方選項)被整合到 Windows 11 的工作列中,使用者可透過「詢問 Copilot」(Ask Copilot)按鈕啟動。
    • 代理人能夠在後臺執行任務,例如研究資料或存取檔案以自動化管理任務。使用者可以透過工作列上的圖示查看代理人的狀態,或透過一個浮動視窗與其互動。
    • 代理人在一個被稱為「代理人工作區」(Agent workspace)的獨立、受控且可稽核的執行環境中運作,每個代理人使用獨立的 Windows 帳號,以確保安全性。
  • Grok 4.1 專注於情感智慧與可用性
    • XAI 推出了 Grok 4.1,宣稱其幻覺率比前一代模型減少了三倍。
    • Grok 4.1 顯著提高了實際應用中的可用性,專注於「富有創造性、情感和協作性」的互動。
    • Grok 4.1 在「EQ Bench 3.0」情感智慧基準測試中位居榜首,意味著該模型在理解人類情感和給予同理心回應方面表現最佳。

網路安全漏洞與核心設施的穩定性

  • Cloudflare 服務中斷事件詳情
    • 在 2025 年 11 月 18 日上午,基礎設施公司 Cloudflare 發生了廣泛的服務中斷,導致許多熱門網站和服務(包括 X、ChatGPT、Spotify 和 Uber 等)受到影響。
    • Cloudflare 技術長表示,中斷原因不是網路攻擊,而是由於其「機器人緩解能力」(bot mitigation capability)服務中存在的一個潛在錯誤,被一個常規的配置變更所觸發,最終導致網路服務大規模降級。
    • 此事件凸顯了全球網際網路對少數核心基礎設施供應商的高度依賴和潛在的脆弱性
  • WhatsApp 數十億用戶電話號碼被提取
    • 奧地利研究人員透過 WhatsApp 的「聯繫人探索」(contact discovery)功能,成功從該通訊服務中提取了 35 億用戶的電話號碼。
    • 研究人員可以存取其中約 57% 用戶的個人資料照片,以及約 29% 用戶的個人資料文字。
    • 研究人員將其描述為「歷史上最大規模的資料洩露,如果它不是作為一項負責任的研究進行收集的話」。
    • Meta 認為這些暴露的資料屬於「基本的公開資訊」,因為用戶如果選擇私密設定,個人照片和文字就不會被公開。
    • Meta 感謝研究人員在 2025 年 4 月警告該發現,並表示已於 2025 年 10 月實施了更嚴格的「速率限制」(rate-limiting)措施,修復了研究人員用於大規模抓取資料的漏洞。

人工智慧經濟學與基礎設施的巨額融資

  • AI 泡沫化警告與 Google 的全端優勢
    • Google 暨 Alphabet 執行長 Sundar Pichai 承認,當前的 AI 投資週期存在「非理性因素」,並警告沒有任何公司能對潛在的泡沫破裂免疫,此看法呼應了 1996 年聯邦準備理事會(Fed)主席 Alan Greenspan 對「非理性繁榮」(irrational exuberance)的警告。
    • Pichai 認為,Google 採取的「全端技術」(full stack)方法,涵蓋了從晶片、研究模型到 YouTube 資料的整個技術堆棧,將使其能更好地應對市場動盪。
    • Pichai 也提到,AI 發展對能源有「巨大」需求,這已影響了 Alphabet 實現其氣候目標的進度,但該公司仍致力於在 2030 年前達成淨零排放。
  • 大規模的 AI 基礎設施採購與投資
    • Anthropic 與微軟和 Nvidia 達成新的戰略夥伴關係。
      • Anthropic 承諾採用 Microsoft Azure 服務,將採購 300 億美元的雲端運算容量,並簽訂高達 1 gigawatt 的額外運算容量合約。
      • Nvidia 和微軟承諾分別向 Anthropic 投資高達 100 億美元和 50 億美元。
    • AI 資料中心供應商 Lambda 成功籌集了 15 億美元,此前該公司已與微軟簽署了一項價值數十億美元的協議,以提供數萬個 Nvidia GPU 基礎設施。
  • 科技巨頭透過債務融資推動 AI 建設
    • 科技公司正透過發行債券來籌集大量資金以支持人工智慧基礎設施的建設。
    • 亞馬遜(Amazon)在 2025 年進行了三年來的首次美國債券發行,籌集了 150 億美元。
    • 摩根大通(JP Morgan Chase Company)預計,為資助 AI 投資而掀起的新一波支出,將推動美國高評級債券市場的發行量在 2026 年達到創紀錄的 1.81 兆美元。
  • Oracle 與 OpenAI 交易引發的市場疑慮
    • Oracle 在 2025 年 9 月 10 日宣布與 OpenAI 達成一項價值 3,000 億美元的交易後,其股價市值已下跌超過 3,150 億美元。
    • 投資者擔憂 Oracle 透過債務融資支持大規模資料中心擴張的風險,預計該公司的淨債務到 2030 年將比 2021 年增長一倍以上,且現金流預計將連續五年保持負值
    • Databricks 正在洽談以超過 1,300 億美元的估值進行新一輪融資,反映了市場對提供雲端軟體且能產生現金流的 AI 開發商的強烈興趣。

硬體效能與工程技術的進展

  • 蘋果 N1 晶片對 Wi-Fi 效能的實質提升
    • 蘋果在 iPhone 17 系列中導入了其首個客製化的網路晶片 N1。
    • N1 晶片使 iPhone 17 系列在全球中位下載和上傳速度上比前一代(基於 Broadcom 的 iPhone 16 系列)高出達 40%。
    • N1 晶片的主要優勢在於提升性能的下限而非上限,這意味著它在較差或具挑戰性的 Wi-Fi 環境中能提供更一致的體驗,10% 分位數(最差條件)下的速度提升超過 60%
    • N1 晶片規格受限於 160 MHz 通道寬度,缺乏 Wi-Fi 7 所需的 320 MHz 支援,但在實際應用中,由於支援 320 MHz 的路由器基數仍然很小,這一理論上的限制尚未對整體性能造成重大影響。
  • GPU 加速印刷電路板(PCB)布線
    • OrthoRoute 是一個為 KiCad 開發的新型 PCB 自動布線器,專門設計用於解決超大規模背板的布線問題。
    • 該工具採用 PathFinder 演算法的「曼哈頓正交布線引擎」(Manhattan Orthogonal Routing Engine),將 PCB 視為圖形,並利用 CUDA 進行 GPU 加速。
    • 開發者利用租賃的 80GB A100 GPU,耗時 41 小時完成了擁有 8,192 條網路的複雜背板布線,總共產生 44,233 個盲孔與埋孔。
    • 該專案證明了為現場可編程邏輯閘陣列(FPGA)設計的演算法可以成功地被應用於更廣泛的電路板布線,並能快速處理傳統布線器難以應對的高密度設計
  • FPGA 在復古遊戲主機中的應用
    • Analogue 3D 是一款使用 FPGA 核心精確複製任天堂 64(Nintendo 64, N64)的現代主機,旨在解決舊 N64 透過現代高清電視(HDTV)播放時圖像模糊的問題。
    • Analogue 3D 具備強大的 FPGA 核心(Altera Cyclone FPGA,擁有 220,000 個邏輯元件),能夠實現完全準確且無延遲的 N64 模擬。
    • 該主機設計精美,並具備優秀的顯示濾鏡,特別是三種模擬陰極射線管(CRT)的模式,能有效地柔化多邊形邊緣並模擬老式電視的螢幕光暈
    • 儘管 FPGA 核心強大,但 Analogue 3D 不支援 Analogue 自己推動的 OpenFPGA 標準,限制了使用者利用該硬體模擬其他遊戲系統的能力。

平台監管、法律訴訟與媒體傳播模式

  • Meta 反壟斷訴訟的結果
    • 一名聯邦法官裁定 Meta 在聯邦貿易委員會(FTC)提起的反壟斷訴訟中勝訴。
    • 法官認為,FTC 未能證明 Meta 在社群媒體市場上擁有壟斷地位,此裁決受到 TikTok 和 YouTube 在市場上的主導地位影響。
    • Meta 的辯護理由,即 TikTok 和 YouTube 是其主要競爭對手,成功地說服了法官,法官認為這些平台的存在足以阻止 Meta 構成壟斷
  • 社群平台領導層的變動與價值觀堅守
    • 去中心化社群媒體平台 Mastodon 的創辦人宣布辭去執行長一職,並將商標和其他資產轉移給 Mastodon 非營利組織。
    • 此舉旨在確保該專案能夠忠於其以社群為中心的價值觀,避免「創辦人自我(founder egos)破壞蓬勃發展的社群」。
    • 創辦人認為經營社群媒體專案壓力巨大,需要退一步尋求與專案更健康的關係,未來將擔任顧問而非公開角色。
  • 政治人物在數位平台上的溝通挑戰
    • 通訊學教授指出,在注意力競爭激烈的環境中,政治人物必須採用新媒體格式來傳遞訊息。
    • 像 TikTok 這樣的短影音平台偏愛具備「真實性」(authenticity)的、略顯粗糙且互動性高的內容(例如 Corino Zoran Mandani 的競選影片)。
    • 傳統上為電視廣播練就的精緻演講技巧,例如 Andrew Cuomo 的競選廣告,由於過於「流暢」(slick)和「拋光」(polished),不適合在需要親密、真誠和隨性(freewheeling)特質的短影音或播客(Podcast)平台上傳播,被視為「轉存軟體」(shovelware)的應用
  • 未成年人社群媒體使用限制的法規爭議
    • 科技貿易組織 Net Choice 已對維吉尼亞州提起訴訟,試圖阻止 SB854 法案在 2026 年 1 月 1 日生效。
    • 該法案要求限制 16 歲以下未成年人每日社交媒體使用時間不得超過一小時,除非獲得家長同意。
    • Net Choice 認為該法案限制了線上言論自由,且要求平台「以商業上合理的方法」(commercially reasonable methods)驗證用戶年齡,可能引發潛在的隱私和安全問題。

資料來源

聽完碎碎念後,記得按讚、收藏、分享喔~, 科技碎碎念將繼續為您追蹤最新時事,讓您通勤時、空閒時一樣能持續了解最新關鍵話題,下次見!

請注意,內容由 AI 產生,目前仍處於培訓階段,可能存在邏輯偏差或資訊誤差,內容僅供參考,如有謬誤請以原文資訊為主。

留言
avatar-img
留言分享你的想法!
avatar-img
科技碎碎念
5會員
133內容數
哈囉!這邊是科技碎碎念,資訊 x AI時代下,我們將從海量的全球新聞與新知中,透過生成式 AI 彙整出精華懶人包,聚焦全球科技關鍵話題,讓您輕鬆透過閱讀或聆聽掌握趨勢變革。 請注意,內容由 AI 產生,目前仍處於培訓階段,可能存在邏輯偏差或資訊誤差,內容僅供參考,如有謬誤請以原文資訊為主。
科技碎碎念的其他內容
2025/11/18
文章探討Apple執行長接班計劃、iPhone產品發布周期的重大轉型,以及傑夫·貝佐斯創立AI新公司「普羅米修斯計畫」的未來布局。
Thumbnail
2025/11/18
文章探討Apple執行長接班計劃、iPhone產品發布周期的重大轉型,以及傑夫·貝佐斯創立AI新公司「普羅米修斯計畫」的未來布局。
Thumbnail
2025/11/17
文章探討OpenAI群組聊天功能試行、AI伴侶裝置的早期評價、資料中心能源危機、以及科技巨頭在產品策略與市場調整上的最新動向。
Thumbnail
2025/11/17
文章探討OpenAI群組聊天功能試行、AI伴侶裝置的早期評價、資料中心能源危機、以及科技巨頭在產品策略與市場調整上的最新動向。
Thumbnail
2025/11/14
文章聚焦Valve推出的Steam Machine與Steam Frame,重新定義家用主機與VR領域,同時探討AI模型技術進化與汽車加速限制草案對電動車的影響。
Thumbnail
2025/11/14
文章聚焦Valve推出的Steam Machine與Steam Frame,重新定義家用主機與VR領域,同時探討AI模型技術進化與汽車加速限制草案對電動車的影響。
Thumbnail
看更多
你可能也想看
Thumbnail
前陣子在 AI 圈內一個名為「Nano Banana」的神秘模型,在 AI 模型競技場 LMArena 上匿名測試,因為出色表現引起廣泛討論。Google 在 2025 年 8 月 26 日發布,「Nano Banana」就是最新的圖像生成模型:Gemini 2.5 Flash Image。
Thumbnail
前陣子在 AI 圈內一個名為「Nano Banana」的神秘模型,在 AI 模型競技場 LMArena 上匿名測試,因為出色表現引起廣泛討論。Google 在 2025 年 8 月 26 日發布,「Nano Banana」就是最新的圖像生成模型:Gemini 2.5 Flash Image。
Thumbnail
生成式 AI 已經能創作圖片、影片與音樂,但能否直接生成一個可探索、可互動的 3D 世界?Google DeepMind 在 2025 年 8 月 5 日發布的 Genie 3 正是這個方向的重要突破。它不只是視覺內容生成,而是提供了一個能「在世界中行動」的 AI 平台
Thumbnail
生成式 AI 已經能創作圖片、影片與音樂,但能否直接生成一個可探索、可互動的 3D 世界?Google DeepMind 在 2025 年 8 月 5 日發布的 Genie 3 正是這個方向的重要突破。它不只是視覺內容生成,而是提供了一個能「在世界中行動」的 AI 平台
Thumbnail
Gemini Diffusion Google 在本次 Google I/O 大會上,揭曉了一款名為 Gemini Diffusion 的實驗性文字生成模型。這款模型最大的亮點在於採用了「擴散技術 (Diffusion Techniques)」,與我們熟知的傳統自回歸語言模型 (Autoregre
Thumbnail
Gemini Diffusion Google 在本次 Google I/O 大會上,揭曉了一款名為 Gemini Diffusion 的實驗性文字生成模型。這款模型最大的亮點在於採用了「擴散技術 (Diffusion Techniques)」,與我們熟知的傳統自回歸語言模型 (Autoregre
Thumbnail
Google的 NotebookLM 推出重大更新,其「深入探索對話」功能現已支援超過50種語言,包括中文、西班牙文、法文、日文等。這項更新打破了以往僅限英語的限制,讓使用者能輕鬆生成多語言的podcast風格內容,無論原始資料是何種語言,以下將詳細介紹這次更新的核心亮點與使用方式。
Thumbnail
Google的 NotebookLM 推出重大更新,其「深入探索對話」功能現已支援超過50種語言,包括中文、西班牙文、法文、日文等。這項更新打破了以往僅限英語的限制,讓使用者能輕鬆生成多語言的podcast風格內容,無論原始資料是何種語言,以下將詳細介紹這次更新的核心亮點與使用方式。
Thumbnail
Google 除了 Bard 聊天機器人可以生成圖片外,他還有獨立的生成圖片工具「 ImagenFX」,是由 Imagen 2 支援的新圖像生成工具,操作非常簡單,使用者只要輸入文字描述,就能生成逼真且符合描述的圖像。
Thumbnail
Google 除了 Bard 聊天機器人可以生成圖片外,他還有獨立的生成圖片工具「 ImagenFX」,是由 Imagen 2 支援的新圖像生成工具,操作非常簡單,使用者只要輸入文字描述,就能生成逼真且符合描述的圖像。
Thumbnail
Google Research 在2024年給出了令人滿意的新年禮物,這篇論文內的方法,若持續發展下去,可望顛覆整個影音創作產業,未來製作生動的影音動畫,不再是令人頭痛與耗費心力的一件事情,是不是很酷,讓我們一起看看到底是如何做到的。
Thumbnail
Google Research 在2024年給出了令人滿意的新年禮物,這篇論文內的方法,若持續發展下去,可望顛覆整個影音創作產業,未來製作生動的影音動畫,不再是令人頭痛與耗費心力的一件事情,是不是很酷,讓我們一起看看到底是如何做到的。
Thumbnail
Google推出AI聊天機器人Bard加入生成圖像的功能,基於Imagen 2模型的圖像生成,讓使用者可以輸入文字描述,讓Google Bard 生成相對應圖片。
Thumbnail
Google推出AI聊天機器人Bard加入生成圖像的功能,基於Imagen 2模型的圖像生成,讓使用者可以輸入文字描述,讓Google Bard 生成相對應圖片。
Thumbnail
Google最近如火如荼地訓練它的AI文字生成工具BARD,最近也開始在Google文書工具中(Google文件、Google試算表、etc.)提供AI生成功能。該功能仍處於實驗階段,且只支援英文指令和英文生成,若要轉為中文需要額外的工序。
Thumbnail
Google最近如火如荼地訓練它的AI文字生成工具BARD,最近也開始在Google文書工具中(Google文件、Google試算表、etc.)提供AI生成功能。該功能仍處於實驗階段,且只支援英文指令和英文生成,若要轉為中文需要額外的工序。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News