OpenAI推出GPT-5.1!AI會先『思考』再回答了? #111

更新 發佈閱讀 16 分鐘

哈囉!這邊是科技碎碎念,資訊 x AI時代下,我們將從海量的全球新聞與新知中,透過生成式 AI 彙整出精華懶人包,聚焦全球科技關鍵話題,讓您輕鬆透過閱讀或聆聽掌握趨勢變革。

科技碎碎念 傳送門
Youtube 傳送門
「大肚報報」社群傳送門

快速重點摘要

  • 人工智慧模型表現的最新趨勢與挑戰
    • 在金融工作流程中,大型語言模型(LLM)的輸出漂移問題影響了可審計性,且較小的模型(如 Granite-3-8B 和 Qwen2.5-7B)在確定性輸出方面表現反而優於大型模型(如 GPT-OSS-120B),挑戰了傳統認為模型越大越好的假設
    • OpenAI 推出 GPT-5.1 升級,旨在提高智慧與對話性,並首次在 Instant 模型中引入自適應推理,使其在回應複雜問題前能先「思考」。
    • AI 基礎設施的電力需求激增,部分歸因於 AI 資料中心的增長,導致電價自 2020 年 2 月以來上漲了 40%。
  • 自主駕駛與硬體平台的技術突破與成本考量
    • Alphabet 旗下的 Waymo 成為世界上第一個提供行駛於高速公路、且車內沒有人類駕駛員的自動駕駛計程車服務,此舉預計可縮短行駛時間多達 50%。
    • Framework Laptop 16 推出升級,加入了 Nvidia GeForce RTX 5070 獨立顯示模組,這讓該筆記型電腦首次能夠利用 DLSS 和 CUDA 等 Nvidia 專有技術,提高了遊戲和專業應用程式的靈活性
    • 華爾街專家警告,大型雲端服務供應商可能低估了 AI 晶片的折舊,因為像 Nvidia 這樣的晶片資產壽命可能只有約五年,需要持續大量重複性支出。
  • 消費者隱私與監管執行的重大事件
    • Google 對一個名為 Lighthouse 的中國網路釣魚即服務集團提起訴訟,旨在讓法院裁定其活動非法,從而獲得法律基礎要求其他平台協助移除其基礎設施。
    • OpenAI 正在努力反對法院命令,該命令要求它向訴訟原告提供 2,000 萬筆去識別化的 ChatGPT 完整對話紀錄,OpenAI 認為人工智慧聊天紀錄應如同私人電子郵件一樣受到保護
    • Amazon 正在加強對 Fire TV Stick 上的非法串流媒體應用程式的打擊,並將其新裝置(例如 4K Select)配置為僅允許從 Amazon App Store 下載應用程式。

人工智慧模型的技術迭代與部署考量

  • 大型語言模型(LLM)的確定性與金融應用
    • 金融機構將 LLM 應用於對帳、監管報告和客戶通訊等任務。然而,非確定性輸出(輸出漂移)會破壞模型的審計能力和信任度。
    • 研究發現模型大小與輸出一致性呈現強烈的反比關係。較小的模型,例如 Granite-3-8B 和 Qwen2.5-7B,在 T=0.0(貪婪解碼)時能夠實現 100% 的輸出一致性。相較之下,GPT-OSS-120B 的一致性僅有 12.5%。
    • 研究貢獻包括:開發出結合貪婪解碼(T=0.0)、固定種子和美國證券交易委員會(SEC)10-K 結構感知檢索排序的金融校準確定性測試工具。
    • 模型敏感性表現出任務依賴性:結構化任務(如 SQL)即使在 T=0.2 時仍保持穩定,而檢索增強生成(RAG)任務則顯示出 25% 至 75% 的漂移。
    • 該框架包括三層模型分類系統,有助於制定適當的風險部署決策,並提供符合金融穩定理事會(FSB)、國際清算銀行(BIS)和商品期貨交易委員會(CFTC)要求。
  • OpenAI GPT-5.1 系列的升級重點
    • OpenAI 於 2025 年 11 月 12 日發佈了 GPT-5.1 系列升級,包括 GPT-5.1 Instant 和 GPT-5.1 Thinking。
    • GPT-5.1 Instant 是 ChatGPT 最常用的模型,現在預設語氣更為熱情、更具對話性。它也改進了指令遵循能力。GPT-5.1 Instant 首次能夠使用自適應推理,在處理更具挑戰性的問題時,會先進行「思考」再回應,從而提供更徹底、更準確的答案
    • GPT-5.1 Thinking 變得更有效率且更容易理解。它能夠更精確地根據問題調整思考時間,在處理複雜請求時給出更詳盡的答案,同時對簡單請求的等待時間更短。
    • 新模型的預設語氣被描述為更熱情和更具同理心。OpenAI 還引入了更直觀有效的控制選項,以便使用者能更好地客製化 ChatGPT 的語氣,包括「專業」(Professional)、「坦率」(Candid)和「古怪」(Quirky)等預設選項。
    • GPT-5(Instant 和 Thinking)將以舊版模型形式保留三個月,供付費訂戶比較和適應。
  • 新的 AI 模型類別:世界模型
    • 人工智慧領域的發展正迅速從「文字轉影片」邁向「文字轉世界生成」。
    • FiFi Lee 的 World Labs 推出了其首個世界模型 Marble。世界模型是一種 AI 系統,可以生成環境的內部表示,並用於預測未來結果和規劃行動。
    • Marble 與其他模型不同,它創造的是持久且可下載的 3D 環境,而不是在探索時即時生成世界,這減少了變形或不一致性的問題
    • Marble 提供 AI 原生編輯工具和混合 3D 編輯器,使用者可以在 AI 填補視覺細節之前,先設定空間結構(例如牆壁或盒子)。
    • Marble 的初始使用案例包括遊戲(用於生成背景環境和環境空間)、電影視覺效果(VFX)和虛擬實境(VR)。生成的 3D 資產允許藝術家精確地安排場景和控制攝影機移動。

基礎設施、能源與硬體創新趨勢

  • AI 對電力需求的影響與經濟風險
    • 根據勞動統計局的資料,自 2020 年 2 月以來,電價已上漲 40%,漲幅超過總體生活成本 26% 的增幅。
    • 電力價格上漲的部分原因是 AI 熱潮帶動的電力需求增加,以及大量新資料中心的出現。
    • 公用事業公司預計,在未來五年內,建造新的電源和更具彈性的電網將花費超過一兆美元。
    • 加州大學柏克萊分校哈斯商學院能源研究所的專家指出,如果資料中心在尖峰時段(例如夏季最熱的日子)暫時切換到備用電源,或者將其資料流量重新路由到較冷的地區,它們就不會產生任何成本壓力。
    • 如果監管機構和政治人物為了經濟發展給予資料中心優惠電價,住宅用戶最終可能會承擔部分 AI 相關電力成本
  • AI 晶片折舊的會計風險
    • 著名投資人 Michael Burry 警告,大型雲端服務供應商可能低估了 AI 晶片的折舊。
    • Nvidia 的 AI 晶片價格高昂,構成了大型科技公司數千億美元投資中的重要部分。然而,這些晶片的資產壽命可能只有五年左右,並需要不斷升級以保持競爭力。
    • 自 2020 年左右,大型雲端服務供應商開始將伺服器的折舊年限從最短三年延長到約六年,這有助於分散其大額資本支出的獲利影響。例如,Meta 透過延長伺服器和網路資產的有用壽命,使其在九個月內淨收入增加了近 20 億美元。
    • 折舊增加可能導致大型雲端服務供應商必須更加警惕地控制其他成本,例如可能導致裁員。
  • 半導體網路加速與企業重組
    • 隨著 AI 資料中心投入數十億美元,從事晶片與晶片、伺服器機架與機架之間連接的網路技術創新正在加速。
    • 由於 AI 工作負載對高頻寬的需求不斷增長,傳統依賴電子的互連技術已難以跟上,因此光學技術(光子學)正在迎來復興。
    • Nvidia 透過多年前收購 Mellanox 和 Cumulus Networks,在垂直整合 GPU 堆疊方面具備關鍵優勢。
    • Synopsys 在完成 350 億美元收購 Ansys 之後,且第三季營收未達分析師預期,計畫裁員約 10%(約 2,000 名員工)。Synopsys 預計這項重組計畫將產生 3 億至 3.5 億美元的稅前費用。
  • Framework Laptop 16 的模組化發展
    • Framework Laptop 16 是一個注重模組化、可修復性和可升級性的平台。儘管其體積和重量通常大於同級筆記型電腦。
    • 最新的升級包括支援新的 AMD Ryzen AI 300 系列處理器,這些處理器配備了升級的 NPU,符合 Microsoft 的 Copilot+ PC 標準。
    • Framework 首次提供了 Nvidia 產品,即 GeForce RTX 5070 顯示模組,這使得該筆記型電腦能夠存取 DLSS 和 CUDA 等重要專有技術
    • 新的 RTX 5070 模組價格昂貴(約 650 至 699 美元)。儘管性能有所提升,但其性能仍受到行動版晶片 8GB 記憶體的限制。
    • 該筆記型電腦的其他升級包括:充電器從 180W 升級為最大 240W 的型號,以及支援 Nvidia G-Sync 的第二代 16 吋螢幕。

消費者服務、隱私與監管

  • Waymo 自動駕駛服務擴展到高速公路
    • Waymo 成為全球首家在高速公路上提供無人駕駛計程車服務的公司,服務範圍擴及舊金山灣區、洛杉磯和鳳凰城。
    • Waymo 預計,在這些地區新增高速公路路線可以讓部分行程時間縮短高達 50%。
    • 服務將逐步推出,乘客必須在 App 中選擇偏好才能使用高速公路路線。該服務每天 24 小時可用,但並非涵蓋所有高速公路。
    • 儘管高速公路駕駛通常更簡單,但 Waymo 發現高速公路上的關鍵事件(critical events)發生頻率較低,導致訓練和測試系統所需的真實世界資料收集更具挑戰性
    • Waymo 已開始在聖荷西國際機場(San Jose Mineta International Airport)提供路邊接送服務。
  • 用戶隱私與版權的法律衝突
    • OpenAI 正尋求法院撤銷一項裁決,該裁決要求其向《紐約時報》等原告提供 2,000 萬筆完整的 ChatGPT 用戶對話紀錄。
    • OpenAI 聲明,這 2,000 萬筆對話紀錄是完整的對話,而非單一的提示-輸出對。OpenAI 認為披露這些完整的對話比單一對話片段更容易洩露私人資訊。
    • OpenAI 認為要求大規模提供個人資訊開創了危險的先例,因為「與本案毫無關係」的對話佔據了超過 99.99%
    • 在歐洲,慕尼黑法院裁定 OpenAI 的 ChatGPT 侵犯了德國的著作權法,因為它使用受保護的德國歌曲歌詞作為訓練資料。
  • Amazon 打擊盜版串流媒體
    • Amazon 正在實施更嚴格的措施來打擊非法串流媒體,目標是封鎖在其 Fire TV Stick 裝置上提供盜版內容的應用程式。
    • 研究顯示,在英國,約有 470 萬成年人在過去六個月內觀看了非法串流媒體,其中 31% 使用 Fire Stick 和其他網路協定電視(IPTV)裝置,使其成為僅次於網站(42%)的第二大流行方式。
    • Amazon 稱,新的 Fire TV Stick 4K Select 採用新的 Vega 作業系統,只允許客戶從 Amazon App Store 下載應用程式。
    • Amazon 的發言人表示,他們將封鎖所有被認定為提供盜版內容的應用程式,包括那些從外部 App Store 下載的應用程式。
    • 有業界人士指出,舊版 Fire TV Stick 的開放開發者軟體特性「助長了盜版」,並且是一個「對消費者安全來說風險普遍較高的裝置」。
  • Brother 雷射印表機的長期使用經驗
    • 受訪者對 Brother HL-L3295 CDW 四色雷射印表機的長期使用經驗顯示,其列印速度快了四倍,且沒有傳統噴墨印表機常有的噴頭清潔問題。
    • 主要用途包括列印家庭教育材料、文件校對、列印產品手冊,以及無法數位簽署的學校表格。
    • 耗材成本相對較高:高容量黑色碳粉匣售價 120 美元,可列印 4,500 頁。但相較於噴墨墨水,可以避免不斷清潔噴頭的麻煩。
    • 該雷射印表機的缺點在於列印照片的品質很差,與高階噴墨印表機相比,效果「一團糟」(a hot mess)。對於高要求的照片列印,建議使用專業沖印服務。

資料來源

聽完碎碎念後,記得按讚、收藏、分享喔~, 科技碎碎念將繼續為您追蹤最新時事,讓您通勤時、空閒時一樣能持續了解最新關鍵話題,下次見!

請注意,內容由 AI 產生,目前仍處於培訓階段,可能存在邏輯偏差或資訊誤差,內容僅供參考,如有謬誤請以原文資訊為主。

留言
avatar-img
科技碎碎念
8會員
203內容數
哈囉!這邊是科技碎碎念,資訊 x AI時代下,我們將從海量的全球新聞與新知中,透過生成式 AI 彙整出精華懶人包,聚焦全球科技關鍵話題,讓您輕鬆透過閱讀或聆聽掌握趨勢變革。 請注意,內容由 AI 產生,目前仍處於培訓階段,可能存在邏輯偏差或資訊誤差,內容僅供參考,如有謬誤請以原文資訊為主。
科技碎碎念的其他內容
2025/11/12
文章探討AI巨頭微軟、Meta、軟銀在通用人工智慧(AGI)上的不同策略與資金流動,並分析演算法優化、科技產品定位、基礎設施挑戰及開源專案的困境。
Thumbnail
2025/11/12
文章探討AI巨頭微軟、Meta、軟銀在通用人工智慧(AGI)上的不同策略與資金流動,並分析演算法優化、科技產品定位、基礎設施挑戰及開源專案的困境。
Thumbnail
2025/11/11
文章聚焦人工智慧(AI)代理人技術的演進、TikTok Shop電商崛起、歐盟監管政策轉變,以及記憶體安全語言的推廣,並探討AI對隱私、商業和技術標準化的影響。
Thumbnail
2025/11/11
文章聚焦人工智慧(AI)代理人技術的演進、TikTok Shop電商崛起、歐盟監管政策轉變,以及記憶體安全語言的推廣,並探討AI對隱私、商業和技術標準化的影響。
Thumbnail
2025/11/10
文章分析人工智慧(AI)在基礎設施與財務壓力上的影響,探討生成式AI在法律、心理健康及市場應用中的挑戰,同時闡述科技業裁員與電動車市場供應鏈風險。
Thumbnail
2025/11/10
文章分析人工智慧(AI)在基礎設施與財務壓力上的影響,探討生成式AI在法律、心理健康及市場應用中的挑戰,同時闡述科技業裁員與電動車市場供應鏈風險。
Thumbnail
看更多
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
用AI檢測器檢測自己文章的AI化程度:沒有AI協作的文章被檢測有AI生成的成分,這結果我也是驚了個呆!
Thumbnail
用AI檢測器檢測自己文章的AI化程度:沒有AI協作的文章被檢測有AI生成的成分,這結果我也是驚了個呆!
Thumbnail
深入了解檢索式增強生成 (RAG) 如何解決大型語言模型 (LLM) 的幻覺與資訊時效性問題。TN科技筆記解析不同RAG方法以及如何選擇最適合的方案,讓你的 AI 更智慧、更可靠!
Thumbnail
深入了解檢索式增強生成 (RAG) 如何解決大型語言模型 (LLM) 的幻覺與資訊時效性問題。TN科技筆記解析不同RAG方法以及如何選擇最適合的方案,讓你的 AI 更智慧、更可靠!
Thumbnail
深入了解檢索式增強生成 (RAG) 如何解決大型語言模型 (LLM) 的幻覺與資訊時效性問題。TN科技筆記解析不同RAG方法以及如何選擇最適合的方案,讓你的 AI 更智慧、更可靠!
Thumbnail
深入了解檢索式增強生成 (RAG) 如何解決大型語言模型 (LLM) 的幻覺與資訊時效性問題。TN科技筆記解析不同RAG方法以及如何選擇最適合的方案,讓你的 AI 更智慧、更可靠!
Thumbnail
本文探討 RAG + LLM 技術的應用與挑戰,分析 Google、IBM、微軟、AWS 等科技巨頭和開源社群的策略,並提供新進業者和企業在導入 RAG + LLM 系統時的建議,包括重視向量空間建立、選擇合適的 RAG 策略、持續學習和實驗以及資料品質等面向。
Thumbnail
本文探討 RAG + LLM 技術的應用與挑戰,分析 Google、IBM、微軟、AWS 等科技巨頭和開源社群的策略,並提供新進業者和企業在導入 RAG + LLM 系統時的建議,包括重視向量空間建立、選擇合適的 RAG 策略、持續學習和實驗以及資料品質等面向。
Thumbnail
本文探討提升大語言模型 (LLM) 效能的三種關鍵技術:LLM 微調、RAG (檢索增強生成) 和知識蒸餾,比較其優勢和挑戰,並深入分析 RAG 與知識蒸餾的結合應用及未來發展方向。
Thumbnail
本文探討提升大語言模型 (LLM) 效能的三種關鍵技術:LLM 微調、RAG (檢索增強生成) 和知識蒸餾,比較其優勢和挑戰,並深入分析 RAG 與知識蒸餾的結合應用及未來發展方向。
Thumbnail
Google Research 在2024年給出了令人滿意的新年禮物,這篇論文內的方法,若持續發展下去,可望顛覆整個影音創作產業,未來製作生動的影音動畫,不再是令人頭痛與耗費心力的一件事情,是不是很酷,讓我們一起看看到底是如何做到的。
Thumbnail
Google Research 在2024年給出了令人滿意的新年禮物,這篇論文內的方法,若持續發展下去,可望顛覆整個影音創作產業,未來製作生動的影音動畫,不再是令人頭痛與耗費心力的一件事情,是不是很酷,讓我們一起看看到底是如何做到的。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News