vocus logo

方格子 vocus

DeepSeekMath-V2超越人類!數學推理和定理證明進入AI時代? #122

更新 發佈閱讀 18 分鐘

哈囉!這邊是科技碎碎念,資訊 x AI時代下,我們將從海量的全球新聞與新知中,透過生成式 AI 彙整出精華懶人包,聚焦全球科技關鍵話題,讓您輕鬆透過閱讀或聆聽掌握趨勢變革。

科技碎碎念 傳送門
Youtube 傳送門
「大肚報報」社群傳送門

快速重點摘要

  • AI 技術的突破與產業影響
    • DeepSeekMath-V2 模型透過自我驗證,在複雜的數學推理和定理證明方面取得重大進展,甚至超越頂尖人類參賽者的成績。
    • AI 已經可以取代 11.7% 的美國勞動力市場,涉及約 1.2 兆美元的工資,主要集中在金融、醫療保健和專業服務領域。
    • 由於美國的出口限制,中國大陸的大型科技公司正將其先進大型語言模型(LLM)的訓練轉移到境外資料中心,尤其是在東南亞地區。
  • 硬體供應鏈與定價壓力
    • 由於 AI 基礎設施對晶片的巨大需求,預計記憶體模組價格將在 2026 年第 2 季前上漲 50%,這將提高電子產品的製造成本。
    • 為應對成本上升,戴爾(Dell)和惠普(HP)等公司正計畫提高產品價格,惠普甚至考慮減少部分產品的記憶體容量。
  • 商業模式與使用者權益爭議
    • Plex 媒體伺服器將遠端存取改為訂閱制,要求伺服器擁有者需訂閱 Plex 通行證(Plex Pass),此舉可能會疏遠長期使用者。
    • FileZilla Pro 的「永久授權」用戶被拒絕提供舊版本安裝程式,導致重新安裝作業系統後,軟體形同作廢,這引發了關於軟體業者如何踐行永久授權承諾的嚴重爭議。
  • 監管與政策新趨勢
    • 英國稅務海關總署(HMRC)提議對去中心化金融(DeFi)的加密貨幣借貸和流動性池採用「無利得,無損失」(NGNL)的稅務規則,這被視為對英國 DeFi 用戶的重大勝利。
    • 美國專利商標局(USPTO)更新指南,確認生成式 AI 系統本身不能成為發明人,但可以類比為實驗室設備或軟體等工具,協助人類發明者進行創新。
  • 使用者體驗與服務變革
    • 澳洲國家氣象局(Bom)網站斥資 9,600 萬澳元進行改版,但因介面難用、重要功能(例如:GPS 座標預報)消失,且改變了雷達圖的顏色方案,引發了使用者的集體憤怒與「#changeitback」的社群標籤行動。

AI 發展、數學推理與勞動力市場的影響

  • AI 在複雜推理和自我驗證的進展
    • DeepSeekMath-V2 模型展現了強大的定理證明能力,該模型透過強化學習訓練出一個驗證器,用於評估和迭代改進自己的證明。
    • 傳統上,用於訓練大型語言模型的強化學習方法是根據最終答案的準確性來獎勵模型,但在數學推理和定理證明中,正確的答案並不保證推理過程的正確性,且此方法不適用於不要求數值結果的證明任務。
    • DeepSeekMath-V2 透過自我驗證機制,在 IMO 2025 和 CMO 2024 等頂尖高中數學競賽中獲得金牌水平的成績,並在普特南數學競賽(Putnam 2024)中獲得近乎滿分(118/120 分)的成績,遠超人類最高分(90 分)。
    • 該模型的訓練方法包括使用中介驗證(Meta-Verification)來評估驗證器識別問題的準確性與可信度,從而減少模型提出不存在問題的「幻覺」。
    • 模型在遇到複雜問題時,會進行序列化精煉與自我驗證,直到模型給自己評分達到滿分為止,這使模型能夠系統性地改善其數學推理能力。
  • AI 在勞動力市場中的即時影響
    • 根據麻省理工學院(MIT)和橡樹嶺國家實驗室(ORNL)共同開發的「冰山指數」(Iceberg Index)勞動力模擬工具估計,AI 目前已能取代美國勞動力市場中 11.7% 的工作內容。
    • 這 1.2 兆美元的工資影響主要集中在金融、醫療保健和專業服務等領域。
    • 冰山指數將 1.51 億美國工人視為獨立個體,透過技能和位置進行繪製,顯示最大的工資風險暴露於人力資源、物流和辦公室行政等領域的常規任務中,而非僅限於科技業裁員等「可見的冰山一角」。
    • 該工具已被田納西州和猶他州等州採用,用於制定 AI 勞動力行動計畫,並指導技能重塑的投資方向。
  • 地緣政治對 AI 發展的影響
    • 由於美國在 2025 年 4 月對高階 Nvidia H20 晶片的銷售實施限制,阿里巴巴(Alibaba)和字節跳動(ByteDance)等主要中國大陸科技公司正日益將其大型語言模型的訓練轉移至境外資料中心,主要在東南亞地區。
    • 雖然有海外轉移的趨勢,但部分公司(例如:Deepseek)仍依賴現有的國內 Nvidia 晶片庫存,並與華為(Huawei)合作開發國內 AI 晶片。

硬體產業、晶片競爭與新產品發布

  • 記憶體晶片供應與成本壓力
    • 由於 AI 基礎設施對晶片需求的爆發性增長,大型科技公司(包括戴爾和惠普)正在為 2026 年的記憶體晶片供應短缺和價格大幅上漲做準備。
    • 反點研究(Counterpoint Research)預測,記憶體模組價格在 2026 年第 2 季前將上漲 50%,這將導致電子產品的製造成本增加。
    • 記憶體成本佔典型個人電腦(PC)成本的估計比例為 15% 到 18%。
    • 為應對成本上升,惠普計畫提高產品價格、減少部分產品中的記憶體容量,並增加供應商以管理成本。
  • 儲存技術的進步
    • 希捷(Seagate)在實驗室中實現了單碟 6.9 TB 的儲存容量,使製造 55 TB 到 69 TB 的硬碟成為物理可能。
    • 希捷利用其熱輔助磁記錄(HAMR)技術實現 6.9 TB 單碟容量,這比目前商業產品中的單碟容量高出一倍多。
    • 希捷的路線圖顯示,6.9 TB 的碟片預計將於 2030 年投入商業產品使用;在此之前,2027 年、2028 年和 2029 年將分別推出 4 TB、5 TB 和 6 TB 的碟片。
    • 隨著 AI 產業對硬碟需求的增加,資料中心硬碟的訂單積壓已達到兩年,持續改進硬碟容量對於滿足需求至關重要。
  • 商業機密與競爭
    • 台灣檢察官升級了對台積電(TSMC)前資深副總羅微先(Low W Xen)的商業機密調查,並搜查了其住所,因為台積電指控羅微先洩露了敏感技術給他的新雇主英特爾公司(Intel Corporation)。
    • 台灣政府和台積電對此案的高度關注,凸顯了台積電尖端晶片技術的戰略重要性,這對台灣的全球市場地位和地緣政治影響力至關重要。
  • 新興硬體產品
    • 阿里巴巴在中國大陸推出了其 Quark AI 眼鏡,包括旗艦 S1 模型和更經濟實惠的 G1 模型,均連接到自家 AI 技術驅動的 Qwen App。
    • 這些 AI 眼鏡的功能包括即時翻譯和 AI 生成的會議記錄,並深度整合了阿里巴巴的生態系統,內建支付寶(Alipay)和淘寶(Taobao)等應用程式。
    • S1 模型配備了更昂貴的微型 OLED 技術和更強大的雙晶片,能產生高達 3K 品質的圖像和 AI 增強的 4K 影片。S1 的起價為 ¥3,799(約 美元),的起價為(約268 美元)。
    • 高通(Qualcomm)發布了 Snapdragon 8 Elite Gen 5 行動平台的初始 Linux 核心支援,以確保開發者能夠立即利用其新功能,包括高效能的 Iris 影片處理單元(VPU)和 Adreno 顯示處理單元(DPU)等。

數位服務、商業模式與使用者權益

  • 訂閱制與遠端存取收費
    • Plex 正在推行新政策,要求使用者訂閱 Plex 通行證(Plex Pass,每月 $7 美元起)才能遠端存取個人媒體伺服器。
    • 在此變更生效前,伺服器擁有者可免費授予遠端存取權限。現在,遠端用戶也可以選擇購買功能較為受限的遠端觀看通行證(Remote Watch Pass,每月 $2 美元起)。
    • 這些變更於 2025 年 4 月 29 日生效,並從 2025 年 11 月開始分階段實施,首先影響透過 Plex Roku OS 應用程式進行遠端存取的使用者。
    • 遠端存取收費預計將於 2026 年擴展到所有其他 Plex 電視應用程式(例如:Fire TV、Apple TV、Android TV)。
  • 網站改版與使用者反彈
    • 澳洲國家氣象局(Bom)耗資約 A萬(約6,230 萬美元)進行網站重新設計,是先前公布成本 A$410 萬的 20 倍。
    • 改版在推出後數小時內就引發大量投訴,包括雨量雷達的新顏色方案、農民和漁民無法再輸入 GPS 座標查詢特定地點預報,以及整體操作不便等問題。
    • 心理學家表示,這種公眾憤怒源於「期望被違背」加上「改變既昂貴又可避免」,網站的改變擾亂了使用者多年來建立的、用於閱讀天氣模式的「程序性記憶」或「肌肉記憶」。
    • 氣象局代理負責人被迫道歉,因為網站的糟糕可用性可能導致昆士蘭州民眾對風暴準備不足。
    • 儘管改版旨在提升穩定性、安全性和無障礙性,但政府仍對氣象局進行了嚴厲斥責並要求立即做出修改。
  • 軟體授權的實質失效
    • FileZilla Pro 的一位購買了「永久授權」(一次性付款,終生使用購買版本權利)的用戶,在重新安裝作業系統後,被拒絕提供舊版本的安裝程式。
    • 儘管支援團隊承認客戶仍有權合法使用舊版本,但以「安全原因不提供舊版本」為藉口,實質上阻止了客戶使用他們已購買的軟體。
    • 這使得永久授權在客戶重新安裝作業系統或遺失安裝程式時,形同作廢,迫使客戶必須再次付費購買新的訂閱模型。
    • 該警告指出,FileZilla 清楚客戶合法擁有舊版本,但仍扣留安裝程式,其意圖可能是欺騙使用者,使其認為專案與 Mozilla 有關。

監管、政策與媒體動態

  • 去中心化金融(DeFi)稅務簡化提案
    • 英國稅務海關總署(HMRC)提議採用「無利得,無損失」(NGNL)的方法來處理加密貨幣借貸和流動性池安排,這將遞延資本利得稅的徵收時點。
    • 根據現行制度,DeFi 用戶將資金存入協定時,即使是為了獲利或借款,也可能被視為一種資產處置並觸發資本利得稅。新提案旨在讓稅務規則與 DeFi 的實際運作方式保持一致,減少不反映經濟現實的稅務結果。
    • 提案的範圍將集中於典型的 DeFi 代幣,不包括代幣化的現實世界資產或傳統證券。
    • 儘管有新提案,用戶在 DeFi 過程中涉及的其他環節(例如:購買以太幣、轉換為封裝以太幣 WETH、或清算獲利)仍可能產生應稅事件。
  • AI 與智慧財產權的規範
    • 美國專利商標局(USPTO)更新了指南,將生成式 AI 視為人類發明者在創新過程中所使用的工具。
    • 該指南指出,AI 系統(包括生成式 AI 和其他計算模型)是人類發明者使用的工具,雖然可以提供服務並產生想法,但它們仍是構思所聲稱發明的人類發明者所使用的工具。
    • 聯邦巡迴上訴法院裁定,AI 不能被列為專利申請或已頒發專利上的發明人,只有自然人才能成為發明人,這項立場在新的 USPTO 指南中沒有改變。
  • AI 服務的限制與撤出
    • 由於 Meta 更新了 WhatsApp 商業解決方案的服務條款,禁止將該應用程式用於分發 AI 為主要產品的第三方 AI 聊天機器人,Chat GBT 和 Copilot 將於 2026 年 1 月 15 日前撤出 WhatsApp。
    • 此變更被視為 Meta 阻止其 AI 競爭對手使用其平台的一種方式,預計其他 AI 聊天機器人(例如:Perplexity)也會跟進撤出,使 Meta AI 成為應用程式中唯一剩下的選項。
    • 由於「高需求」,Google 限制了免費 Nano Banana Pro 圖像生成工具的使用,免費使用者現在每日僅能生成兩張圖像,低於先前每天三張的限制。
    • ChatGPT 在預測時間方面存在問題,因為大型語言模型(LLM)預設是根據訓練數據預測答案,除非它們被特別授權存取系統時鐘或網路搜索,否則無法提供恆定的即時資訊。
  • 零工經濟在非洲的發展
    • 由於撒哈拉以南非洲的青年失業率高企,零工經濟(Gig Economy)透過數位平台(例如:Tendoor 和 Rozi)快速增長,為年輕人提供了賺取收入和自僱的機會。
    • Tendoor 是一個轉售數位平台,讓個人可以上架產品、增加利潤,並在社群媒體上分享,平台負責送貨並將利潤發送給賣家。
    • Rozi 則是一個市場情報數位平台,透過「地圖繪製者」的當地消費者網路,收集他們在家中購買和使用的產品,或在零售店追蹤特定產品的詳細資料,將這些資料轉化為消費者趨勢。
    • 發展研究員認為,儘管數位工作提供了機會,但它並非解決非洲大規模失業危機的長期解決方案,非洲經濟需要更大的結構性轉型,例如從農業轉向勞動密集型製造業。

媒體與娛樂產業的營運洞察

  • 內容創造與社群回饋
    • 頂級電視節目(例如:《Lost》和《Grey's Anatomy》)的成功,被認為與識別優秀人才(創作者/編劇)和其將新元素帶入傳統類型(例如:醫療劇)的能力有關。
    • 媒體高階主管將製作成功的電視節目與營運雜誌進行類比,因為兩者都是週期性的,且與觀眾/讀者之間存在持續性的關係和即時回饋(例如:收視率作為回饋)。
    • 《Lost》的成功在於其早期的「粉絲群」(fandom)經營。編劇 JJ Abrams 在第 1 季和第 2 季之間的夏季,親自參與聊天室,回答問題、製造話題,從而加速了線上粉絲群的發展,並使該節目在第 2 季的收視率大幅躍升。
    • 《Lost》被認為是第一個培養出現代粉絲群體結構的節目,觀眾在節目播出後會進行解讀和討論,形成了當今媒體的運作模式。
  • 領導力與職業教訓
    • 記者出身的背景,使高階主管培養了「全方位興趣」(omni-interested)的能力,這使他們能夠勝任多個領域的職涯轉換。
    • 在電影產業中,開發過程冗長且多數提案會被拒絕,缺乏編輯與讀者之間的即時回饋關係,使該產業對於習慣於快速出版和回饋的編輯而言,吸引力較低。
    • 一位前 ABC 娛樂總裁分享了被解僱的經驗,該事件發生在她參與開發的熱門節目(例如:《Lost》、《Desperate Housewives》)播出前,她認為這是一個「男孩俱樂部」(boy club)在電視產業中運作的例證。
    • 這次被解僱的經歷,讓她認識到不能僅僅依靠做好工作來獲得保護,應該更積極地捍衛自己的地位和信念,這改變了她作為領導者的方式。

資料來源

聽完碎碎念後,記得按讚、收藏、分享喔~, 科技碎碎念將繼續為您追蹤最新時事,讓您通勤時、空閒時一樣能持續了解最新關鍵話題,下次見!

請注意,內容由 AI 產生,目前仍處於培訓階段,可能存在邏輯偏差或資訊誤差,內容僅供參考,如有謬誤請以原文資訊為主。

留言
avatar-img
科技碎碎念
8會員
202內容數
哈囉!這邊是科技碎碎念,資訊 x AI時代下,我們將從海量的全球新聞與新知中,透過生成式 AI 彙整出精華懶人包,聚焦全球科技關鍵話題,讓您輕鬆透過閱讀或聆聽掌握趨勢變革。 請注意,內容由 AI 產生,目前仍處於培訓階段,可能存在邏輯偏差或資訊誤差,內容僅供參考,如有謬誤請以原文資訊為主。
科技碎碎念的其他內容
2025/11/27
文章探討記憶體市場因AI需求導致的價格飆升與供應鏈壓力,OpenAI的高營運成本與募資需求,以及智慧型手機市場和中國航太技術的最新進展。
Thumbnail
2025/11/27
文章探討記憶體市場因AI需求導致的價格飆升與供應鏈壓力,OpenAI的高營運成本與募資需求,以及智慧型手機市場和中國航太技術的最新進展。
Thumbnail
2025/11/27
文章聚焦Anthropic Opus 4.5與Google Aluminium OS的技術進展,探討AI市場競爭、供應鏈壓力及教育對智力的影響。同時分析AI泛化能力挑戰與新研究方向。
Thumbnail
2025/11/27
文章聚焦Anthropic Opus 4.5與Google Aluminium OS的技術進展,探討AI市場競爭、供應鏈壓力及教育對智力的影響。同時分析AI泛化能力挑戰與新研究方向。
Thumbnail
2025/11/25
文章探討大型語言模型(LLM)市場的快速變化,包括Google Gemini 3 Pro與Anthropic Opus 4.5的技術突破,以及OpenAI面臨的挑戰。此外,分析AI供應鏈壓力、科技監管風險及倫理問題,並簡述甘肅絲路的歷史文化亮點。
Thumbnail
2025/11/25
文章探討大型語言模型(LLM)市場的快速變化,包括Google Gemini 3 Pro與Anthropic Opus 4.5的技術突破,以及OpenAI面臨的挑戰。此外,分析AI供應鏈壓力、科技監管風險及倫理問題,並簡述甘肅絲路的歷史文化亮點。
Thumbnail
看更多
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
近年來,ChatGPT快速成為全球熱門的文字生成工具,無論是撰寫文章、擬定策略,甚至創作故事,都展現出強大的語言能力。然而,許多使用者也發現,這款人工智慧在數學運算上經常出錯,為何AI在文字表現出色,卻在數字推理上失準?
Thumbnail
近年來,ChatGPT快速成為全球熱門的文字生成工具,無論是撰寫文章、擬定策略,甚至創作故事,都展現出強大的語言能力。然而,許多使用者也發現,這款人工智慧在數學運算上經常出錯,為何AI在文字表現出色,卻在數字推理上失準?
Thumbnail
當 AI 不再只是「解讀生命」,而是開始生成生命,世界會怎麼變?本文帶你走進 Eric Nguyen 的 TED 演講,從 DNA 語言的挑戰,到 EVO 模型誕生,再到 AI 設計出第一個功能性 CRISPR。讀完後,你將理解 AI 如何改寫醫療、創造新物種,甚至重塑生命的未來。 🚀
Thumbnail
當 AI 不再只是「解讀生命」,而是開始生成生命,世界會怎麼變?本文帶你走進 Eric Nguyen 的 TED 演講,從 DNA 語言的挑戰,到 EVO 模型誕生,再到 AI 設計出第一個功能性 CRISPR。讀完後,你將理解 AI 如何改寫醫療、創造新物種,甚至重塑生命的未來。 🚀
Thumbnail
微軟最新推出的 Phi-4-reasoning 與 Phi-4-reasoning-plus 模型,以僅140億參數的規模,挑戰大型語言模型的效能極限。這兩個模型專注於複雜推理任務,特別在數學、科學、程式設計等STEM領域展現卓越表現。
Thumbnail
微軟最新推出的 Phi-4-reasoning 與 Phi-4-reasoning-plus 模型,以僅140億參數的規模,挑戰大型語言模型的效能極限。這兩個模型專注於複雜推理任務,特別在數學、科學、程式設計等STEM領域展現卓越表現。
Thumbnail
🦖 寶寶吉拉科技日報 | 2025年2月26日 🦖 ✨ 每日 AI、科技、財經新知,快來和寶寶吉拉一起探索未來! ✨ 🚀 輝達財報倒數,市場關注毛利率 🔹 輝達(NVIDIA)將於 26 日美股盤後公布 Q4 財報,投資人關心其 毛利率是否遭受壓縮,可能影響市場動盪。 🔹 分析師
Thumbnail
🦖 寶寶吉拉科技日報 | 2025年2月26日 🦖 ✨ 每日 AI、科技、財經新知,快來和寶寶吉拉一起探索未來! ✨ 🚀 輝達財報倒數,市場關注毛利率 🔹 輝達(NVIDIA)將於 26 日美股盤後公布 Q4 財報,投資人關心其 毛利率是否遭受壓縮,可能影響市場動盪。 🔹 分析師
Thumbnail
作者:陳華夫 如DeepSeek版慈禧太后一樣,這個「有氣質的現代中國女士」中,有光線、陰影、立體感、和深度感等繪畫細節,但網友也請ChatGPT生成中國美女,並認其姿色較佳。但我卻認為DeeSeek較高明,一般人喜歡韓劇整形過、不食人間煙火的美少女,証明ChatGPT生成不了有氣質的中國青春少女。
Thumbnail
作者:陳華夫 如DeepSeek版慈禧太后一樣,這個「有氣質的現代中國女士」中,有光線、陰影、立體感、和深度感等繪畫細節,但網友也請ChatGPT生成中國美女,並認其姿色較佳。但我卻認為DeeSeek較高明,一般人喜歡韓劇整形過、不食人間煙火的美少女,証明ChatGPT生成不了有氣質的中國青春少女。
Thumbnail
珍·福斯特不是你所認識的典型科學家。作為一名著名的遺傳學家和生物工程師,她的工作超越了傳統科學的界限。懷抱著對創新無比的熱情和充滿同理心的心,珍把自己的一生奉獻給了理解和提升支配所有生命的遺傳代碼。在一個小鎮長大,珍一直對生命的複雜性著迷。
Thumbnail
珍·福斯特不是你所認識的典型科學家。作為一名著名的遺傳學家和生物工程師,她的工作超越了傳統科學的界限。懷抱著對創新無比的熱情和充滿同理心的心,珍把自己的一生奉獻給了理解和提升支配所有生命的遺傳代碼。在一個小鎮長大,珍一直對生命的複雜性著迷。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News