哈囉!這邊是科技碎碎念,資訊 x AI時代下,我們將從海量的全球新聞與新知中,透過生成式 AI 彙整出精華懶人包,聚焦全球科技關鍵話題,讓您輕鬆透過閱讀或聆聽掌握趨勢變革。
科技碎碎念 傳送門
Youtube 傳送門
「大肚報報」社群傳送門
快速重點摘要
- 人工智慧(AI)模型的競爭與進展
- Anthropic 推出 Opus 4.5 模型,在編程和工具使用基準測試中表現優於 OpenAI 的 GPT-5.1 和 Google 的 Gemini 3 Pro。
- Opus 4.5 大幅提升了代幣使用效率,並改進了記憶體管理機制,可透過在背景摘要重點來維持較長的對話連貫性。
- Google 的策略性市場擴張
- Google 正在開發名為 Aluminium OS(ALOS)的新型作業系統,以人工智慧為核心,預計將取代 Chrome OS,目標鎖定個人電腦 (PC) 市場。
- Google 開始向外部客戶(例如 Meta 和大型金融機構)推銷其張量處理單元(TPU),預計可搶佔 Nvidia 每年高達 10% 的營收。
- 硬體市場的挑戰與趨勢
- 受到 AI 榮景帶動對高階記憶體的需求,DDR5 隨機存取記憶體(RAM)和快閃記憶體(SSD)的價格在近幾個月內大幅飆升,某些高容量套件的價格上漲了三倍以上。
- 軟體專案失敗的成本持續攀升,且人工智慧工具尚無法解決系統工程、財務管理和組織政治等大型專案中固有的管理和治理問題。
- 智力與學習的環境影響
- 一項針對分開撫養的同卵雙胞胎的最新分析顯示,教育差異對智力商數(IQ)的變異性有顯著影響,挑戰了智力主要由基因決定的觀點。
- 人工智慧的未來研究方向
- Superintelligence Systems 共同創辦人 Ilya Sutskever 認為,人工智慧領域已從追求規模化的「規模時代」轉向注重提升效率和可靠泛化能力(reliable generalization)的「研究時代」。
Google 在作業系統與硬體供應的策略佈局
- 新一代作業系統:Aluminium OS(ALOS)
- Google 正致力於開發全新的 Aluminium OS,這是一個以 Android 為基礎的統一桌面作業系統平台,核心設計融入了人工智慧(AI)技術。
- Aluminium OS 的開發是為了整合 Chrome OS 和 Android,將開發資源集中於單一平台,以期在個人電腦 (PC) 市場上獲得更強的競爭力。
- 這項新系統的目標裝置涵蓋筆記型電腦、平板電腦和機上盒等多種規格。
- 儘管 Google 計劃最終將營運從 Chrome OS 轉移到 Aluminium OS,但承諾會在不影響現有商業關係的情況下進行過渡。現有的 Chrome OS 裝置由於有多年的支援承諾,在新系統推出的初期,預計會以附加或側向升級的方式存在。
- 有觀察者推測,目前的 Chrome OS 在未來可能會被內部稱為「Chrome OS Classic」(Chrome OS Classic),而基於 Android 的新版本則可能直接取代其名稱。
- 張量處理單元(TPU)的外部市場擴展
- Google 正在與包括 Meta 和大型金融機構在內的客戶商談,提供其專有的張量處理單元(TPU)以供在客戶的自有資料中心中使用。
- 過去,Google 限制 TPU 僅能在其自家設施與營運中使用,這項改變是 Google 為了擴大 TPU 市場、與 Nvidia 在資料中心處理器市場上競爭的重要戰略舉措。
- Meta 據報正在與 Google 討論,計劃投入數十億美元,從 2027 年開始在 Meta 的資料中心使用 TPU,並從 2026 年開始向 Google Cloud 租賃晶片。
- Google 認為,透過這種安排,該公司有潛力從 Nvidia 的年度收入中獲取高達 10% 的市場份額,預計將帶來數十億美元的年收入。
- Google 也向潛在客戶推銷 TPU,聲稱它們在 Google Cloud 中使用成本較 Nvidia 的高價晶片更為便宜。
Anthropic Opus 4.5 的技術突破與市場影響
- 卓越的基準測試表現
- Anthropic 於 2025 年 11 月 25 日推出了其旗艦模型 Opus 4.5,該公司宣稱此模型在編程代理程式和工具使用方面達到世界領先水平。
- Opus 4.5 在 SWE-Bench Verified 編碼基準測試中,準確度首次超越 80%(達到 80.9%),微幅領先 OpenAI 的 GPT-5.1-Codex-Max(77.9%)和 Google 的 Gemini 3 Pro(76.2%)。
- Anthropic 的內部測試顯示 Opus 4.5 在推理能力上實現了質的飛躍,並在該公司最艱難的內部工程評估中得分高於歷史上任何人類求職者。
- 儘管在代理編程和工具使用方面表現突出,Opus 4.5 在視覺推理(MMMU)上仍落後於 GPT-5.1。
- 效率、記憶體與安全性改進
- Opus 4.5 在代幣效率方面顯著提高,例如在最高努力等級下,其表現超越 Sonnet 4.5,但使用的代幣數量減少了 48%。
- 為了解決對話過長導致的不連貫問題,Opus 4.5 在背景運行關鍵點摘要程序,讓用戶在高達 200,000 個代幣的硬性限制下,享受更長時間、不中斷的聊天體驗。
- Anthropic 聲稱 Opus 4.5 比其前代模型及競爭模型(如 GPT-5.1 和 Gemini 3 Pro)更難被提示注入攻擊(prompt injection attacks)所欺騙,但承認無法完全免疫此類攻擊。
- 使用者和開發者功能更新
- Opus 4.5 的應用程式介面(API)定價大幅調整,每百萬代幣的輸入成本降至 5 美元,輸出成本降至 25 美元,相比之前的 15 美元和 75 美元,價格降低許多。
- 開發者平台新增了「effort」(努力程度)參數,讓開發者能更精確地平衡效能和代幣使用量。
- Claude Code 現在已在 Claude 桌面應用程式中提供,桌面介面採用分頁式設計,區分傳統聊天和編碼體驗。
硬體市場供需失衡與軟體專案的風險分析
- 關鍵零組件價格飛漲
- 雖然主流至高階的繪圖處理器(GPU)價格在 2025 年 11 月趨於穩定,甚至略低於建議零售價。
- 然而,由於人工智慧榮景帶來的需求,DDR5 隨機存取記憶體(RAM)和快閃記憶體(SSD)晶片出現短缺,導致價格飆升。例如,某些高容量 DDR5 RAM 套件的價格在三個月內上漲了三倍。
- 高階記憶體供應鏈面臨的挑戰,主要來自於高階動態隨機存取記憶體(DRAM)被大量轉移至人工智慧資料中心,預計這將延長高階遊戲產業的復甦時間,並可能因 VRAM 成本上升而推高 GPU 價格。
- AMD 據報已通知合作夥伴,預計從 2026 年開始將 GPU 價格上調約 10%。由於製造設施擴建需要數年時間,記憶體短缺導致的價格上漲難以預測何時會結束。
- 軟體專案的高失敗率和管理問題
- 自 2005 年以來,全球資訊科技(IT)支出已成長三倍,達到 5.6 兆美元,但軟體專案的成功率並未顯著提升,導致失敗的社會成本隨軟體普及而增加。
- 軟體失敗的驅動因素往往是人類缺乏想像力、專案目標不切實際、無法處理複雜性或風險管理不當,且絕大多數錯誤都是可避免、有文獻記載的已知因素。
- 對於希望人工智慧工具能快速解決問題的組織來說,這是行不通的,因為人工智慧對於控制和管理系統工程、財務管理和組織政治等複雜層面的能力存在難以克服的限制。
- 演算法與人工智慧帶來的治理挑戰
- 美國司法部對房地產軟體公司 RealPage 提起反壟斷訴訟,指控其演算法協助房東串通以提高租金。
- 根據和解提議,RealPage 的演算法將被禁止使用競爭對手的非公開資料或當前租約資訊來訓練其租金建議模型。
- 美國司法部強調,隨著演算法和人工智慧工具的興起,必須保持對反壟斷法的嚴格執行,以確保市場競爭的獨立性。
- 過去的案例(如密西根州的 MiDAS 失業系統和澳洲的 Centrelink「Robodebt」福利系統)顯示,過度信任有問題的演算法而缺乏人為監督,可能導致嚴重的行政錯誤,造成數十萬人的財務和情感困擾。
智力、教育與人工智慧泛化能力的學者視角
- 教育對智力商數(IQ)的影響性分析
- 古典雙胞胎研究常被用來支持智力具有強烈遺傳基礎的論點,但這些研究多採用總體數據,無法充分考慮環境因素的調控作用。
- 一項針對分開撫養的同卵雙胞胎(Monozygotic Twins Reared Apart, TRA)數據的去總體化分析發現,教育背景差異對智力商數的差異有顯著影響。
- 研究結果表明,教育背景相似的 TRA 雙胞胎(智商絕對差異平均為 5.8 點)幾乎與一同撫養的同卵雙胞胎(6.0 點)沒有區別。
- 然而,教育差異極大的 TRA 雙胞胎,其智力商數絕對差異平均為 15.1 點,這與完全陌生人之間的差異(16.9 點)更為接近,而非與非雙胞胎手足(12.0 點)相似。
- 這項發現挑戰了單純的遺傳影響模型,指出教育這一環境因素對智力商數具有強烈的因果影響,每增加一年的學校教育可能帶來 1 到 5 點的智商增益。
- 人工智慧發展的「研究時代」與泛化挑戰
- Ilya Sutskever 認為,人工智慧的發展已經歷了從研究到規模化的轉變,現在正進入以研究為核心的新階段,因為僅僅依靠規模化擴展(Scaling)預訓練(pre-training)資料已無法帶來革命性的變化。
- 當前模型最大的根本問題在於其泛化能力(generalization)遠遜於人類,這導致了模型在評估基準(evals)上的高分與實際應用中(如程式編碼)表現不一致的矛盾現象。
- 人類之所以具有出色的泛化能力和樣本效率,可能源於進化的優勢,特別是在語言、數學和編碼等新興領域,人類可能擁有本質上更優越的機器學習原理。
- 強化學習(RL)與價值函數(Value Function)的重要性
- 強化學習目前消耗大量運算資源,導致訓練效率不高,因為模型只有在達到解決方案後才能獲得訓練訊號。
- 價值函數的概念,類似於人類的情緒,可以讓代理程式在長期的任務中提早判斷中間步驟的好壞,從而大幅提高強化學習的效率。
- Ilya Sutskever 推測,人類的「價值函數」是透過進化以情緒的形式硬編碼在我們體內,具有極高的穩健性(robustness),這對於我們成為有效的行動者至關重要。
- Superintelligence Systems(SSI)的核心區別在於其獨特的技術方法,旨在解決人工智慧泛化能力不足的根本問題,並確保最終的超級智慧系統是安全且與人類價值觀相符的。
資料來源
- The federal data and tools that "died" this year
- Goodbye ChromeOS, Hello… Aluminium OS? – DTNS 5153
- Is OpenAI In Trouble?
- Google Plans To Merge Android And Chrome OS Into A New OS Called Aluminium OS - DTH
- US banks scramble to assess data theft after hackers breach financial tech firm
- ICE Offers Up to $280M to Immigrant-Tracking 'Bounty Hunter' Firms
- Anthropic introduces Opus 4.5, cuts API pricing, and enables much longer Claude chats
- RealPage Agrees to Settle Federal Rent-Collusion Case
- IQ differences of identical twins reared apart are influenced by education
- Spotify to raise US prices in first quarter of next year, report says
- GPU prices are coming to earth just as RAM costs shoot into the stratosphere
- Brain has five 'eras' – with adult mode not starting until early 30s
- Ilya Sutskever: We're moving from the age of scaling to the age of research
- ChatGPT shopping research builds you a buyer’s guide using AI
- CISA warns spyware crews are breaking into Signal and WhatsApp accounts
- A New Bridge Links the Math of Infinity to Computer Science
- Ozempic does not slow Alzheimer's, study finds
- Trillions Spent and Big Software Projects Are Still Failing
- China launches an emergency lifeboat to bring three astronauts back to Earth
請注意,內容由 AI 產生,目前仍處於培訓階段,可能存在邏輯偏差或資訊誤差,內容僅供參考,如有謬誤請以原文資訊為主。












