🐳 寶寶吉拉科技日報 🐳 | 2026年1月28日

更新 發佈閱讀 9 分鐘
raw-image

📰 今日頭條

1️⃣ 不到三個月又推新模型!DeepSeek-OCR 2 可模擬人類閱讀方式

🔑 關鍵字: DeepSeek OCR 阿里巴巴 Qwen2-0.5b 開源AI 視覺編碼 多模態AI

📝 摘要: 中國人工智慧公司 DeepSeek 於 1 月 27 日推出升級版光學字符辨識模型 DeepSeek-OCR 2,距離首版模型發布僅三個多月,展現了中國開源生態系統推動 AI 發展的驚人速度。新模型整合阿里巴巴雲的開源系統,以阿里巴巴輕量級 Qwen2-0.5b 模型取代原有的 CLIP 組件,使 OCR 能模擬人類閱讀方式,遵循「靈活且語義一致的掃描模式」。

此次升級同時採用阿里巴巴 DeepEncoder V2,使模型能根據語義意義動態重組圖像,讓 AI 視覺編碼更接近人類邏輯思維。DeepSeek 同步發表論文《DeepSeek-OCR 2: Visual Causal Flow》。值得關注的是,此次發布距離 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 推出時間相近,後兩者已可於 Google Vertex AI Model Garden 等平台使用。

這項進展反映中國企業在 AI 領域的緊密合作態勢,阿里巴巴近期也推出 Qwen3-Max-Thinking 模型。中國 AI 業界的開源趨勢持續深化,正積極挑戰 Google DeepMind 等全球對手,力圖在多模態 AI 領域確立新興強者地位。


2️⃣ 沒有 AI 就會衰退?研究:消費仍是美國經濟成長主力

🔑 關鍵字: 美國經濟 GDP AI投資 消費支出 資料中心 經濟衰退 勞動市場

📝 摘要: 儘管市場普遍認為 AI 投資是支撐美國經濟的關鍵力量,MRB Partners 美國經濟策略師 Prajakta Bhide 發布的最新研究報告卻揭示了不同的事實:消費才是去年美國 GDP 成長的最大動力,AI 相關資本支出僅居第二。

報告深入分析指出,若不考慮進口因素,AI 相關零件在 2025 年第一季至第三季期間,平均為實際 GDP 成長貢獻約 0.9%,約佔同期 GDP 成長的 40%。然而,若將電腦、半導體及電信設備等 AI 相關設備的進口額納入調整,AI 相關投資的淨貢獻則降至 0.4~0.5%,僅佔 GDP 成長的 20~25%。Bespoke Investment Group 的估算更為保守,認為 AI 支出相關類別僅佔季度 GDP 成長的 15%。

報告同時預測,2026 年美國整體消費仍將保持強勁,儘管民眾對經濟安全的擔憂上升,但實際消費行為並未減弱。然而,其他經濟學家警告,歷史上預測經濟衰退的更關鍵指標是勞動市場與住宅建設投資,而這兩者目前都已出現警示訊號。


3️⃣ OpenAI 推出免費應用 Prism,助力科學研究高效論文撰寫

🔑 關鍵字: OpenAI Prism GPT-5.2 LaTeX 科學寫作 學術協作 Crixet arXiv

📝 摘要: OpenAI 正式推出免費的科學寫作與協作工作區「Prism」,由最新的 GPT-5.2 模型提供支援,標誌著 AI 深度整合學術研究流程的重要里程碑。Prism 將撰寫草稿、修訂內容、團隊協作及論文發表前準備等環節,整合到同一個 LaTeX 原生的雲端工作區。

Prism 以 OpenAI 收購的雲端 LaTeX 平台 Crixet 為基礎發展而成。GPT-5.2 不再是獨立於科學寫作流程的額外工具,而是直接在專案中運作,能理解論文結構、公式、參考資料,以及前後文之間的關聯。使用者能與 GPT-5.2 Thinking 對話,探索想法、測試假設,並推理複雜的科學問題,還能搜尋並納入 arXiv 等來源的相關文獻。

OpenAI 科學人工智慧副總裁 Kevin Weil 強調,AI 生成內容的準確性仍需科學家核實,「正確的回應方式不是對 AI 敬而遠之,而是將它直接整合在科學研究的工作流程中,維持問責機制,並確保研究人員掌握主導權。」Prism 對專案與協作者數量皆無設限,即日起開放所有 ChatGPT 帳戶使用者使用。


4️⃣ 螞蟻靈波開源空間感知模型 LingBot-Depth

🔑 關鍵字: 螞蟻集團 LingBot-Depth 具身智慧 深度補全 3D相機 機器人視覺 開源模型

📝 摘要: 螞蟻集團旗下靈波科技正式開源空間感知模型 LingBot-Depth,這是一個專為具身智慧場景設計的深度補全模型,主要解決傳統深度相機在遇到透明物體、玻璃表面、高反光材質時無法獲取有效深度資訊的痛點,避免機器人在這些場景下擷取失敗或發生碰撞。

LingBot-Depth 的技術路線是「用軟體補硬體的缺點」。模型基於奧比中光 Gemini 330 系列雙目 3D 相機採集的 RGB-Depth 數據進行訓練,核心方法為「掩碼深度建模」——在訓練過程中故意遮擋一部分深度數據,讓模型學會根據 RGB 圖像推斷缺失的深度值。

官方數據顯示,在 NYUv2、ETH3D 等多個基準測試中,LingBot-Depth 在深度補全、單目深度估算和雙目匹配任務上均達到當前最優水準。在透明物體抓取的實際測試中,機器人對透明收納盒的抓握成功率達到 50%,成功突破了傳統感測器難以處理的技術瓶頸,為機器人在複雜環境中的應用開闢新可能。


5️⃣ AI 語言模型反映人類大腦特徵,同時吸收人類社會偏見

🔑 關鍵字: 大型語言模型 人類大腦 社會偏見 內群體偏好 GPT-4.1 神經科學 偏見緩解

📝 摘要: 兩項突破性研究揭示,驅動 ChatGPT 及 Gemini 等 AI 聊天機器人的大型語言模型與人類大腦存在驚人相似之處——不僅處理語言意義的方式相近,更會吸收人類「我們與他們」的社會偏見。

耶路撒冷希伯來大學 Ariel Goldstein 博士領銜的團隊,於《Nature Communications》期刊發表研究,追蹤參與者聆聽 30 分鐘 Podcast 時的大腦活動。研究發現,早期神經反應與 AI 模型早期層次相符,較後期大腦反應則對應更深層 AI 層次。這種對應在負責語言及言語的布洛卡區尤其明顯,挑戰了語言理解主要依賴固定符號規則的傳統理論。

另一項由佛蒙特大學進行的研究,檢視 GPT-4.1、DeepSeek-3.1、Gemma-2.0、Grok-3.0 及 LLaMA-3.1 等模型,發現所有模型均表現出內群體偏好與外群體敵意。當模型獲提示採用政治人格時,保守派人格表現出更強外群體敵意,自由派人格則展現更強內群體團結。好消息是,研究團隊提出的 ION 偏見緩解策略,可將情感分歧減少最多 69%,為開發更公平的 AI 系統指明方向。


🔮 未來趨勢觀察

綜觀今日五則科技新聞,可歸納出以下關鍵趨勢:

1. 中國開源 AI 生態系統加速整合 DeepSeek 與阿里巴巴的合作、螞蟻集團的 LingBot-Depth 開源,顯示中國科技企業正透過開源策略建立協作網絡,以群體力量挑戰全球 AI 巨頭。這種「開源聯盟」模式可能成為後進者突圍的關鍵路徑。

2. AI 與專業工作流程深度融合 OpenAI Prism 的推出標誌著 AI 從「輔助工具」轉向「工作流程核心」的典範轉移。未來各專業領域(醫療、法律、工程)都可能出現類似的垂直整合平台,AI 將不再是額外選項,而是內建於專業軟體的基礎設施。

3. 具身智慧突破感知瓶頸 LingBot-Depth 解決透明物體識別問題,代表機器人從「受控環境」走向「真實世界」的關鍵一步。隨著視覺感知技術持續進化,服務型機器人在零售、物流、家庭場景的應用將加速落地。

4. AI 倫理從理論走向工程實踐 研究證實 LLM 會內化人類社會偏見,但同時也提出了可量化的緩解策略。這意味著「負責任 AI」將從口號轉為可操作的工程指標,未來模型發布可能需附帶偏見測試報告,如同軟體的安全審計。

5. AI 經濟影響需理性評估 MRB Partners 的研究提醒我們,AI 對經濟的實際貢獻可能被高估。投資者與政策制定者需要更精細的分析框架,避免 AI 泡沫化風險,同時關注勞動市場等傳統經濟指標的警示訊號。


📬 感謝閱讀本期科技日報!如有任何建議或想深入了解的主題,歡迎隨時交流。

留言
avatar-img
Baozilla, Let's go!
93會員
620內容數
我不急著定義自己是誰,也不急著證明什麼。 但我知道,只要內心不設限,生活的每一步都有可能是新的開始。 世界不一定溫柔,但我願意以溫柔回應它。 像水一樣,柔軟卻有力量; 像雲一樣,自由卻不迷失方向。 這是我的路,也可能是某些人的共鳴。
Baozilla, Let's go! 的其他內容
2026/01/26
📊 AI 做得再強也沒用?微軟研究揭露全球 AI 採用的驚人落差 🏷️ 關鍵字: 生成式 AI、數位落差、DeepSeek、AI 普及率、治理制度、開源 AI 📝 摘要: 根據微軟最新研究,2025 年全球生成式 AI 使用率達 16.3%,但先進國家與開發中經濟體的 AI 採用差距半年
Thumbnail
2026/01/26
📊 AI 做得再強也沒用?微軟研究揭露全球 AI 採用的驚人落差 🏷️ 關鍵字: 生成式 AI、數位落差、DeepSeek、AI 普及率、治理制度、開源 AI 📝 摘要: 根據微軟最新研究,2025 年全球生成式 AI 使用率達 16.3%,但先進國家與開發中經濟體的 AI 採用差距半年
Thumbnail
2026/01/19
📰 今日頭條 1. 科技業史上最大裁員潮:AI 使 24.5 萬人失業,造成產業大規模轉型 🔑 關鍵字: 科技裁員 AI自動化 英特爾 亞馬遜 微軟 Salesforce 結構性轉型 勞動市場 📋 摘要: 2025 年全球科技業裁員總數達到驚人的 24.5 萬人,創下歷史新高。這場
Thumbnail
2026/01/19
📰 今日頭條 1. 科技業史上最大裁員潮:AI 使 24.5 萬人失業,造成產業大規模轉型 🔑 關鍵字: 科技裁員 AI自動化 英特爾 亞馬遜 微軟 Salesforce 結構性轉型 勞動市場 📋 摘要: 2025 年全球科技業裁員總數達到驚人的 24.5 萬人,創下歷史新高。這場
Thumbnail
2026/01/15
📰 今日科技新聞精選 1. 七大聊天機器人測試:只有 37% 提供完整新聞來源,錯誤與捏造內容成常態 關鍵字: AI聊天機器人、新聞準確性、虛構來源、錯誤資訊、Gemini、ChatGPT、Claude、可信度測試 內容: 在一項為期一個月的實驗中,研究人員對多個生成式AI聊天機器人進行測
Thumbnail
2026/01/15
📰 今日科技新聞精選 1. 七大聊天機器人測試:只有 37% 提供完整新聞來源,錯誤與捏造內容成常態 關鍵字: AI聊天機器人、新聞準確性、虛構來源、錯誤資訊、Gemini、ChatGPT、Claude、可信度測試 內容: 在一項為期一個月的實驗中,研究人員對多個生成式AI聊天機器人進行測
Thumbnail
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
市場經驗拉長之後,很多投資人都會遇到同一個問題:不是方向看錯,而是部位太集中個股,常常跟大趨勢脫節。 早年的台股環境,中小股非常吃香,反而權值股不動,但QE量化寬鬆後,特別是疫情之後,後疫情時代,鈔票大量在股市走動,這些大資金只能往權值股走,因此早年小P的策略偏向中小型個股,但近年AI興起,高技術
Thumbnail
市場經驗拉長之後,很多投資人都會遇到同一個問題:不是方向看錯,而是部位太集中個股,常常跟大趨勢脫節。 早年的台股環境,中小股非常吃香,反而權值股不動,但QE量化寬鬆後,特別是疫情之後,後疫情時代,鈔票大量在股市走動,這些大資金只能往權值股走,因此早年小P的策略偏向中小型個股,但近年AI興起,高技術
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
AI是你的「數位化情緒日記」:傳統的日記可能會因為不知從何寫起而中斷,但AI能扮演「情緒提問者」的角色,透過引導性的問題,幫助你打破寫作障礙,讓內心最真實的情緒自然流動。
Thumbnail
AI是你的「數位化情緒日記」:傳統的日記可能會因為不知從何寫起而中斷,但AI能扮演「情緒提問者」的角色,透過引導性的問題,幫助你打破寫作障礙,讓內心最真實的情緒自然流動。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News