Anthropic Claude Opus 4.5 ：從程式碼生產力到 Excel 自動化

2025/11/26 更新2025/11/26 發佈閱讀 8 分鐘

Anthropic 在 2025 年 11 月 25 日推出了他們最新的旗艦模型 Claude Opus 4.5。在 AI 技術以驚人速度演進的今天，每一次的更新都可能改變我們與科技互動的方式。這次更新的核心問題是：當一個 AI 不僅能理解你的問題，甚至能像一位資深工程師一樣，主動尋找工具、編寫程式來解決複雜任務時，我們的工作模式將迎來何種革新？

Introducing Claude Opus 4.5

Opus 4.5 登場：三大核心升級

更強的模型能力：Claude Opus 4.5 在多項關鍵指標上，特別是軟體工程和程式設計能力，展現了超越業界頂尖模型的表現。內部測試甚至顯示，它在一項困難的程式設計 take-home 考試中，得分超過了所有人類應試者。
更低的價格：儘管性能大幅提升，Opus 4.5 的價格卻更為親民，定價為每百萬 tokens 輸入 5 美元，輸出 25 美元，讓頂尖的 AI 能力不再遙不可及。
更深度的應用整合：除了模型本身，Anthropic 還推出了全新的開發者工具，並將 Claude 的能力擴展到我們日常使用的軟體中，例如 Excel 和 Chrome 瀏覽器，讓 AI 從雲端走進了我們的桌面。

解構 AI 工程師：Opus 4.5 如何實現驚人突破？

「AI 工程師」的誕生？

這次更新最引人注目的，莫過於 Claude Opus 4.5 在軟體工程領域的卓越表現。在 SWE-bench 基準測試中，Opus 4.5 取得了領先的成績。更令人驚訝的是，在一項 Anthropic 內部用來評估潛在工程師候選人的高難度 take-home 考試中，Opus 4.5 的得分甚至超越了所有曾參加過此測試的人類工程師。

這代表 AI 解決複雜、真實世界程式設計問題的能力，已經達到甚至超越了有經驗的專業人士。從程式碼遷移、重構到修復橫跨多個系統的複雜錯誤，Opus 4.5 都展現出高度的自主性與準確性。許多早期測試的合作夥伴，如 GitHub 和 Notion，都驗證了它在處理長遠、自主任務上的穩定性和效率。

開發者工具迎來三大革新

Anthropic 明白，一個強大的模型需要有靈活的工具才能發揮最大潛力。因此，他們同步推出了三項針對開發者的 beta 新功能，旨在解決當前 AI Agent 開發中的痛點：context window 限制、延遲和準確性。

工具搜尋 (Tool Search)：過去，開發者需要將所有可能的工具定義都預先載入到模型的 context window 中，這會消耗大量的 tokens。現在，透過工具搜尋，Claude 可以在需要時才動態地去「發現」並載入相關工具，這使得 context window 的使用效率大幅提升了 85%，同時也提高了工具選擇的準確性。
程式化工具調用 (Programmatic Tool Calling)：傳統的工具使用方式是模型每調用一次工具，就需要一次完整的 API 往返，並且所有中間過程的資料都會佔用 context。現在，Claude 可以直接編寫一段 Python 程式碼，一次性地、有邏輯地（例如使用迴圈、條件判斷）調用多個工具，並在程式碼層級處理中間資料，最後只將最重要的結果回傳給模型。這不僅大幅減少了 tokens 的消耗（內部測試顯示在複雜研究任務上減少了 37%），也因為減少了 API 往返次數而降低了延遲。
工具使用範例 (Tool Use Examples)：單純的工具定義（JSON Schema）有時不足以讓模型理解如何正確使用，特別是在有許多非必要參數或特定格式要求時。現在開發者可以直接在工具定義中提供具體的使用範例，讓 Claude 從範例中學習如何正確地格式化參數、處理巢狀結構等，內部測試顯示這將複雜參數的處理準確率從 72% 提升到了 90%。

從雲端走進桌面：Claude 如何融入你的日常工作流

Anthropic 的目標顯然不只是服務開發者，他們也希望將 AI 的能力無縫地融入每個人的日常工作中。這次更新，他們將 Claude 的應用範圍從網頁和 API 大幅擴展。

Claude for Excel：這項功能讓 Claude 直接進駐可能是全世界使用最廣泛的數據分析工具 Excel。使用者可以直接在 Excel 中，用自然語言詢問關於複雜公式的解釋、進行情境分析（例如「如果營收成長率提高 2%，對最終估值有何影響？」）、除錯，甚至從零開始建立財務模型。Claude 能夠理解整個工作簿的關聯性，並在修改時保持公式的完整性。
Claude Code 桌面應用：專業的程式設計工具 Claude Code 現在有了桌面版本，讓開發者可以在本機同時運行多個 AI Agent，一個負責修復 bug，另一個研究 GitHub 上的開源專案，第三個則負責撰寫文件，實現真正的平行工作。
更聰明的對話與瀏覽器助理：在 Claude 的對話應用中，現在長對話不會再碰到極限，Claude 會自動總結之前的內容，讓你可以持續進行深度探討。同時，面向所有 Max 用戶開放的 Claude for Chrome 瀏覽器擴充功能，讓 Claude 能夠在你瀏覽網頁時提供跨分頁的協助。

TN科技筆記的觀點

這次 Anthropic 的更新「將 AI 從一個問答機器，轉變為一個真正能動手解決問題的『工作夥伴』」。過去，我們像是模型的管理者，需要一步步下指令、檢查中間結果。現在，我們更像是產品經理，提出最終目標（例如「找出第三季差旅預算超支的團隊成員」），而 Claude 則化身為那位資深工程師，自己編寫腳本、調用 API、處理數據，最後只把最精煉的結果呈現給你。這是一種從「對話」到「委派」的根本轉變，大幅提升了 AI 處理複雜工作流的自主性與效率。

然而，當 Claude 能夠像人類一樣時，如何確保它的行為始終與人類的最高利益保持一致，就成了一個更為複雜的問題。這不僅僅是防止惡意使用的「安全」(Safety) 問題，更是關乎模型價值觀與人類意圖對齊的「對齊」(Alignment) 問題。此外，當 AI 的程式設計能力超越許多人類工程師時，這對軟體工程師的職業發展、技能要求乃至整個科技行業的人才結構，都將帶來深遠的衝擊。

支持TN科技筆記，與科技共同前行

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～～～也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者以及新加入的讀者們，讓我更加有動力為各位帶來科技新知！

以下是我的 threads 也歡迎追蹤、回覆、轉發喔！

>>>>> TN科技筆記(TechNotes)

留言

TN科技筆記(TechNotes)的沙龍

72會員

239內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/11/24

Meta SAM 3 與 SAM-3D 登場：AI 不只「看懂」世界，更能一鍵「重建」 3D 場景？

Meta AI 推出新一代影像分割模型 SAM 3 與 3D 重建模型 SAM-3D。本文將深度解析其核心技術、應用場景，以及它如何透過文字指令和單張照片，改變我們與數位世界的互動方式。

2025/11/24

Meta SAM 3 與 SAM-3D 登場：AI 不只「看懂」世界，更能一鍵「重建」 3D 場景？

2025/11/21

輝達 2026 Q3 財報：AI 泡沫還是新時代？揭開 NVIDIA 驚人數據

深入分析NVIDIA 2026 Q3財報，逐一拆解關於應收帳款、庫存、現金流與「資金循環」的泡沫指控，揭示輝達高速成長背後的真實商業邏輯與潛在風險。

2025/11/21

輝達 2026 Q3 財報：AI 泡沫還是新時代？揭開 NVIDIA 驚人數據

深入分析NVIDIA 2026 Q3財報，逐一拆解關於應收帳款、庫存、現金流與「資金循環」的泡沫指控，揭示輝達高速成長背後的真實商業邏輯與潛在風險。

2025/11/19

Gemini 3 發布：不只是更強，Google 的 AI 野心是「讓任何想法成真」

Google 最新發布 Gemini 3 模型。本文將帶你了解其頂尖性能、核心的「AI 代理人」能力，以及為開發者打造的全新平台 Google Antigravity 將如何改變未來。

2025/11/19

Gemini 3 發布：不只是更強，Google 的 AI 野心是「讓任何想法成真」

Google 最新發布 Gemini 3 模型。本文將帶你了解其頂尖性能、核心的「AI 代理人」能力，以及為開發者打造的全新平台 Google Antigravity 將如何改變未來。

#AI 的其他內容

【4月靈感產生器】TOP 100 關鍵字：「○○」格友最愛用

賴仕涵的思考王國

💖當「我的女朋友叫GEMINI」成為公開認同：台視【熱線追蹤】觀後感

小貝的多媒體學習日記．Beibei's diary

為什麼很多專業剪輯師不用剪映？剪映 vs Adobe Premiere Pro 差異

你可能也想看

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11