Anthropic 在 2025 年 11 月 25 日推出了他們最新的旗艦模型 Claude Opus 4.5。在 AI 技術以驚人速度演進的今天,每一次的更新都可能改變我們與科技互動的方式。這次更新的核心問題是:當一個 AI 不僅能理解你的問題,甚至能像一位資深工程師一樣,主動尋找工具、編寫程式來解決複雜任務時,我們的工作模式將迎來何種革新?
Introducing Claude Opus 4.5
Opus 4.5 登場:三大核心升級
- 更強的模型能力:Claude Opus 4.5 在多項關鍵指標上,特別是軟體工程和程式設計能力,展現了超越業界頂尖模型的表現。內部測試甚至顯示,它在一項困難的程式設計 take-home 考試中,得分超過了所有人類應試者。
- 更低的價格:儘管性能大幅提升,Opus 4.5 的價格卻更為親民,定價為每百萬 tokens 輸入 5 美元,輸出 25 美元,讓頂尖的 AI 能力不再遙不可及。
- 更深度的應用整合:除了模型本身,Anthropic 還推出了全新的開發者工具,並將 Claude 的能力擴展到我們日常使用的軟體中,例如 Excel 和 Chrome 瀏覽器,讓 AI 從雲端走進了我們的桌面。
解構 AI 工程師:Opus 4.5 如何實現驚人突破?
「AI 工程師」的誕生?
這次更新最引人注目的,莫過於 Claude Opus 4.5 在軟體工程領域的卓越表現。在 SWE-bench 基準測試中,Opus 4.5 取得了領先的成績。更令人驚訝的是,在一項 Anthropic 內部用來評估潛在工程師候選人的高難度 take-home 考試中,Opus 4.5 的得分甚至超越了所有曾參加過此測試的人類工程師。
這代表 AI 解決複雜、真實世界程式設計問題的能力,已經達到甚至超越了有經驗的專業人士。從程式碼遷移、重構到修復橫跨多個系統的複雜錯誤,Opus 4.5 都展現出高度的自主性與準確性。許多早期測試的合作夥伴,如 GitHub 和 Notion,都驗證了它在處理長遠、自主任務上的穩定性和效率。

開發者工具迎來三大革新
Anthropic 明白,一個強大的模型需要有靈活的工具才能發揮最大潛力。因此,他們同步推出了三項針對開發者的 beta 新功能,旨在解決當前 AI Agent 開發中的痛點:context window 限制、延遲和準確性。
- 工具搜尋 (Tool Search):過去,開發者需要將所有可能的工具定義都預先載入到模型的 context window 中,這會消耗大量的 tokens。現在,透過工具搜尋,Claude 可以在需要時才動態地去「發現」並載入相關工具,這使得 context window 的使用效率大幅提升了 85%,同時也提高了工具選擇的準確性。
- 程式化工具調用 (Programmatic Tool Calling):傳統的工具使用方式是模型每調用一次工具,就需要一次完整的 API 往返,並且所有中間過程的資料都會佔用 context。現在,Claude 可以直接編寫一段 Python 程式碼,一次性地、有邏輯地(例如使用迴圈、條件判斷)調用多個工具,並在程式碼層級處理中間資料,最後只將最重要的結果回傳給模型。這不僅大幅減少了 tokens 的消耗(內部測試顯示在複雜研究任務上減少了 37%),也因為減少了 API 往返次數而降低了延遲。
- 工具使用範例 (Tool Use Examples):單純的工具定義(JSON Schema)有時不足以讓模型理解如何正確使用,特別是在有許多非必要參數或特定格式要求時。現在開發者可以直接在工具定義中提供具體的使用範例,讓 Claude 從範例中學習如何正確地格式化參數、處理巢狀結構等,內部測試顯示這將複雜參數的處理準確率從 72% 提升到了 90%。
從雲端走進桌面:Claude 如何融入你的日常工作流
Anthropic 的目標顯然不只是服務開發者,他們也希望將 AI 的能力無縫地融入每個人的日常工作中。這次更新,他們將 Claude 的應用範圍從網頁和 API 大幅擴展。
- Claude for Excel:這項功能讓 Claude 直接進駐可能是全世界使用最廣泛的數據分析工具 Excel。使用者可以直接在 Excel 中,用自然語言詢問關於複雜公式的解釋、進行情境分析(例如「如果營收成長率提高 2%,對最終估值有何影響?」)、除錯,甚至從零開始建立財務模型。Claude 能夠理解整個工作簿的關聯性,並在修改時保持公式的完整性。
- Claude Code 桌面應用:專業的程式設計工具 Claude Code 現在有了桌面版本,讓開發者可以在本機同時運行多個 AI Agent,一個負責修復 bug,另一個研究 GitHub 上的開源專案,第三個則負責撰寫文件,實現真正的平行工作。
- 更聰明的對話與瀏覽器助理:在 Claude 的對話應用中,現在長對話不會再碰到極限,Claude 會自動總結之前的內容,讓你可以持續進行深度探討。同時,面向所有 Max 用戶開放的 Claude for Chrome 瀏覽器擴充功能,讓 Claude 能夠在你瀏覽網頁時提供跨分頁的協助。
TN科技筆記的觀點
這次 Anthropic 的更新「將 AI 從一個問答機器,轉變為一個真正能動手解決問題的『工作夥伴』」。過去,我們像是模型的管理者,需要一步步下指令、檢查中間結果。現在,我們更像是產品經理,提出最終目標(例如「找出第三季差旅預算超支的團隊成員」),而 Claude 則化身為那位資深工程師,自己編寫腳本、調用 API、處理數據,最後只把最精煉的結果呈現給你。這是一種從「對話」到「委派」的根本轉變,大幅提升了 AI 處理複雜工作流的自主性與效率。
然而,當 Claude 能夠像人類一樣時,如何確保它的行為始終與人類的最高利益保持一致,就成了一個更為複雜的問題。這不僅僅是防止惡意使用的「安全」(Safety) 問題,更是關乎模型價值觀與人類意圖對齊的「對齊」(Alignment) 問題。此外,當 AI 的程式設計能力超越許多人類工程師時,這對軟體工程師的職業發展、技能要求乃至整個科技行業的人才結構,都將帶來深遠的衝擊。
支持TN科技筆記,與科技共同前行
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡
在此也感謝每個月持續請我喝杯咖啡的讀者以及新加入的讀者們,讓我更加有動力為各位帶來科技新知!
以下是我的 threads 也歡迎追蹤、回覆、轉發喔!
>>>>> TN科技筆記(TechNotes)





















