Anthropic Claude Opus 4.5 :從程式碼生產力到 Excel 自動化

更新 發佈閱讀 8 分鐘

Anthropic 在 2025 年 11 月 25 日推出了他們最新的旗艦模型 Claude Opus 4.5。在 AI 技術以驚人速度演進的今天,每一次的更新都可能改變我們與科技互動的方式。這次更新的核心問題是:當一個 AI 不僅能理解你的問題,甚至能像一位資深工程師一樣,主動尋找工具、編寫程式來解決複雜任務時,我們的工作模式將迎來何種革新?

Introducing Claude Opus 4.5

raw-image

Opus 4.5 登場:三大核心升級

  • 更強的模型能力:Claude Opus 4.5 在多項關鍵指標上,特別是軟體工程和程式設計能力,展現了超越業界頂尖模型的表現。內部測試甚至顯示,它在一項困難的程式設計 take-home 考試中,得分超過了所有人類應試者。
  • 更低的價格:儘管性能大幅提升,Opus 4.5 的價格卻更為親民,定價為每百萬 tokens 輸入 5 美元,輸出 25 美元,讓頂尖的 AI 能力不再遙不可及。
  • 更深度的應用整合:除了模型本身,Anthropic 還推出了全新的開發者工具,並將 Claude 的能力擴展到我們日常使用的軟體中,例如 Excel 和 Chrome 瀏覽器,讓 AI 從雲端走進了我們的桌面。

解構 AI 工程師:Opus 4.5 如何實現驚人突破?

「AI 工程師」的誕生?

這次更新最引人注目的,莫過於 Claude Opus 4.5 在軟體工程領域的卓越表現。在 SWE-bench 基準測試中,Opus 4.5 取得了領先的成績。更令人驚訝的是,在一項 Anthropic 內部用來評估潛在工程師候選人的高難度 take-home 考試中,Opus 4.5 的得分甚至超越了所有曾參加過此測試的人類工程師。

這代表 AI 解決複雜、真實世界程式設計問題的能力,已經達到甚至超越了有經驗的專業人士。從程式碼遷移、重構到修復橫跨多個系統的複雜錯誤,Opus 4.5 都展現出高度的自主性與準確性。許多早期測試的合作夥伴,如 GitHub 和 Notion,都驗證了它在處理長遠、自主任務上的穩定性和效率。

raw-image

開發者工具迎來三大革新

Anthropic 明白,一個強大的模型需要有靈活的工具才能發揮最大潛力。因此,他們同步推出了三項針對開發者的 beta 新功能,旨在解決當前 AI Agent 開發中的痛點:context window 限制、延遲和準確性。

  • 工具搜尋 (Tool Search):過去,開發者需要將所有可能的工具定義都預先載入到模型的 context window 中,這會消耗大量的 tokens。現在,透過工具搜尋,Claude 可以在需要時才動態地去「發現」並載入相關工具,這使得 context window 的使用效率大幅提升了 85%,同時也提高了工具選擇的準確性。
  • 程式化工具調用 (Programmatic Tool Calling):傳統的工具使用方式是模型每調用一次工具,就需要一次完整的 API 往返,並且所有中間過程的資料都會佔用 context。現在,Claude 可以直接編寫一段 Python 程式碼,一次性地、有邏輯地(例如使用迴圈、條件判斷)調用多個工具,並在程式碼層級處理中間資料,最後只將最重要的結果回傳給模型。這不僅大幅減少了 tokens 的消耗(內部測試顯示在複雜研究任務上減少了 37%),也因為減少了 API 往返次數而降低了延遲。
  • 工具使用範例 (Tool Use Examples):單純的工具定義(JSON Schema)有時不足以讓模型理解如何正確使用,特別是在有許多非必要參數或特定格式要求時。現在開發者可以直接在工具定義中提供具體的使用範例,讓 Claude 從範例中學習如何正確地格式化參數、處理巢狀結構等,內部測試顯示這將複雜參數的處理準確率從 72% 提升到了 90%。

從雲端走進桌面:Claude 如何融入你的日常工作流

Anthropic 的目標顯然不只是服務開發者,他們也希望將 AI 的能力無縫地融入每個人的日常工作中。這次更新,他們將 Claude 的應用範圍從網頁和 API 大幅擴展。

  • Claude for Excel:這項功能讓 Claude 直接進駐可能是全世界使用最廣泛的數據分析工具 Excel。使用者可以直接在 Excel 中,用自然語言詢問關於複雜公式的解釋、進行情境分析(例如「如果營收成長率提高 2%,對最終估值有何影響?」)、除錯,甚至從零開始建立財務模型。Claude 能夠理解整個工作簿的關聯性,並在修改時保持公式的完整性。
  • Claude Code 桌面應用:專業的程式設計工具 Claude Code 現在有了桌面版本,讓開發者可以在本機同時運行多個 AI Agent,一個負責修復 bug,另一個研究 GitHub 上的開源專案,第三個則負責撰寫文件,實現真正的平行工作。
  • 更聰明的對話與瀏覽器助理:在 Claude 的對話應用中,現在長對話不會再碰到極限,Claude 會自動總結之前的內容,讓你可以持續進行深度探討。同時,面向所有 Max 用戶開放的 Claude for Chrome 瀏覽器擴充功能,讓 Claude 能夠在你瀏覽網頁時提供跨分頁的協助。

TN科技筆記的觀點

這次 Anthropic 的更新「將 AI 從一個問答機器,轉變為一個真正能動手解決問題的『工作夥伴』」。過去,我們像是模型的管理者,需要一步步下指令、檢查中間結果。現在,我們更像是產品經理,提出最終目標(例如「找出第三季差旅預算超支的團隊成員」),而 Claude 則化身為那位資深工程師,自己編寫腳本、調用 API、處理數據,最後只把最精煉的結果呈現給你。這是一種從「對話」到「委派」的根本轉變,大幅提升了 AI 處理複雜工作流的自主性與效率。

然而,當 Claude 能夠像人類一樣時,如何確保它的行為始終與人類的最高利益保持一致,就成了一個更為複雜的問題。這不僅僅是防止惡意使用的「安全」(Safety) 問題,更是關乎模型價值觀與人類意圖對齊的「對齊」(Alignment) 問題。此外,當 AI 的程式設計能力超越許多人類工程師時,這對軟體工程師的職業發展、技能要求乃至整個科技行業的人才結構,都將帶來深遠的衝擊。


支持TN科技筆記,與科技共同前行

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者以及新加入的讀者們,讓我更加有動力為各位帶來科技新知!

以下是我的 threads 也歡迎追蹤、回覆、轉發喔!

>>>>> TN科技筆記(TechNotes)


留言
avatar-img
TN科技筆記(TechNotes)的沙龍
72會員
239內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/11/24
Meta AI 推出新一代影像分割模型 SAM 3 與 3D 重建模型 SAM-3D。本文將深度解析其核心技術、應用場景,以及它如何透過文字指令和單張照片,改變我們與數位世界的互動方式。
Thumbnail
2025/11/24
Meta AI 推出新一代影像分割模型 SAM 3 與 3D 重建模型 SAM-3D。本文將深度解析其核心技術、應用場景,以及它如何透過文字指令和單張照片,改變我們與數位世界的互動方式。
Thumbnail
2025/11/21
深入分析NVIDIA 2026 Q3財報,逐一拆解關於應收帳款、庫存、現金流與「資金循環」的泡沫指控,揭示輝達高速成長背後的真實商業邏輯與潛在風險。
2025/11/21
深入分析NVIDIA 2026 Q3財報,逐一拆解關於應收帳款、庫存、現金流與「資金循環」的泡沫指控,揭示輝達高速成長背後的真實商業邏輯與潛在風險。
2025/11/19
Google 最新發布 Gemini 3 模型。本文將帶你了解其頂尖性能、核心的「AI 代理人」能力,以及為開發者打造的全新平台 Google Antigravity 將如何改變未來。
Thumbnail
2025/11/19
Google 最新發布 Gemini 3 模型。本文將帶你了解其頂尖性能、核心的「AI 代理人」能力,以及為開發者打造的全新平台 Google Antigravity 將如何改變未來。
Thumbnail
看更多
你可能也想看
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
上篇文章《奧特曼傳》聚焦 OpenAI 如何從「讓 AI 造福人類」的理想出發,演變成資本與權力的角逐賽,奧特曼與馬斯克分道揚鑣後,OpenAI 與微軟攜手推出 ChatGPT,席捲全球;然而,真正的較量並不僅限於兩人,而是以「AI 霸主」之名,在更廣闊的戰場上展開......
Thumbnail
上篇文章《奧特曼傳》聚焦 OpenAI 如何從「讓 AI 造福人類」的理想出發,演變成資本與權力的角逐賽,奧特曼與馬斯克分道揚鑣後,OpenAI 與微軟攜手推出 ChatGPT,席捲全球;然而,真正的較量並不僅限於兩人,而是以「AI 霸主」之名,在更廣闊的戰場上展開......
Thumbnail
本文探討美國政府與企業在資訊產業,尤其開源軟體領域的法律責任。分析「免費」背後的商業策略,及其對全球市場和消費者權益的影響,並以藥品、汽車等產業案例對比,強調資訊產業須承擔法律責任,建立健康、公平的數位生態系統。
Thumbnail
本文探討美國政府與企業在資訊產業,尤其開源軟體領域的法律責任。分析「免費」背後的商業策略,及其對全球市場和消費者權益的影響,並以藥品、汽車等產業案例對比,強調資訊產業須承擔法律責任,建立健康、公平的數位生態系統。
Thumbnail
在AI迅速發展的當下,如何應對這場顛覆成為重要課題。萬維鋼在其著作《拐點:站在 AI 顛覆世界的前夜》中說明AI如何挑戰Google的搜尋霸主地位,並探討生成式AI的限制,以及在這個變革中個人如何利用AI提升決策能力,掌握未來的主導權。人要比AI凶!
Thumbnail
在AI迅速發展的當下,如何應對這場顛覆成為重要課題。萬維鋼在其著作《拐點:站在 AI 顛覆世界的前夜》中說明AI如何挑戰Google的搜尋霸主地位,並探討生成式AI的限制,以及在這個變革中個人如何利用AI提升決策能力,掌握未來的主導權。人要比AI凶!
Thumbnail
本篇文章探討百度在AI領域的核心戰略,包括閉源大模型的採用、AI as a Service的市場潛力以及智能體的廣泛應用。對於AI商業化,百度創辦人李彥宏強調應用的深度與效用才是關鍵。此外,百度如何在面對全球AI價格戰中,選擇不同的發展路徑和商業模式,將對未來的市場發展具有重要影響。
Thumbnail
本篇文章探討百度在AI領域的核心戰略,包括閉源大模型的採用、AI as a Service的市場潛力以及智能體的廣泛應用。對於AI商業化,百度創辦人李彥宏強調應用的深度與效用才是關鍵。此外,百度如何在面對全球AI價格戰中,選擇不同的發展路徑和商業模式,將對未來的市場發展具有重要影響。
Thumbnail
曾經是中國互聯網巨頭 BAT 市值第一、中國最大搜尋引擎的百度,如今市值卻跌至其他兩間公司的不到十分之一。近年來,百度加大對 AI(文心一言、阿波羅)和自駕車技術(蘿蔔快跑)的投入,積極轉型為「AI 公司」。面對阿里巴巴和騰訊等強大對手的挑戰,百度如何在 AI 時代重新站穩腳跟,甚至逆勢崛起?
Thumbnail
曾經是中國互聯網巨頭 BAT 市值第一、中國最大搜尋引擎的百度,如今市值卻跌至其他兩間公司的不到十分之一。近年來,百度加大對 AI(文心一言、阿波羅)和自駕車技術(蘿蔔快跑)的投入,積極轉型為「AI 公司」。面對阿里巴巴和騰訊等強大對手的挑戰,百度如何在 AI 時代重新站穩腳跟,甚至逆勢崛起?
Thumbnail
這次的內容,我將分享在政大聽完 OpenAI 的執行長技術顧問(Technical Advisor to the CEO) Dr. Mohammad Bavarian 在台灣的第一場演講,透過 OpenAI 官方的視角,探討人工通用智慧(AGI)的關鍵技術和未來趨勢。
Thumbnail
這次的內容,我將分享在政大聽完 OpenAI 的執行長技術顧問(Technical Advisor to the CEO) Dr. Mohammad Bavarian 在台灣的第一場演講,透過 OpenAI 官方的視角,探討人工通用智慧(AGI)的關鍵技術和未來趨勢。
Thumbnail
上禮拜有人問我:「你做《怪獸科技公司》是想讓大家知道科技變化很快,必須了解到這些應用以及如何因應,不過我們文組也早就知道 ChatGPT、Midjourney 這類 AI 了,你到底想要告訴我們什麼?」
Thumbnail
上禮拜有人問我:「你做《怪獸科技公司》是想讓大家知道科技變化很快,必須了解到這些應用以及如何因應,不過我們文組也早就知道 ChatGPT、Midjourney 這類 AI 了,你到底想要告訴我們什麼?」
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News