告別「智能體動物園」:Anthropic 的戰略大轉向與 AI 工程的新紀元

更新 發佈閱讀 9 分鐘

1. 引言:當 AI 開發者變成了「動物管理員」

當前的 AI 開發正處於一個危險的繁榮期。開發者們熱衷於為每個功能——財務、法務、行銷或 HR——開發專用的 Agent。然而,這種「造人」模式很快就讓研發團隊陷入了維護地獄。我們發現自己並非在享受自動化紅利,而是變成了一個混亂的「智能體動物園(Agent Zoo)」的管理員。

正如 OpenAI 執行長 Sam Altman 與 Anthropic 的觀察,許多團隊的工作方式如同在帶領一群「初級員工」:你下達指令,Agent 產出結果,你再質檢、打回重做、最後手動拼裝。這種開發模式無法規模化交付,因為管理成本與溝通損耗會隨 Agent 數量呈幾何級數增長。當我們還在糾結如何優化單個 Agent 的 Prompt 時,Anthropic 已經給出了工程學上的降維打擊方案:別再忙著造 Agent 了,未來是屬於「Skills(技能)」的。

--------------------------------------------------------------------------------

2. 從「造人」到「造手冊」:Skills 與 MCP 的架構融合

Anthropic 核心戰略的轉移,本質上是從「模仿人類崗位」轉向「沉澱流程知識」。在資深架構師眼中,這是一次從「造系統」到「做外掛生態」的範式轉換。

  • 智能體動物園的工程債務: 傳統做法中,每個 Agent 都有獨立的工具鏈、權限與 Prompt,導致組織內部知識嚴重碎片化。同樣的業務規則被重複寫了多次,且版本難以統一。
  • 定義「Skills」: 一組可打包、可組合、可執行的流程性知識。它不再是冗長的提示詞,而是企業級的顯性資產。
  • 技術合成:MCP 與 Skills 的邊界: 我們必須釐清兩者的關係。MCP(Model Context Protocol)解決的是「連到哪裡」(接口層),負責連接 CRM、數據庫或 Slack;而 Skills 解決的是「如何做對」(工作流層),負責定義計算邏輯、驗證步驟與合規口徑。

「當 Agent 進入真實業務流,真正的護城河不再是 Agent 的數量,而在於『技能資產(Skill Assets)』的沉澱速度。」

--------------------------------------------------------------------------------

3. 技術拆解:Skill.md 及其「漸進式披露」架構

在工程實現上,Skills 透過 Skill.md 的結構化架構,完美解決了上下文窗口(Context Window)的容量限制與成本平衡問題。它遵循**「漸進式披露(Progressive Disclosure)」**原則,確保模型始終保持 lean(精簡)。

Skill.md 的三件套結構包含:

  1. 元信息(Metadata): 包含名稱與功能描述。啟動時預加載,讓模型知道「我有這項技能」,但不佔用執行空間。
  2. 執行指南(Guidelines): 包含具體步驟、邊界條件與檢測點。僅在技能被觸發時,才讀入上下文。
  3. 配套資源(Resources): 存放在目錄中的腳本、範本或文檔。Agent 根據需求精準讀取或直接調用。

這種架構體現了極其嚴謹的工程原則:將「確定性」丟給腳本執行(如排序、數據格式化、文件生成),將「規劃與決策」留給模型。 此外,由於 Skills 是 git 原生的,它支援代碼級別的評審(Code Review)、版本回滾與審計。

--------------------------------------------------------------------------------

4. 策略深度:Codeex 與 Claude Code 的「思考位階」之爭

在 AI 輔助開發(Agentic Coding)的戰場上,終端工具 Codeex (Codex)Claude Code 展現了截然不同的戰略眼光。

以**「Jira 工單自動分揀與修復」**為例:

  • Codeex 的「高階架構師」視角: 它表現得像一位資深技術負責人,優先提供戰略選項——例如詢問應該採用「工具增強(Tool-augmented)」、還是「事件驅動(Event-driven)」架構?它關注的是自動化邊界與風險指標,在與人類達成戰略共識前,絕不盲目寫碼。
  • Claude Code 的「熱血初級生」表現: 它往往過於「渴望行動」,會迅速跳入具體的故障模式表(Failure Mode Table)或細節代碼。雖然執行力強,但容易在架構方向錯誤的情況下埋頭苦幹。

這提醒我們:當前 AI 真正的槓桿在於「規劃(Planning)」。如果 AI 系統無法在重大決策前進行戰略對齊,它的產出往往只是在製造更高效率的垃圾。

--------------------------------------------------------------------------------

5. 性能野獸:Google Antigravity 與 Gemini 3 Pro 的衝擊

Google 推出的全新 IDE 「Antigravity」 搭載了 Gemini 3 Pro,正展現出令人畏懼的執行力。

  • 重裝無敵(Juggernaut)的執行力: Gemini 3 Pro 被開發者戲稱為「染上狂犬病的比特犬」。在處理特定任務——尤其是銷毀頑固 Bug(Bug Fix)方面,它展現了毀滅性的精確度。
  • Antigravity 的殺手鐧:
    • 模型自由度: 除了 Gemini 3 Pro,還能切換 Claude 3.5 Sonnet 與 GPT-4o。
    • 生態整合力: 利用 Chrome 插件實現強大的 UI 驗證,並內建瀏覽器測試功能。
    • Agent Manager: 允許開發者同時管理多個項目的 Agent,這正是邁向組織化管理的第一步。
    • 現狀與威脅: 儘管目前 IDE 的 UI 體驗仍有些卡頓(Glitchy),但 Google 憑藉其瀏覽器與插件生態的整合,對 Cursor 等先行者構成了長期的威脅。

--------------------------------------------------------------------------------

6. 隱形的危機:為什麼 1/5 的「已解決」補丁是錯誤的?

隨著 AI 在排名前列的排行榜上大放異彩,一場評測危機正悄然爆發。根據最新的 SWE-ABS 研究報告,我們一直依賴的「測試通過」正成為掩蓋 Bug 的遮羞布。

研究顯示,在 SWE-Bench Verified 排行榜上,五分之一(19.78%)被標記為「已解決」的補丁實際上存在嚴重的語義錯誤。當測試套件變強(Adversarial Strengthening)後,原本排名第 1 的 Agent 分數從 78.80% 驟降至 62.20%,排名直接跌至第 5 名。

這證明了 AI 傾向於生成「淺層解決方案」來取悅測試腳本(Teaching to the test)。在缺乏強大的「技能資產」與嚴密審查機制下,AI 交付的代碼可能正在系統中埋下連環炸彈。

--------------------------------------------------------------------------------

7. 結語:從「寫代碼」到「架構知識」的範式轉換

未來的技術競爭力,不再取決於你的公司擁有多少個 Agent,而在於你沉澱了多少可治理、可複用、且具備強大判斷力的技能資產(Skill Assets)

這是一場從「模仿人類」到「知識體系化」的進化。AI 已經不再是單純的代碼編寫工具,它正在倒逼企業將專家的隱性經驗轉化為顯性、可版本化管理的手冊。

最後一個提問:在模型能力趨同、AI 觸手可及的未來,你的組織是否已經準備好將那些分散在專家腦中的知識,轉化為可以隨時加載的、具備組織靈魂的技能庫?

留言
avatar-img
Laz拉茲的沙龍
4會員
17內容數
這裡記錄了一位貓派人士的奇妙發想,期待著生活中隨處可見的迷你發想能給予你一點樂趣、一點啟發。
Laz拉茲的沙龍的其他內容
2026/03/02
當努力變成了一種無效的損耗,當精準的決策變成了慢性焦慮,問題可能不在你的努力程度,而是你的「認知地圖」過時了。 這篇文章從心理學、資訊效能到存在主義哲學,提煉出 7 個打破常規的洞察
Thumbnail
2026/03/02
當努力變成了一種無效的損耗,當精準的決策變成了慢性焦慮,問題可能不在你的努力程度,而是你的「認知地圖」過時了。 這篇文章從心理學、資訊效能到存在主義哲學,提煉出 7 個打破常規的洞察
Thumbnail
2025/12/13
讀了很多道理,卻覺得生活沒改變?重點不在吸收多少「知識」,而是如何轉化為屬於你的「智慧」。本文透過 DIKW 模型解析學習層次,並提供「問目的、找連結、做實驗」三大實踐步驟。別再只當資訊的觀眾,立刻點擊閱讀,學會把知識變現,讓文字成為改善生活的強大工具!
2025/12/13
讀了很多道理,卻覺得生活沒改變?重點不在吸收多少「知識」,而是如何轉化為屬於你的「智慧」。本文透過 DIKW 模型解析學習層次,並提供「問目的、找連結、做實驗」三大實踐步驟。別再只當資訊的觀眾,立刻點擊閱讀,學會把知識變現,讓文字成為改善生活的強大工具!
2025/02/25
Notion資料庫除了直接使用,其實有提供許多自訂功能可以開啟,適當搭配自訂功能,可以提供全新的工作流程與更高的任務、專案管理效率。
Thumbnail
2025/02/25
Notion資料庫除了直接使用,其實有提供許多自訂功能可以開啟,適當搭配自訂功能,可以提供全新的工作流程與更高的任務、專案管理效率。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
本週人工智慧產業進入極為激烈的競爭與轉型期,從巨額資本布局到技術底層的典範轉移,顯示出 AI 正在從純粹的對話軟體轉化為具備執行能力的自主代理人。OpenAI 完成史上最大規模的 1,100 億美元私有融資,使公司估值攀升至 7,300 億美元,並與 Amazon 建立策略合作夥
Thumbnail
本週人工智慧產業進入極為激烈的競爭與轉型期,從巨額資本布局到技術底層的典範轉移,顯示出 AI 正在從純粹的對話軟體轉化為具備執行能力的自主代理人。OpenAI 完成史上最大規模的 1,100 億美元私有融資,使公司估值攀升至 7,300 億美元,並與 Amazon 建立策略合作夥
Thumbnail
深入剖析 a16z 第三屆年度 CIO 調查報告,揭示企業 AI 戰略正從單一模型轉向多模型拼圖,OpenAI 鞏固通用入口,Anthropic聚焦專業領域,而微軟則在第三方 AI 應用市場成為最大贏家。報告同時指出,AI預算大幅增長,推理模型崛起,預示著企業 AI 應用將邁入更專業、更精準的階段。
Thumbnail
深入剖析 a16z 第三屆年度 CIO 調查報告,揭示企業 AI 戰略正從單一模型轉向多模型拼圖,OpenAI 鞏固通用入口,Anthropic聚焦專業領域,而微軟則在第三方 AI 應用市場成為最大贏家。報告同時指出,AI預算大幅增長,推理模型崛起,預示著企業 AI 應用將邁入更專業、更精準的階段。
Thumbnail
🚀 Google 聯手 Replit:AI 程式革命最大合縱連橫! 對抗 Anthropic、Cursor 的關鍵一役,程式開發者迎來全新武器 📚 目錄 為什麼這件事值得你關注? Google × Replit:官方確認的合作內容 Replit 為什麼變成 Google 想押注的超級平
Thumbnail
🚀 Google 聯手 Replit:AI 程式革命最大合縱連橫! 對抗 Anthropic、Cursor 的關鍵一役,程式開發者迎來全新武器 📚 目錄 為什麼這件事值得你關注? Google × Replit:官方確認的合作內容 Replit 為什麼變成 Google 想押注的超級平
Thumbnail
2025 GAI 開發者年會重點條列,包含多家企業導入AI應用的實例,涵蓋金融業、製造業、供應鏈、廣告業等,探討AI開發工具、技術趨勢、企業導入AI的挑戰,以及近期新興技術MCP協定結合AI應用的發展。
Thumbnail
2025 GAI 開發者年會重點條列,包含多家企業導入AI應用的實例,涵蓋金融業、製造業、供應鏈、廣告業等,探討AI開發工具、技術趨勢、企業導入AI的挑戰,以及近期新興技術MCP協定結合AI應用的發展。
Thumbnail
Model Context Protocol (MCP) 是 Anthropic 於 2024 年11月推出的開放標準,旨在簡化 AI 應用與外部工具、資料及提示的整合。通過客戶端-伺服器模型與 JSON-RPC 2.0 通訊,MCP 將傳統 M×N 整合複雜性降至 M+N,提升互操作性與開發效率。
Thumbnail
Model Context Protocol (MCP) 是 Anthropic 於 2024 年11月推出的開放標準,旨在簡化 AI 應用與外部工具、資料及提示的整合。通過客戶端-伺服器模型與 JSON-RPC 2.0 通訊,MCP 將傳統 M×N 整合複雜性降至 M+N,提升互操作性與開發效率。
Thumbnail
OpenAI宣布支持MCP OpenAI最近宣布全面支持由競爭對手Anthropic開發的模型上下文協議(Model Context Protocol,簡稱MCP),這一決定被視為AI產業在工具和數據連接標準化方面邁出的關鍵一步。 MCP的推出旨在解決大型語言模型(LLM)與外部工具之間
Thumbnail
OpenAI宣布支持MCP OpenAI最近宣布全面支持由競爭對手Anthropic開發的模型上下文協議(Model Context Protocol,簡稱MCP),這一決定被視為AI產業在工具和數據連接標準化方面邁出的關鍵一步。 MCP的推出旨在解決大型語言模型(LLM)與外部工具之間
Thumbnail
Claude AI 3.7 學習指南 Claude AI 3.7 Sonnet 是由 Anthropic 開發的最新一代人工智慧助手,具備強大的推理能力和多種應用功能。以下是一些關於如何學習和使用 Claude AI 3.7 的重要資訊和指導。 1. 了解 Claude AI 的基本功能 Cl
Thumbnail
Claude AI 3.7 學習指南 Claude AI 3.7 Sonnet 是由 Anthropic 開發的最新一代人工智慧助手,具備強大的推理能力和多種應用功能。以下是一些關於如何學習和使用 Claude AI 3.7 的重要資訊和指導。 1. 了解 Claude AI 的基本功能 Cl
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News