Haiku 4.5 發布:效能追平 Sonnet 4,成本降至 1/3

更新 發佈閱讀 4 分鐘

Anthropic 剛推出了新模型 Claude Haiku 4.5。

raw-image

這是一個重要的產業訊號。5 個月前,Sonnet 4 還是程式開發能力最頂尖的模型之一。現在,Haiku 4.5 以 1/3 的價格和快一倍的速度,達到了同級的效能。

我們來看一下具體資訊。

「小杯」模型,不再是「陽春版」

依照 Anthropic 的產品線劃分,Haiku 是定位最低的「小杯」模型,主打低成本與高速度。在傳統觀念裡,這意味著能力有限。

這次不一樣了。

在軟體工程基準測試 SWE-bench Verified 上,Haiku 4.5 的表現小幅超越了 5 個月前的 Sonnet 4,甚至超過了 GPT-4 和 Gemini 1.5 Pro。

在「電腦操作 (Computer Use)」這項 Agentic 功能測試中,Haiku 4.5 的表現也全面優于 Sonnet 4,並且回應速度更快。

raw-image

這說明,高階能力正快速向下普及。過去需要中大型模型才能勝任的任務,現在一個輕量級模型就能高效完成。

raw-image

5 個月,從旗艦到普及

我們來量化一下這個速度。

2024 年 5 月,Anthropic 發布 Sonnet 4,API 呼叫價格是每百萬 tokens 輸入 3 美元、輸出 15 美元。

今天,獲得同樣的智慧水準,模型價格變成了輸入 1 美元、輸出 5 美元。

raw-image

總結一下:效能持平,價格是原來的三分之一,速度快了一倍多。

「去年的旗艦,今年的中階,明年的入門」,這個趨勢還在加速。對於開發者而言,這意味著我們的工具正變得越來越強大,成本卻越來越低。

如何立即用上 Haiku 4.5

1. 個人使用者

Haiku 4.5 現在可以在 Claude.ai 免費使用。

不過,考量到 Anthropic 的帳號封鎖策略,更穩定的方式是使用 Perplexity Pro 這類整合了 Claude 模型的第三方服務。

2. 開發者

Haiku 4.5 的 API 已經全面上線,我們可以在 Anthropic 官方、Amazon Bedrock 和 Google Cloud 中呼叫。

它也為我們提供了一種新的、更經濟實惠的工作流程:用 Sonnet 4.5 擔任「專案經理」,負責複雜的規劃與推理;用 Haiku 4.5 作為「執行團隊」,處理大量的具體任務。

這種不同模型的「多智慧體協作」,能有效平衡應用的開發成本與能力上限。

結語

AI 模型的效能向下普及,比我們預想的要快。

這對我們是好事。我們能用上的工具越來越強,能建構的應用也越來越超乎想像。

當然,這也要求我們必須不斷學習、適應,並用好這些新工具。

快去試試 Haiku 4.5 吧。

小弟創建了一個有關ClaudeCode以及AI程式碼的DC群組,目前還處於起步狀態,希望各位能多多支持!每天都會在群組裏分享ClaudeCode或codex的使用技巧。如果大家感興趣,請點按AI程式設計交流群組加入!感激不盡。

留言
avatar-img
留言分享你的想法!
avatar-img
KoiCode的沙龍
8會員
11內容數
解鎖更多claude code/程式碼相關的玩法和黑科技
KoiCode的沙龍的其他內容
2025/10/14
本文介紹開源專案 MCP-Router,解決 AI 應用在調用外部工具、存取最新資訊時,MCP 服務重複設定的低效率問題。MCP-Router 透過聚合上游 MCP 服務,提供統一接入點,讓開發者實現「一次設定,所有應用共享」,大幅節省時間並降低工具切換的維護成本。
2025/10/14
本文介紹開源專案 MCP-Router,解決 AI 應用在調用外部工具、存取最新資訊時,MCP 服務重複設定的低效率問題。MCP-Router 透過聚合上游 MCP 服務,提供統一接入點,讓開發者實現「一次設定,所有應用共享」,大幅節省時間並降低工具切換的維護成本。
2025/10/13
本文深度解析Gemini CLI與Claude Code新推出的插件系統。其核心是通過打包分享自定義工具,將CLI從封閉應用變為可擴展的開發平台。Gemini直接且易於上手,而Claude藉由Marketplace、子智能體等高級功能,實現了更深度的流程定制。
2025/10/13
本文深度解析Gemini CLI與Claude Code新推出的插件系統。其核心是通過打包分享自定義工具,將CLI從封閉應用變為可擴展的開發平台。Gemini直接且易於上手,而Claude藉由Marketplace、子智能體等高級功能,實現了更深度的流程定制。
2025/10/10
介紹 Anthropic 公司為 Claude Code 推出的擴充套件系統功能,闡述其如何解決開發團隊在環境設定、團隊標準化、新人入職等方面的長期痛點,並展示了擴充套件可包含的內容及其實際應用場景。文章也提及了建立自訂擴充套件市集的可能性,以及該功能對分享工作流程、提升協作效率的重大意義。
2025/10/10
介紹 Anthropic 公司為 Claude Code 推出的擴充套件系統功能,闡述其如何解決開發團隊在環境設定、團隊標準化、新人入職等方面的長期痛點,並展示了擴充套件可包含的內容及其實際應用場景。文章也提及了建立自訂擴充套件市集的可能性,以及該功能對分享工作流程、提升協作效率的重大意義。
看更多
你可能也想看
Thumbnail
雙11於許多人而言,不只是單純的折扣狂歡,更是行事曆裡預定的,對美好生活的憧憬。 錢錢沒有不見,它變成了快樂,跟讓臥房、辦公桌、每天早晨的咖啡香升級的樣子! 這次格編突擊辦公室,也邀請 vocus「野格團」創作者分享掀開蝦皮購物車的簾幕,「加入購物車」的瞬間,藏著哪些靈感,或是對美好生活的想像?
Thumbnail
雙11於許多人而言,不只是單純的折扣狂歡,更是行事曆裡預定的,對美好生活的憧憬。 錢錢沒有不見,它變成了快樂,跟讓臥房、辦公桌、每天早晨的咖啡香升級的樣子! 這次格編突擊辦公室,也邀請 vocus「野格團」創作者分享掀開蝦皮購物車的簾幕,「加入購物車」的瞬間,藏著哪些靈感,或是對美好生活的想像?
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
「Embrace AI to unlock a new era of efficiency, unleashing creativity and marketing infinite potencial.」擁抱AI,開啟效率新時代,釋放創意與行銷無限潛力
Thumbnail
「Embrace AI to unlock a new era of efficiency, unleashing creativity and marketing infinite potencial.」擁抱AI,開啟效率新時代,釋放創意與行銷無限潛力
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News