Claude 3.7 Sonnet與Claude Code:AI模型競賽的下一章?(上)

更新於 發佈於 閱讀時間約 2 分鐘


raw-image


2025年2月24日,Anthropic推出了他們迄今最先進的模型——Claude 3.7 Sonnet,以及一款專為開發者設計的命令列工具Claude Code。



Claude 3.7 Sonnet:混合推理的先驅

Claude 3.7 Sonnet被稱為一款「混合推理模型」,這意味著它能同時滿足快速回應與深入分析的需求。想像一下,你既能在幾秒內獲得一個簡潔的答案,又能讓AI花時間逐步拆解一個複雜的問題——這正是Claude 3.7 Sonnet的獨特之處。這種雙重能力讓它有別於其他競爭對手,例如OpenAI的o1(專注於推理)與GPT-4o(通用型)分離策略,或是DeepSeek的R1主打成本效益的推理模式。


在性能數據上,Claude 3.7 Sonnet展現了令人矚目的實力。特別是在程式設計領域,它在SWE-Bench Verified(一個模擬真實軟體開發挑戰的基準測試)中獲得了62.3%的得分,遠超OpenAI的o3-mini(49.3%)。在TAU-Bench測試中,這項測試衡量AI代理在複雜零碎任務中的表現,Claude 3.7 Sonnet拿下81.2%,擊敗OpenAI的o1(73.5%)。這代表Claude 3.7 Sonnet在實用的任務和工具使用場景中正逐漸領先。


不僅如此,Claude 3.7 Sonnet還在指令遵循和前端網頁開發上表現出色,並生成幾乎無誤的生產級程式碼。相較之下,雖然xAI的Grok 3尚未公開完整基準數據,但Claude 3.7 Sonnet在程式設計和實用性上的專注可能使其在特定應用場景中更勝一籌。


另一個亮點是Claude 3.7 Sonnet的輸出最高可達128,000個token,這是Claude 3.5 Sonnet的15倍。這表示Claude 3.7 Sonnet可生成極其長篇且細節豐富的回應,非常適合需要大量內容的任務。開發者還能透過API微調它的「思考預算」,在回應速度與細節間找到平衡,這對於商業應用來說無疑是一大優勢。當然,這樣的性能是有代價的:每百萬輸入token定價3美元,輸出token則為15美元,雖然比DeepSeek的R1或OpenAI的o3-mini貴,但其展現的多功能性似乎足以證明這筆花費的價值。


我是TN科技筆記,如果喜歡這篇文章,歡迎留言或轉發給朋友給我支持鼓勵!!


大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
留言
avatar-img
留言分享你的想法!

































































微軟執行長 Satya Nadella 在 Dwarkesh Patel 的 Podcast 節目中,討論有關於微軟的AI策略和量子運算的突破(有興趣的讀者可以看我之前的文章介紹-微軟(Microsoft)推出Majorana 1量子計算晶片:為量子計算開闢新道路)。 
微軟(Microsoft)於2025年2月19日發布Majorana 1量子計算晶片,展現該公司近二十年量子技術的重要里程碑。
馬斯克的xAI公司推出Grok 3,號稱「地球上最聰明的AI」,並在多項基準測試中超越GPT-4o、Gemini等競爭對手
馬斯克的xAI公司推出Grok 3,號稱「地球上最聰明的AI」,並在多項基準測試中超越GPT-4o、Gemini等競爭對手
OpenAI即將推出GPT-4.5和GPT-5,帶來AI使用體驗的革命性改變。GPT-4.5將簡化操作,整合產品線,GPT-5則具有更強大的推理能力、更可靠的運行表現和整合多媒體功能等。本文探討這兩大模型的特性與影響,並預測其將推動AI普及化發展。
本文整理美國川普政府對於AI發展的看法和策略,涵蓋經濟影響、國際合作、監管策略、能源需求、社會影響及國家安全等面向,並點出政府希望藉由避免過度監管、鼓勵創新和保護美國勞工權益,以確保美國在AI領域保持領先地位。
微軟執行長 Satya Nadella 在 Dwarkesh Patel 的 Podcast 節目中,討論有關於微軟的AI策略和量子運算的突破(有興趣的讀者可以看我之前的文章介紹-微軟(Microsoft)推出Majorana 1量子計算晶片:為量子計算開闢新道路)。 
微軟(Microsoft)於2025年2月19日發布Majorana 1量子計算晶片,展現該公司近二十年量子技術的重要里程碑。
馬斯克的xAI公司推出Grok 3,號稱「地球上最聰明的AI」,並在多項基準測試中超越GPT-4o、Gemini等競爭對手
馬斯克的xAI公司推出Grok 3,號稱「地球上最聰明的AI」,並在多項基準測試中超越GPT-4o、Gemini等競爭對手
OpenAI即將推出GPT-4.5和GPT-5,帶來AI使用體驗的革命性改變。GPT-4.5將簡化操作,整合產品線,GPT-5則具有更強大的推理能力、更可靠的運行表現和整合多媒體功能等。本文探討這兩大模型的特性與影響,並預測其將推動AI普及化發展。
本文整理美國川普政府對於AI發展的看法和策略,涵蓋經濟影響、國際合作、監管策略、能源需求、社會影響及國家安全等面向,並點出政府希望藉由避免過度監管、鼓勵創新和保護美國勞工權益,以確保美國在AI領域保持領先地位。
本篇參與的主題活動
當流量至上成為標準,性騷擾被輕描淡寫、受害者被噤聲,我們是否還能給孩子一個安全的未來?作為父親,我無法接受這種價值觀繼續影響下一代。我們該做的,不是遺忘,而是改變環境——拒絕縱容、用行動發聲,讓孩子知道「尊重是底線,說不是權利」。這不只是關於孫生,而是關於我們願意為未來的孩子守住什麼樣的世界。
學習《小狗錢錢》的理財方法,並透過實際操作,達成財務目標與自我提升。從記帳、設定目標、寫夢想清單、成功日記,到發展副業,分享如何將書中方法應用於生活中,並體會到理財不僅僅是管理金錢,更是規劃生活,實現夢想的重要過程。
比較2017年與2024年日本東北旅遊照片,對比藏王樹冰、銀山溫泉、山寺等景點在不同時間的景觀差異,即使地點相同,不同時間的體驗與感受截然不同,珍惜每個當下的珍貴回憶。2024年因暖冬導致雪景不如預期,反觀2017年的雪景壯觀美麗。新聞報導2025年日本東北暴雪,衷心祈願一切平安。
經過年末年初的大掃除,大家是否也好好整頓了自己的居家環境呢?身為家有幼童的媽媽,我也是歷經多次的練習,才調整到適合自己的清潔節奏,在此與大家分享我的清潔小撇步,每個習慣幾乎不超過5分鐘,就能換得一室乾淨,一起來看吧!
記錄一場前往屏東縣三地門鄉德文山(觀望山)的登山之旅,分享路線規劃、登山心得、沿途風景與美食體驗,並提醒登山客注意入山證申請及避免錯過三角點。
薪水的高低,從來不是努力的問題,而是思維的選擇。年薪百萬的人,不是單靠埋頭苦幹,而是透過「創造價值」決定自己的價格。他們懂得提升不可取代性、創造多重收入、主動尋找機會、投資自己,讓財富加速成長。與其等加薪,不如掌握「決定薪資的能力」。這篇文章,讓你看清真正的收入差距,從現在開始,為自己創造更高價值!
當流量至上成為標準,性騷擾被輕描淡寫、受害者被噤聲,我們是否還能給孩子一個安全的未來?作為父親,我無法接受這種價值觀繼續影響下一代。我們該做的,不是遺忘,而是改變環境——拒絕縱容、用行動發聲,讓孩子知道「尊重是底線,說不是權利」。這不只是關於孫生,而是關於我們願意為未來的孩子守住什麼樣的世界。
學習《小狗錢錢》的理財方法,並透過實際操作,達成財務目標與自我提升。從記帳、設定目標、寫夢想清單、成功日記,到發展副業,分享如何將書中方法應用於生活中,並體會到理財不僅僅是管理金錢,更是規劃生活,實現夢想的重要過程。
比較2017年與2024年日本東北旅遊照片,對比藏王樹冰、銀山溫泉、山寺等景點在不同時間的景觀差異,即使地點相同,不同時間的體驗與感受截然不同,珍惜每個當下的珍貴回憶。2024年因暖冬導致雪景不如預期,反觀2017年的雪景壯觀美麗。新聞報導2025年日本東北暴雪,衷心祈願一切平安。
經過年末年初的大掃除,大家是否也好好整頓了自己的居家環境呢?身為家有幼童的媽媽,我也是歷經多次的練習,才調整到適合自己的清潔節奏,在此與大家分享我的清潔小撇步,每個習慣幾乎不超過5分鐘,就能換得一室乾淨,一起來看吧!
記錄一場前往屏東縣三地門鄉德文山(觀望山)的登山之旅,分享路線規劃、登山心得、沿途風景與美食體驗,並提醒登山客注意入山證申請及避免錯過三角點。
薪水的高低,從來不是努力的問題,而是思維的選擇。年薪百萬的人,不是單靠埋頭苦幹,而是透過「創造價值」決定自己的價格。他們懂得提升不可取代性、創造多重收入、主動尋找機會、投資自己,讓財富加速成長。與其等加薪,不如掌握「決定薪資的能力」。這篇文章,讓你看清真正的收入差距,從現在開始,為自己創造更高價值!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
我問AI,結果得到的兩個完全相反的結果,老師在教學影片中說的是Claude的版本.... 在AI時代自學,除了要懂得下咒語(prompt,網路上到處在教如何下正確的prompt,使AI更好用),還是要有一定的基礎能力(例如查核能力),不要太相信AI給的答案,多問幾家總是好的。
Thumbnail
Anthropic Claude 3擁有先進的視覺能力,可以處理圖像數據並幫助使用者更好理解圖表、圖形和照片。通過使用Claude Messages API,開發虛擬助手應用程序以及為模型構建多模態prompt,你可以讓模型描述圖片中的內容。
Anthropic 發布了 Claude 3 Haiku,這是其智慧等級中速度最快且最實惠的 AI 模型。 Haiku 擁有最先進的視覺功能和在產業基準中最強大的性能,被譽為適用於各種企業應用的多功能解決方案。
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
Thumbnail
未來,針對圖片生成的 prompt engineering 可能會越來越不重要。
Thumbnail
新的AI工具claude2可以上傳文件,幫使用者分析資料、提供重點整理,於是立即牛刀小試上一篇文章《婚姻風暴》。claude2的使用方式與ChatGPT大大不同,claude2只接受使用者上傳的專屬資料,分析並整理重點,並不會像ChatGPT去搜索開放的全網資料;claude2比較像是學術上
Thumbnail
ChatGPT最強競爭對手Claude2,它是Anthropic公司自主研發的AI對話助手,類似ChatGPT,是一個免費的服務,只需要註冊就可以開始使用,它不僅支持自然語言交談,還能分析和理解長篇內容的能力,用戶直接上傳PDF、Word等文件。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
我問AI,結果得到的兩個完全相反的結果,老師在教學影片中說的是Claude的版本.... 在AI時代自學,除了要懂得下咒語(prompt,網路上到處在教如何下正確的prompt,使AI更好用),還是要有一定的基礎能力(例如查核能力),不要太相信AI給的答案,多問幾家總是好的。
Thumbnail
Anthropic Claude 3擁有先進的視覺能力,可以處理圖像數據並幫助使用者更好理解圖表、圖形和照片。通過使用Claude Messages API,開發虛擬助手應用程序以及為模型構建多模態prompt,你可以讓模型描述圖片中的內容。
Anthropic 發布了 Claude 3 Haiku,這是其智慧等級中速度最快且最實惠的 AI 模型。 Haiku 擁有最先進的視覺功能和在產業基準中最強大的性能,被譽為適用於各種企業應用的多功能解決方案。
Thumbnail
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
Thumbnail
未來,針對圖片生成的 prompt engineering 可能會越來越不重要。
Thumbnail
新的AI工具claude2可以上傳文件,幫使用者分析資料、提供重點整理,於是立即牛刀小試上一篇文章《婚姻風暴》。claude2的使用方式與ChatGPT大大不同,claude2只接受使用者上傳的專屬資料,分析並整理重點,並不會像ChatGPT去搜索開放的全網資料;claude2比較像是學術上
Thumbnail
ChatGPT最強競爭對手Claude2,它是Anthropic公司自主研發的AI對話助手,類似ChatGPT,是一個免費的服務,只需要註冊就可以開始使用,它不僅支持自然語言交談,還能分析和理解長篇內容的能力,用戶直接上傳PDF、Word等文件。