Claude 3.7 Sonnet與Claude Code：AI模型競賽的下一章？（上）

更新於 2025/02/25發佈於 2025/02/25閱讀時間約 2 分鐘

2025年2月24日，Anthropic推出了他們迄今最先進的模型——Claude 3.7 Sonnet，以及一款專為開發者設計的命令列工具Claude Code。

Claude 3.7 Sonnet：混合推理的先驅

Claude 3.7 Sonnet被稱為一款「混合推理模型」，這意味著它能同時滿足快速回應與深入分析的需求。想像一下，你既能在幾秒內獲得一個簡潔的答案，又能讓AI花時間逐步拆解一個複雜的問題——這正是Claude 3.7 Sonnet的獨特之處。這種雙重能力讓它有別於其他競爭對手，例如OpenAI的o1（專注於推理）與GPT-4o（通用型）分離策略，或是DeepSeek的R1主打成本效益的推理模式。

在性能數據上，Claude 3.7 Sonnet展現了令人矚目的實力。特別是在程式設計領域，它在SWE-Bench Verified（一個模擬真實軟體開發挑戰的基準測試）中獲得了62.3%的得分，遠超OpenAI的o3-mini（49.3%）。在TAU-Bench測試中，這項測試衡量AI代理在複雜零碎任務中的表現，Claude 3.7 Sonnet拿下81.2%，擊敗OpenAI的o1（73.5%）。這代表Claude 3.7 Sonnet在實用的任務和工具使用場景中正逐漸領先。

不僅如此，Claude 3.7 Sonnet還在指令遵循和前端網頁開發上表現出色，並生成幾乎無誤的生產級程式碼。相較之下，雖然xAI的Grok 3尚未公開完整基準數據，但Claude 3.7 Sonnet在程式設計和實用性上的專注可能使其在特定應用場景中更勝一籌。

另一個亮點是Claude 3.7 Sonnet的輸出最高可達128,000個token，這是Claude 3.5 Sonnet的15倍。這表示Claude 3.7 Sonnet可生成極其長篇且細節豐富的回應，非常適合需要大量內容的任務。開發者還能透過API微調它的「思考預算」，在回應速度與細節間找到平衡，這對於商業應用來說無疑是一大優勢。當然，這樣的性能是有代價的：每百萬輸入token定價3美元，輸出token則為15美元，雖然比DeepSeek的R1或OpenAI的o3-mini貴，但其展現的多功能性似乎足以證明這筆花費的價值。

我是TN科技筆記，如果喜歡這篇文章，歡迎留言或轉發給朋友給我支持鼓勵！！

TN科技筆記(TechNotes)的沙龍AI領域科技筆記

TN科技筆記(TechNotes)的沙龍

2會員

21內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

留言

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

TN科技筆記(TechNotes)的沙龍的其他內容

微軟(Microsoft)的 AGI 計劃與量子運算突破：Satya Nadella 訪談整理

微軟執行長 Satya Nadella 在 Dwarkesh Patel 的 Podcast 節目中，討論有關於微軟的AI策略和量子運算的突破（有興趣的讀者可以看我之前的文章介紹-微軟(Microsoft)推出Majorana 1量子計算晶片：為量子計算開闢新道路）。

#方格新手 #人工智慧 #科技股

微軟(Microsoft)推出Majorana 1量子計算晶片：為量子計算開闢新道路

微軟(Microsoft)於2025年2月19日發布Majorana 1量子計算晶片，展現該公司近二十年量子技術的重要里程碑。

#方格新手 #人工智慧 #科技公司

Grok 3：馬斯克稱「地球上最聰明的AI」，性能超越GPT-4與Gemini？（下）

馬斯克的xAI公司推出Grok 3，號稱「地球上最聰明的AI」，並在多項基準測試中超越GPT-4o、Gemini等競爭對手

#方格新手 #人工智慧 #科技股

Grok 3：馬斯克稱「地球上最聰明的AI」，性能超越GPT-4與Gemini？（上）

馬斯克的xAI公司推出Grok 3，號稱「地球上最聰明的AI」，並在多項基準測試中超越GPT-4o、Gemini等競爭對手

#方格新手 #人工智慧 #ChatGPT

OpenAI最新佈局：GPT-4.5與GPT-5發展藍圖

OpenAI即將推出GPT-4.5和GPT-5，帶來AI使用體驗的革命性改變。GPT-4.5將簡化操作，整合產品線，GPT-5則具有更強大的推理能力、更可靠的運行表現和整合多媒體功能等。本文探討這兩大模型的特性與影響，並預測其將推動AI普及化發展。

#OpenAI #人工智慧 #科技公司

美國副總統 J.D. Vance於人工智慧高峰會發表川普政府的AI政策：避免過度監管，確保美國在AI領域的領先地位

本文整理美國川普政府對於AI發展的看法和策略，涵蓋經濟影響、國際合作、監管策略、能源需求、社會影響及國家安全等面向，並點出政府希望藉由避免過度監管、鼓勵創新和保護美國勞工權益，以確保美國在AI領域保持領先地位。

#方格新手 #人工智慧 #科技股

微軟(Microsoft)的 AGI 計劃與量子運算突破：Satya Nadella 訪談整理

#方格新手 #人工智慧 #科技股

微軟(Microsoft)推出Majorana 1量子計算晶片：為量子計算開闢新道路

微軟(Microsoft)於2025年2月19日發布Majorana 1量子計算晶片，展現該公司近二十年量子技術的重要里程碑。

#方格新手 #人工智慧 #科技公司

Grok 3：馬斯克稱「地球上最聰明的AI」，性能超越GPT-4與Gemini？（下）

馬斯克的xAI公司推出Grok 3，號稱「地球上最聰明的AI」，並在多項基準測試中超越GPT-4o、Gemini等競爭對手

#方格新手 #人工智慧 #科技股

Grok 3：馬斯克稱「地球上最聰明的AI」，性能超越GPT-4與Gemini？（上）

馬斯克的xAI公司推出Grok 3，號稱「地球上最聰明的AI」，並在多項基準測試中超越GPT-4o、Gemini等競爭對手

#方格新手 #人工智慧 #ChatGPT

OpenAI最新佈局：GPT-4.5與GPT-5發展藍圖

#OpenAI #人工智慧 #科技公司

美國副總統 J.D. Vance於人工智慧高峰會發表川普政府的AI政策：避免過度監管，確保美國在AI領域的領先地位

本篇參與的主題活動

有緣人15-本文獲「關鍵評論網」轉載-從孫生事件，看我們該為孩子守住的底線—「我是父親，我有兒女，我不能沉默。」

當流量至上成為標準，性騷擾被輕描淡寫、受害者被噤聲，我們是否還能給孩子一個安全的未來？作為父親，我無法接受這種價值觀繼續影響下一代。我們該做的，不是遺忘，而是改變環境——拒絕縱容、用行動發聲，讓孩子知道「尊重是底線，說不是權利」。這不只是關於孫生，而是關於我們願意為未來的孩子守住什麼樣的世界。

#支持 #方格新手 #文章

西卡RE。LIFE人生筆記

2025/02/14

閱讀｜《小狗錢錢》：從記帳到成功日記，打造我的財務自由之路

學習《小狗錢錢》的理財方法，並透過實際操作，達成財務目標與自我提升。從記帳、設定目標、寫夢想清單、成功日記，到發展副業，分享如何將書中方法應用於生活中，並體會到理財不僅僅是管理金錢，更是規劃生活，實現夢想的重要過程。

#成功 #夢想 #日記

歐巴桑Gap year

2025/02/12

2017 vs 2024 日本東北雪景大不同！藏王樹冰、銀山溫泉、山寺的冬日奇景，好美！

比較2017年與2024年日本東北旅遊照片，對比藏王樹冰、銀山溫泉、山寺等景點在不同時間的景觀差異，即使地點相同，不同時間的體驗與感受截然不同，珍惜每個當下的珍貴回憶。2024年因暖冬導致雪景不如預期，反觀2017年的雪景壯觀美麗。新聞報導2025年日本東北暴雪，衷心祈願一切平安。

#東北 #日本 #日本旅行

簡單生活文案

2025/02/12

整理｜成為極簡主義者後，我的十個清潔小習慣

經過年末年初的大掃除，大家是否也好好整頓了自己的居家環境呢？身為家有幼童的媽媽，我也是歷經多次的練習，才調整到適合自己的清潔節奏，在此與大家分享我的清潔小撇步，每個習慣幾乎不超過5分鐘，就能換得一室乾淨，一起來看吧！

#整理 #斷捨離 #極簡主義

Jemi

2025/02/09

屏東｜德文山健行-沒想到竟成為拖鞋勇士的一天？

記錄一場前往屏東縣三地門鄉德文山（觀望山）的登山之旅，分享路線規劃、登山心得、沿途風景與美食體驗，並提醒登山客注意入山證申請及避免錯過三角點。

#蛇年大吉 #登高 #登山

方格裡的‹思›語室

2025/02/09

《錢，和你想的不一樣》03-《年薪百萬的人，和普通上班族的最大思維差距》

薪水的高低，從來不是努力的問題，而是思維的選擇。年薪百萬的人，不是單靠埋頭苦幹，而是透過「創造價值」決定自己的價格。他們懂得提升不可取代性、創造多重收入、主動尋找機會、投資自己，讓財富加速成長。與其等加薪，不如掌握「決定薪資的能力」。這篇文章，讓你看清真正的收入差距，從現在開始，為自己創造更高價值！

#人生的路 #日常 #作者

方格裡的‹思›語室

2025/02/17

有緣人15-本文獲「關鍵評論網」轉載-從孫生事件，看我們該為孩子守住的底線—「我是父親，我有兒女，我不能沉默。」

#支持 #方格新手 #文章

西卡RE。LIFE人生筆記

2025/02/14

閱讀｜《小狗錢錢》：從記帳到成功日記，打造我的財務自由之路

#成功 #夢想 #日記

歐巴桑Gap year

2025/02/12

2017 vs 2024 日本東北雪景大不同！藏王樹冰、銀山溫泉、山寺的冬日奇景，好美！