Anthropic推出Claude 3新模型系列,優於同行在多項評估基準上表現

更新 發佈閱讀 3 分鐘

AI圈新出了一匹“黑马”。

当地时间3月4日,人工智能初创企业Anthropic宣布推出Claude 3大模型系列。该系列包括三个型号,按照性能从弱到强分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

Claude 3

Claude 3

据官方介绍,其中最智能的模型Claude 3 Opus在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学 (GSM8K) 等。官方称:“Claude 3 Opus在复杂任务上表现出接近人类水平的理解力和流畅性。

在多项指标上,Claude 3已经展现出接近或者优于GPT-4或是Gemini 1.0的性能。

raw-image

Anthropic还列举了Claude 3的多个优点。

●近乎即时的结果。Claude 3模型可以支持实时客户聊天、自动完成和数据提取任务。其中,Haiku是智能类别市场上速度最快且最具成本效益的型号。它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文。

●强大的“视觉能力”。Claude 3可以处理各种视觉格式,包括照片、图表、图形和技术图表。

Claude 3

Claude 3

●更少的“拒绝”。与前几代模型相比,Claude 3模型对请求表现出更细致的理解,拒绝回答的频率要少得多。

Claude 3模型

Claude 3模型

●长上下文。Claude 3系列在发布时最初将提供200K上下文窗口。不过,所有三种模型都能够接受超过100万个tokens的输入,这些可能会提供给需要增强处理能力的精选客户。这意味着,Claude 3的长文本处理能力已经远胜ChatGPT,并与谷歌最新的GenAI模型——Gemini 1.5 Pro相当,后者也提供了高达100万个tokens的上下文窗口。

除此之外,Claude 3还有准确性更高、更强的“回忆”能力等优异性能。Anthropic称,Sonnet和Opus已从周一起在159个国家/地区推出,而Haiku也将很快推出。

值得注意的是,与谷歌的Gemini不同,Anthropic的Claude 3并不具备生成图像的能力,它只允许用户上传图像和其他文档进行分析。一方面,Anthropic表示,目前市场上此类需求已经大幅减少,客户也没有要求这样的功能。另一方面,这也在一定程度上减少了Claude 3陷入由自动生成内容引发的风险和争议,近期谷歌就卷进了相关舆论风波中。

公开资料显示,Anthropic创立于2021年,由OpenAI前高层Daniela Amodei和Dario Amodei创立。当前,Anthropic也是一家炙手可热的AI初创企业。在过去的一年时间里,Anthropic就完成了五笔不同的融资交易,总额约为73亿美元。在其投资者中,不乏谷歌、亚马逊等大型科技企业的身影。

Claude

Claude

 

#AI##谷歌##OpenAI#

留言
avatar-img
TommyChueng的沙龍
1會員
198內容數
TommyChueng的沙龍的其他內容
2025/01/14
▍老虎证券简介 老虎国际成立于 2014 年,于 2019 年在美国纳斯达克上市(NASDAQ:TIGR),持有全球 70 多个金融牌照和资质,服务超过千万注册用户。 自成立以来,公司屡获殊荣,例如 2023 年获得新加坡最佳零售券商、澳大利亚杰出券商及新西兰最具性价比券商等荣誉。 作为一家综
Thumbnail
2025/01/14
▍老虎证券简介 老虎国际成立于 2014 年,于 2019 年在美国纳斯达克上市(NASDAQ:TIGR),持有全球 70 多个金融牌照和资质,服务超过千万注册用户。 自成立以来,公司屡获殊荣,例如 2023 年获得新加坡最佳零售券商、澳大利亚杰出券商及新西兰最具性价比券商等荣誉。 作为一家综
Thumbnail
2024/12/23
12月19日,美国当选总统特朗普表示,在联邦债务上限设立一个多世纪后,他将支持完全取消这一上限。长期以来,债务上限一直都是反对党的政治筹码,因为当政府无节制借款以威胁到债务安全时,后果将不堪设想。 而现在,美国联邦债务又即将逼近债务上限。可以预见的是,在未来一段时间内,关于联邦政府债务的讨论将反复
2024/12/23
12月19日,美国当选总统特朗普表示,在联邦债务上限设立一个多世纪后,他将支持完全取消这一上限。长期以来,债务上限一直都是反对党的政治筹码,因为当政府无节制借款以威胁到债务安全时,后果将不堪设想。 而现在,美国联邦债务又即将逼近债务上限。可以预见的是,在未来一段时间内,关于联邦政府债务的讨论将反复
2024/12/16
12月11日亚市,黄金在关键通胀数据前保持涨势。交易员认为,若美国通胀数据符合预期,美联储将在下周举行的今年最后一场会议上降息,黄金保持了连续三天的上涨。 分析师预计,11月份美国消费者物价指数(CPI)将上涨0.3%,同比涨幅分别为2.7%和3.3%。预计美国11月整体和核心生产者物价环比涨幅均
2024/12/16
12月11日亚市,黄金在关键通胀数据前保持涨势。交易员认为,若美国通胀数据符合预期,美联储将在下周举行的今年最后一场会议上降息,黄金保持了连续三天的上涨。 分析师预计,11月份美国消费者物价指数(CPI)将上涨0.3%,同比涨幅分别为2.7%和3.3%。预计美国11月整体和核心生产者物价环比涨幅均
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
Anthropic 的經濟指數揭示了 AI 在各行各業中扮演的角色,以及它對職場的影響。這份指數顯示 AI 的應用更傾向於增強(augmentation)而非自動化(automation),尤其是在軟體開發和技術寫作等領域。這種 AI 使用情況對於了解 AI 與人類合作關係提供了寶貴的視角,同時也反
Thumbnail
Anthropic 的經濟指數揭示了 AI 在各行各業中扮演的角色,以及它對職場的影響。這份指數顯示 AI 的應用更傾向於增強(augmentation)而非自動化(automation),尤其是在軟體開發和技術寫作等領域。這種 AI 使用情況對於了解 AI 與人類合作關係提供了寶貴的視角,同時也反
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
Thumbnail
AI雖然很厲害..但BUG也不少.... 也開一個系列吧. .#tengr #BUG
Thumbnail
AI雖然很厲害..但BUG也不少.... 也開一個系列吧. .#tengr #BUG
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News