Anthropic推出Claude 3新模型系列，優於同行在多項評估基準上表現

2025/03/04 更新2024/03/05 發佈閱讀 3 分鐘

AI圈新出了一匹“黑马”。

当地时间3月4日，人工智能初创企业Anthropic宣布推出Claude 3大模型系列。该系列包括三个型号，按照性能从弱到强分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

Claude 3

据官方介绍，其中最智能的模型Claude 3 Opus在人工智能系统的大多数常见评估基准上都优于同行，包括本科水平专家知识（MMLU）、研究生水平专家推理（GPQA）、基础数学 (GSM8K) 等。官方称：“Claude 3 Opus在复杂任务上表现出接近人类水平的理解力和流畅性。”

在多项指标上，Claude 3已经展现出接近或者优于GPT-4或是Gemini 1.0的性能。

Anthropic还列举了Claude 3的多个优点。

●近乎即时的结果。Claude 3模型可以支持实时客户聊天、自动完成和数据提取任务。其中，Haiku是智能类别市场上速度最快且最具成本效益的型号。它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文。

●强大的“视觉能力”。Claude 3可以处理各种视觉格式，包括照片、图表、图形和技术图表。

Claude 3

●更少的“拒绝”。与前几代模型相比，Claude 3模型对请求表现出更细致的理解，拒绝回答的频率要少得多。

Claude 3模型

●长上下文。Claude 3系列在发布时最初将提供200K上下文窗口。不过，所有三种模型都能够接受超过100万个tokens的输入，这些可能会提供给需要增强处理能力的精选客户。这意味着，Claude 3的长文本处理能力已经远胜ChatGPT，并与谷歌最新的GenAI模型——Gemini 1.5 Pro相当，后者也提供了高达100万个tokens的上下文窗口。

除此之外，Claude 3还有准确性更高、更强的“回忆”能力等优异性能。Anthropic称，Sonnet和Opus已从周一起在159个国家/地区推出，而Haiku也将很快推出。

值得注意的是，与谷歌的Gemini不同，Anthropic的Claude 3并不具备生成图像的能力，它只允许用户上传图像和其他文档进行分析。一方面，Anthropic表示，目前市场上此类需求已经大幅减少，客户也没有要求这样的功能。另一方面，这也在一定程度上减少了Claude 3陷入由自动生成内容引发的风险和争议，近期谷歌就卷进了相关舆论风波中。

公开资料显示，Anthropic创立于2021年，由OpenAI前高层Daniela Amodei和Dario Amodei创立。当前，Anthropic也是一家炙手可热的AI初创企业。在过去的一年时间里，Anthropic就完成了五笔不同的融资交易，总额约为73亿美元。在其投资者中，不乏谷歌、亚马逊等大型科技企业的身影。

Claude

留言

TommyChueng的沙龍

1會員

198內容數

TommyChueng的沙龍的其他內容

2025/01/14

老虎证券2025新年开户大礼：最高HK$2,100代金券等你拿！

▍老虎证券简介老虎国际成立于 2014 年，于 2019 年在美国纳斯达克上市（NASDAQ：TIGR），持有全球 70 多个金融牌照和资质，服务超过千万注册用户。自成立以来，公司屡获殊荣，例如 2023 年获得新加坡最佳零售券商、澳大利亚杰出券商及新西兰最具性价比券商等荣誉。作为一家综

2025/01/14

老虎证券2025新年开户大礼：最高HK$2,100代金券等你拿！

2024/12/23

特朗普想废除的债务上限，究竟是个啥？

12月19日，美国当选总统特朗普表示，在联邦债务上限设立一个多世纪后，他将支持完全取消这一上限。长期以来，债务上限一直都是反对党的政治筹码，因为当政府无节制借款以威胁到债务安全时，后果将不堪设想。而现在，美国联邦债务又即将逼近债务上限。可以预见的是，在未来一段时间内，关于联邦政府债务的讨论将反复

2024/12/23

特朗普想废除的债务上限，究竟是个啥？

2024/12/16

通胀健康&避险情绪升温黄金强势突破2700美元

12月11日亚市，黄金在关键通胀数据前保持涨势。交易员认为，若美国通胀数据符合预期，美联储将在下周举行的今年最后一场会议上降息，黄金保持了连续三天的上涨。分析师预计，11月份美国消费者物价指数（CPI）将上涨0.3%，同比涨幅分别为2.7%和3.3%。预计美国11月整体和核心生产者物价环比涨幅均

2024/12/16

通胀健康&避险情绪升温黄金强势突破2700美元

看更多

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

看完上篇 4 位新成員的靈魂拷問，是不是意猶未盡？別急，野格團新血的驚喜正接著登場！今天下篇接力的另外 4 位「個人主題專家」，戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長；這些人如何維持長跑般的創作動力？在爆紅的文章背後，又藏著哪些不為人知的洞察？5 大靈魂拷問繼續出擊

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

#創作#創作者推薦#靈感

2026/03/25

解浩靈的思考和紀錄本

Anthropic 的「經濟指數」顯示，人工智慧在增強領域的應用優於自動化

Anthropic 的經濟指數揭示了 AI 在各行各業中扮演的角色，以及它對職場的影響。這份指數顯示 AI 的應用更傾向於增強（augmentation）而非自動化（automation），尤其是在軟體開發和技術寫作等領域。這種 AI 使用情況對於了解 AI 與人類合作關係提供了寶貴的視角，同時也反

#AI#整合#人工智慧

2025/02/11