Anthropic推出Claude 3新模型系列,優於同行在多項評估基準上表現

閱讀時間約 3 分鐘

AI圈新出了一匹“黑马”。

当地时间3月4日,人工智能初创企业Anthropic宣布推出Claude 3大模型系列。该系列包括三个型号,按照性能从弱到强分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

Claude 3

Claude 3

据官方介绍,其中最智能的模型Claude 3 Opus在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学 (GSM8K) 等。官方称:“Claude 3 Opus在复杂任务上表现出接近人类水平的理解力和流畅性。

在多项指标上,Claude 3已经展现出接近或者优于GPT-4或是Gemini 1.0的性能。

raw-image

Anthropic还列举了Claude 3的多个优点。

●近乎即时的结果。Claude 3模型可以支持实时客户聊天、自动完成和数据提取任务。其中,Haiku是智能类别市场上速度最快且最具成本效益的型号。它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文。

●强大的“视觉能力”。Claude 3可以处理各种视觉格式,包括照片、图表、图形和技术图表。

Claude 3

Claude 3

●更少的“拒绝”。与前几代模型相比,Claude 3模型对请求表现出更细致的理解,拒绝回答的频率要少得多。

Claude 3模型

Claude 3模型

●长上下文。Claude 3系列在发布时最初将提供200K上下文窗口。不过,所有三种模型都能够接受超过100万个tokens的输入,这些可能会提供给需要增强处理能力的精选客户。这意味着,Claude 3的长文本处理能力已经远胜ChatGPT,并与谷歌最新的GenAI模型——Gemini 1.5 Pro相当,后者也提供了高达100万个tokens的上下文窗口。

除此之外,Claude 3还有准确性更高、更强的“回忆”能力等优异性能。Anthropic称,Sonnet和Opus已从周一起在159个国家/地区推出,而Haiku也将很快推出。

值得注意的是,与谷歌的Gemini不同,Anthropic的Claude 3并不具备生成图像的能力,它只允许用户上传图像和其他文档进行分析。一方面,Anthropic表示,目前市场上此类需求已经大幅减少,客户也没有要求这样的功能。另一方面,这也在一定程度上减少了Claude 3陷入由自动生成内容引发的风险和争议,近期谷歌就卷进了相关舆论风波中。

公开资料显示,Anthropic创立于2021年,由OpenAI前高层Daniela Amodei和Dario Amodei创立。当前,Anthropic也是一家炙手可热的AI初创企业。在过去的一年时间里,Anthropic就完成了五笔不同的融资交易,总额约为73亿美元。在其投资者中,不乏谷歌、亚马逊等大型科技企业的身影。

Claude

Claude

 

#AI##谷歌##OpenAI#

1會員
75內容數
留言0
查看全部
發表第一個留言支持創作者!