Anthropic推出Claude 3新模型系列,優於同行在多項評估基準上表現

更新於 發佈於 閱讀時間約 3 分鐘

AI圈新出了一匹“黑马”。

当地时间3月4日,人工智能初创企业Anthropic宣布推出Claude 3大模型系列。该系列包括三个型号,按照性能从弱到强分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

Claude 3

Claude 3

据官方介绍,其中最智能的模型Claude 3 Opus在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学 (GSM8K) 等。官方称:“Claude 3 Opus在复杂任务上表现出接近人类水平的理解力和流畅性。

在多项指标上,Claude 3已经展现出接近或者优于GPT-4或是Gemini 1.0的性能。

raw-image

Anthropic还列举了Claude 3的多个优点。

●近乎即时的结果。Claude 3模型可以支持实时客户聊天、自动完成和数据提取任务。其中,Haiku是智能类别市场上速度最快且最具成本效益的型号。它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文。

●强大的“视觉能力”。Claude 3可以处理各种视觉格式,包括照片、图表、图形和技术图表。

Claude 3

Claude 3

●更少的“拒绝”。与前几代模型相比,Claude 3模型对请求表现出更细致的理解,拒绝回答的频率要少得多。

Claude 3模型

Claude 3模型

●长上下文。Claude 3系列在发布时最初将提供200K上下文窗口。不过,所有三种模型都能够接受超过100万个tokens的输入,这些可能会提供给需要增强处理能力的精选客户。这意味着,Claude 3的长文本处理能力已经远胜ChatGPT,并与谷歌最新的GenAI模型——Gemini 1.5 Pro相当,后者也提供了高达100万个tokens的上下文窗口。

除此之外,Claude 3还有准确性更高、更强的“回忆”能力等优异性能。Anthropic称,Sonnet和Opus已从周一起在159个国家/地区推出,而Haiku也将很快推出。

值得注意的是,与谷歌的Gemini不同,Anthropic的Claude 3并不具备生成图像的能力,它只允许用户上传图像和其他文档进行分析。一方面,Anthropic表示,目前市场上此类需求已经大幅减少,客户也没有要求这样的功能。另一方面,这也在一定程度上减少了Claude 3陷入由自动生成内容引发的风险和争议,近期谷歌就卷进了相关舆论风波中。

公开资料显示,Anthropic创立于2021年,由OpenAI前高层Daniela Amodei和Dario Amodei创立。当前,Anthropic也是一家炙手可热的AI初创企业。在过去的一年时间里,Anthropic就完成了五笔不同的融资交易,总额约为73亿美元。在其投资者中,不乏谷歌、亚马逊等大型科技企业的身影。

Claude

Claude

 

#AI##谷歌##OpenAI#

留言
avatar-img
留言分享你的想法!
avatar-img
TommyChueng的沙龍
1會員
198內容數
TommyChueng的沙龍的其他內容
2025/01/14
▍老虎证券简介 老虎国际成立于 2014 年,于 2019 年在美国纳斯达克上市(NASDAQ:TIGR),持有全球 70 多个金融牌照和资质,服务超过千万注册用户。 自成立以来,公司屡获殊荣,例如 2023 年获得新加坡最佳零售券商、澳大利亚杰出券商及新西兰最具性价比券商等荣誉。 作为一家综
Thumbnail
2025/01/14
▍老虎证券简介 老虎国际成立于 2014 年,于 2019 年在美国纳斯达克上市(NASDAQ:TIGR),持有全球 70 多个金融牌照和资质,服务超过千万注册用户。 自成立以来,公司屡获殊荣,例如 2023 年获得新加坡最佳零售券商、澳大利亚杰出券商及新西兰最具性价比券商等荣誉。 作为一家综
Thumbnail
2024/12/23
12月19日,美国当选总统特朗普表示,在联邦债务上限设立一个多世纪后,他将支持完全取消这一上限。长期以来,债务上限一直都是反对党的政治筹码,因为当政府无节制借款以威胁到债务安全时,后果将不堪设想。 而现在,美国联邦债务又即将逼近债务上限。可以预见的是,在未来一段时间内,关于联邦政府债务的讨论将反复
2024/12/23
12月19日,美国当选总统特朗普表示,在联邦债务上限设立一个多世纪后,他将支持完全取消这一上限。长期以来,债务上限一直都是反对党的政治筹码,因为当政府无节制借款以威胁到债务安全时,后果将不堪设想。 而现在,美国联邦债务又即将逼近债务上限。可以预见的是,在未来一段时间内,关于联邦政府债务的讨论将反复
2024/12/16
12月11日亚市,黄金在关键通胀数据前保持涨势。交易员认为,若美国通胀数据符合预期,美联储将在下周举行的今年最后一场会议上降息,黄金保持了连续三天的上涨。 分析师预计,11月份美国消费者物价指数(CPI)将上涨0.3%,同比涨幅分别为2.7%和3.3%。预计美国11月整体和核心生产者物价环比涨幅均
2024/12/16
12月11日亚市,黄金在关键通胀数据前保持涨势。交易员认为,若美国通胀数据符合预期,美联储将在下周举行的今年最后一场会议上降息,黄金保持了连续三天的上涨。 分析师预计,11月份美国消费者物价指数(CPI)将上涨0.3%,同比涨幅分别为2.7%和3.3%。预计美国11月整体和核心生产者物价环比涨幅均
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
Anthropic 的經濟指數揭示了 AI 在各行各業中扮演的角色,以及它對職場的影響。這份指數顯示 AI 的應用更傾向於增強(augmentation)而非自動化(automation),尤其是在軟體開發和技術寫作等領域。這種 AI 使用情況對於了解 AI 與人類合作關係提供了寶貴的視角,同時也反
Thumbnail
Anthropic 的經濟指數揭示了 AI 在各行各業中扮演的角色,以及它對職場的影響。這份指數顯示 AI 的應用更傾向於增強(augmentation)而非自動化(automation),尤其是在軟體開發和技術寫作等領域。這種 AI 使用情況對於了解 AI 與人類合作關係提供了寶貴的視角,同時也反
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
Thumbnail
AI雖然很厲害..但BUG也不少.... 也開一個系列吧. .#tengr #BUG
Thumbnail
AI雖然很厲害..但BUG也不少.... 也開一個系列吧. .#tengr #BUG
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News