Anthropic推出Claude 3新模型系列,優於同行在多項評估基準上表現

更新於 發佈於 閱讀時間約 3 分鐘

AI圈新出了一匹“黑马”。

当地时间3月4日,人工智能初创企业Anthropic宣布推出Claude 3大模型系列。该系列包括三个型号,按照性能从弱到强分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

Claude 3

Claude 3

据官方介绍,其中最智能的模型Claude 3 Opus在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学 (GSM8K) 等。官方称:“Claude 3 Opus在复杂任务上表现出接近人类水平的理解力和流畅性。

在多项指标上,Claude 3已经展现出接近或者优于GPT-4或是Gemini 1.0的性能。

raw-image

Anthropic还列举了Claude 3的多个优点。

●近乎即时的结果。Claude 3模型可以支持实时客户聊天、自动完成和数据提取任务。其中,Haiku是智能类别市场上速度最快且最具成本效益的型号。它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文。

●强大的“视觉能力”。Claude 3可以处理各种视觉格式,包括照片、图表、图形和技术图表。

Claude 3

Claude 3

●更少的“拒绝”。与前几代模型相比,Claude 3模型对请求表现出更细致的理解,拒绝回答的频率要少得多。

Claude 3模型

Claude 3模型

●长上下文。Claude 3系列在发布时最初将提供200K上下文窗口。不过,所有三种模型都能够接受超过100万个tokens的输入,这些可能会提供给需要增强处理能力的精选客户。这意味着,Claude 3的长文本处理能力已经远胜ChatGPT,并与谷歌最新的GenAI模型——Gemini 1.5 Pro相当,后者也提供了高达100万个tokens的上下文窗口。

除此之外,Claude 3还有准确性更高、更强的“回忆”能力等优异性能。Anthropic称,Sonnet和Opus已从周一起在159个国家/地区推出,而Haiku也将很快推出。

值得注意的是,与谷歌的Gemini不同,Anthropic的Claude 3并不具备生成图像的能力,它只允许用户上传图像和其他文档进行分析。一方面,Anthropic表示,目前市场上此类需求已经大幅减少,客户也没有要求这样的功能。另一方面,这也在一定程度上减少了Claude 3陷入由自动生成内容引发的风险和争议,近期谷歌就卷进了相关舆论风波中。

公开资料显示,Anthropic创立于2021年,由OpenAI前高层Daniela Amodei和Dario Amodei创立。当前,Anthropic也是一家炙手可热的AI初创企业。在过去的一年时间里,Anthropic就完成了五笔不同的融资交易,总额约为73亿美元。在其投资者中,不乏谷歌、亚马逊等大型科技企业的身影。

Claude

Claude

 

#AI##谷歌##OpenAI#

留言
avatar-img
留言分享你的想法!
avatar-img
TommyChueng的沙龍
1會員
198內容數
TommyChueng的沙龍的其他內容
2025/01/14
▍老虎证券简介 老虎国际成立于 2014 年,于 2019 年在美国纳斯达克上市(NASDAQ:TIGR),持有全球 70 多个金融牌照和资质,服务超过千万注册用户。 自成立以来,公司屡获殊荣,例如 2023 年获得新加坡最佳零售券商、澳大利亚杰出券商及新西兰最具性价比券商等荣誉。 作为一家综
Thumbnail
2025/01/14
▍老虎证券简介 老虎国际成立于 2014 年,于 2019 年在美国纳斯达克上市(NASDAQ:TIGR),持有全球 70 多个金融牌照和资质,服务超过千万注册用户。 自成立以来,公司屡获殊荣,例如 2023 年获得新加坡最佳零售券商、澳大利亚杰出券商及新西兰最具性价比券商等荣誉。 作为一家综
Thumbnail
2024/12/23
12月19日,美国当选总统特朗普表示,在联邦债务上限设立一个多世纪后,他将支持完全取消这一上限。长期以来,债务上限一直都是反对党的政治筹码,因为当政府无节制借款以威胁到债务安全时,后果将不堪设想。 而现在,美国联邦债务又即将逼近债务上限。可以预见的是,在未来一段时间内,关于联邦政府债务的讨论将反复
2024/12/23
12月19日,美国当选总统特朗普表示,在联邦债务上限设立一个多世纪后,他将支持完全取消这一上限。长期以来,债务上限一直都是反对党的政治筹码,因为当政府无节制借款以威胁到债务安全时,后果将不堪设想。 而现在,美国联邦债务又即将逼近债务上限。可以预见的是,在未来一段时间内,关于联邦政府债务的讨论将反复
2024/12/16
12月11日亚市,黄金在关键通胀数据前保持涨势。交易员认为,若美国通胀数据符合预期,美联储将在下周举行的今年最后一场会议上降息,黄金保持了连续三天的上涨。 分析师预计,11月份美国消费者物价指数(CPI)将上涨0.3%,同比涨幅分别为2.7%和3.3%。预计美国11月整体和核心生产者物价环比涨幅均
2024/12/16
12月11日亚市,黄金在关键通胀数据前保持涨势。交易员认为,若美国通胀数据符合预期,美联储将在下周举行的今年最后一场会议上降息,黄金保持了连续三天的上涨。 分析师预计,11月份美国消费者物价指数(CPI)将上涨0.3%,同比涨幅分别为2.7%和3.3%。预计美国11月整体和核心生产者物价环比涨幅均
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
Anthropic 的經濟指數揭示了 AI 在各行各業中扮演的角色,以及它對職場的影響。這份指數顯示 AI 的應用更傾向於增強(augmentation)而非自動化(automation),尤其是在軟體開發和技術寫作等領域。這種 AI 使用情況對於了解 AI 與人類合作關係提供了寶貴的視角,同時也反
Thumbnail
Anthropic 的經濟指數揭示了 AI 在各行各業中扮演的角色,以及它對職場的影響。這份指數顯示 AI 的應用更傾向於增強(augmentation)而非自動化(automation),尤其是在軟體開發和技術寫作等領域。這種 AI 使用情況對於了解 AI 與人類合作關係提供了寶貴的視角,同時也反
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
Thumbnail
一個所有Agent領域開發者都應該關注的開源專案。模型上下文協定(Model Context Protocol,MCP)將成為連接AI代理和助理與資料所在系統(包括內容儲存庫、商業工具和開發環境)的新標準。
Thumbnail
AI雖然很厲害..但BUG也不少.... 也開一個系列吧. .#tengr #BUG
Thumbnail
AI雖然很厲害..但BUG也不少.... 也開一個系列吧. .#tengr #BUG
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News