当地时间4月9日,英特尔在Intel Vision 2024产业创新大会正式发布第三代AI加速器Gaudi 3,预计将在今年第二季度供给超微电脑(Supermicro)和慧与科技(Hewlett Packard Enterprise)等服务器制造商,第三季度全面上市。
介绍称,Gaudi 3旨在推动AIGC“从试验到应用”的过渡,其高性能、实用性、节能、可快速部署等优点,能够充分满足AI应用对于复杂度、成本效益以及合规性等需求。
英特尔CEO Pat Gelsinger表示,早期版本的Gaudi未能实现英特尔对于市场份额的期待,新版或可产生更大影响,并直接将Gaudi 3与英伟达H100、H200对标,但并未公布具体价格。
据了解,Gaudi 3与Gaudi 2基本相似,但在架构、平台等多个方面进行了改进,AI计算性能已达前代产品的2-4倍。
具体来看,Gaudi 3采用了台积电5nm制程工艺,支持128GB HBMe2内存。相比上代产品,英特尔Gaudi 3带来了高达4倍的BF16 AI计算能力提升,1.5倍的内存带宽以及2倍的网络带宽提升。
性能上,该芯片旨在提高两个关键领域的性能:训练人工智能系统、运行成品软件。
目前,Gaudi 3已在Llama上进行测试,可用于帮助训练或部署AI大模型,包括Stable Diffusion和OpenAI的Whisper语音识别模型。
在AI模型算力中,与英伟达主力H100相比,Gaudi 3在Llama 2模型上的推理能力平均提高了50%,能效平均提高了40%,AI模型的运行速度是其1.5倍,而成本仅为H100的一小部分。而相比于英伟达最新款H200,Gaudi 3的推理速度也提升了约30%。
过去一年,英伟达凭借其GPU在AI芯片市场上占据了约80%的市场份额,其产品被AI企业视为首选的高端芯片。今年3月,该公司在其GTC大会上推出了H100的“接班人”——B200和GB200。
直至如今,英伟达依旧是目前AI芯片市场的领军者。不过,随着云服务提供商和企业建立基础设施部署AI软件,越来越多的竞争对手将挤进该市场。而且,越来越多的公司正在寻找成本更低的供应商,英伟达并非不可撼动。
此次Gaudi 3加入后,市场就呈现出英伟达B200、AMD MI300、英特尔Gaudi 3“三足鼎立”的竞争格局。
英特尔云和企业解决方案事业部副总裁兼高级首席工程师Das Kamhout在电话会议上声称:“我们预计Gaudi 3能够与英伟达最新芯片一较高下。从极具竞争力的价格,独特的开放式集成芯片网络,符合行业标准的以太网等方面来看,它无疑是一款强大的产品。”
不能忽略的是,英伟达的成功离不开它的CUDA生态,AI业内人士可以在该生态中访问GPU中的所有硬件功能。对此,英特尔也制定了开放式可扩展AI系统的战略,为企业提供解决方案,满足其特定的AIGC需求。
该公司与各行业的企业客户和合作伙伴分享了英特尔Gaudi加速器解决方案,为AIGC的创新型应用铺平了道路:NAVER、博世、IBM、Seekr、Landing AI、Roboflow和Infosys等多家企业与英特尔达成合作关系,在AI应用过程中实现了“双赢”。
另外,英特尔还与 Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick 和 Zilliz 合作,开发非专有的开放软件,通过RAG(检索增强生成)技术,最大程度上提升AI应用部署的便利性,使企业在标准云基础设施上运行的大量现有专有数据源能够通过开放的大模型功能得到增强。
英特尔网络集团高级副总裁Sachin Katti称:“我们正与软件生态系统合作,开发开源软件和模块,使用户能够将所需解决方案整合在一起,而不必重新购买解决方案。