AI”后浪“强势登场:谷歌发布全球最强开源大模型Gemma

更新於 2024/02/22閱讀時間約 4 分鐘

当地时间2月21日,谷歌发布号称“全球性能最强大、轻量级”的新一代开源系列模型Gemma,平均性能远超Llama 13B,一举夺下当今的开源大模型霸主的宝座。

由此,在其多模态大模型Gemini与OpenAI在闭源领域激战正酣之时,谷歌终又以Gemma在开源领域向Meta宣战。


谷歌和Alphabet公司CEO Sundar Pichai表示:“Gemma展示了强大的性能,从今天开始,该模型将在全球范围内提供,并可在笔记本电脑、工作站或谷歌云上运行。” 

谷歌发布Gemma开源大模型

谷歌发布Gemma开源大模型

碾压主流模型 Gemma测试结果优异

参数规格:Gemini同源 多设备运行

官方介绍称,Gemma灵感源于Gemini,由谷歌DeepMind和其他团队合作开发。

不同于Gemini的“全家桶”路线,Gemma主打“轻量级”“高性能”特点,提供了2B(20亿)和7B(70亿)两种参数规格,每个规模又分为预训练和指令微调两个版本,满足了开发人员的不同需求。

该模型可在笔记本电脑、台式机、物联网、移动设备、云端等多个主流设备类型上运行。其中,7B版本用于在消费级GPU和TPU上高效部署和开发;2B版本则可直接在笔记本电脑上运行。

Gemma规格

Gemma规格

性能表现:同量级模型遭”吊打“

Gemma基于谷歌的开源模型和生态构建,包括Word2Vec、BERT、T5、T5X等。而得益于Gemini的共享技术和基础架构,Gemma在MMLU、MBPP等18个语言理解、推理、数学等关键基准测试中,有11个测试分数超越了Llama 2等更大参数的开源模型

值得一提的是,Gemma在数学、代码能力上的表现十分突出,位于Hugging Face开源大模型排行榜前列。

Gemma 2B排名

Gemma 2B排名

Gemma 7B排名

Gemma 7B排名

芯片配置:”自研+外援“的优化

据称,Gemma基于自研AI加速芯片TPU v5e训练,在文本领域实现了强大的通用能力,同时具备最先进的理解和推理技能。其中,7B使用了4096个TPU v5e,2B则使用了512个TPU v5e,数据主要来自网络文档、数学和代码的英语数据。

不仅如此,谷歌还宣布与英伟达合作,利用英伟达TensorRT-LLM加速Gemma的性能;另还可以使用英伟达GPU来优化Gemma模型;英伟达的RTX聊天系统也即将向Gemma开放入驻,更好地保障了用户的数据安全。

软件工具:配套齐全 开发人员友好

除模型本身外,谷歌还为开发者提供了一套名为Responsible Generative AI Toolkit的AI软件工具包,在安全分类、调试和指导三个方面,帮助开发人员和研究人员优先构建安全且负责任的AI应用程序:

Gemma软件工具包

Gemma软件工具包

  • 作为开放模型,全球的开发人员和研究人员可以通过Kaggle和Colab免费访问Gemma。
  • 可以通过Hugging Face Transformers等多个框架对Gemma进行推理和微调,让用户调查Gemma的行为并及时纠正问题。
  • Gemma既可以在PC和工作站上运行,也可以在Google Cloud上部署,还支持在Vertex AI和Google Kubernetes Engine(GKE)上的简易部署。首次使用Google Cloud的用户将获得300美元的云积分,研究人员则可申请最高50万美元的云积分。
  • 使用条款为所有组织提供了负责任的商业使用和分发权限,不受组织规模的限制。

夺魁并非终点 Gemma仍将独善其身

综上所述,Gemma似已成功在编码、数据处理、架构设计、指令优化、基于人类反馈的强化学习以及评估方法等方面,成为了Gemini的“爱徒”。

不过,尽管在标准测试任务上表现优异,但谷歌认为,还需对Gemma进行进一步的研究,以确保其信息的准确性、模型的目标对齐、处理复杂逻辑推理,并增强模型对恶意输入的抵抗力。

谷歌DeepMind产品管理总监Tris Warkentin认为,虽然Gemma已在6个安全基准及人类并行评估方面均优于竞争对手,但将继续采取与其潜在风险相当的评估和安全解决措施。

开源的Gemma,无疑将会吸引一众软件工程师在谷歌技术的基础上进行开发,增强云部门的盈利能力和专业能力。

谷歌Developer X和开发者关系副总裁兼总经理Jeanine Banks表示:“如果谷歌能够成为API和开放模型的唯一提供商,为社区提供最广泛的功能集,那就完美了。”

#谷歌Gemini##人工智能##开源##英伟达#

    avatar-img
    1會員
    196內容數
    留言0
    查看全部
    avatar-img
    發表第一個留言支持創作者!
    TommyChueng的沙龍 的其他內容
    近一年來,受到AI熱潮的推動,全球芯片巨頭英偉達的股價一路飆升。美國銀行研究分析師Vivek Arya警告稱,英偉達股價可能大幅回調,因為超出預期的潛力削弱了英偉達,使其很容易受到盈利後波動的影響。Arya認為股價回調可能是由過度看漲而非基本面驅動的。
    軟銀集團首席執行官孫正義正在籌集1,000億美元的資金,成立人工智能芯片企業以與英偉達展開競爭,希望在業務上能與Arm互補。該項目代號為“Izanagi”,旨在為全球AI發展提供核心芯片產品。此舉正標誌著軟銀投資的戰略轉移,集團未來將重點著眼於AI革命。
    阿里巴巴集團(下稱“阿里”)發佈截至2023年12月31日的2024財年第三季度業績報告,關鍵詞包括財報數據、營收增長、股票回購計劃、核心業務、阿里雲、AIDC、菜鳥集團、本地生活集團、大文娛集團、股份回購。
    張楠辭去抖音集團CEO一職,將專注於剪映業務。剪映是字節跳動的視頻剪輯軟件,面向抖音平臺用戶用於製作短視頻內容。文章探討了張楠的辭職原因,未來發展計劃,以及剪映軟件的最新動態。
    澳洲聯儲宣佈將政策利率維持在12年高點4.35%不變。澳洲聯儲還發布了對未來經濟前景的預測,強調通脹迴歸目標是當務之急。本文涉及澳洲聯儲、利率決議、通貨膨脹等內容。
    近一年來,受到AI熱潮的推動,全球芯片巨頭英偉達的股價一路飆升。美國銀行研究分析師Vivek Arya警告稱,英偉達股價可能大幅回調,因為超出預期的潛力削弱了英偉達,使其很容易受到盈利後波動的影響。Arya認為股價回調可能是由過度看漲而非基本面驅動的。
    軟銀集團首席執行官孫正義正在籌集1,000億美元的資金,成立人工智能芯片企業以與英偉達展開競爭,希望在業務上能與Arm互補。該項目代號為“Izanagi”,旨在為全球AI發展提供核心芯片產品。此舉正標誌著軟銀投資的戰略轉移,集團未來將重點著眼於AI革命。
    阿里巴巴集團(下稱“阿里”)發佈截至2023年12月31日的2024財年第三季度業績報告,關鍵詞包括財報數據、營收增長、股票回購計劃、核心業務、阿里雲、AIDC、菜鳥集團、本地生活集團、大文娛集團、股份回購。
    張楠辭去抖音集團CEO一職,將專注於剪映業務。剪映是字節跳動的視頻剪輯軟件,面向抖音平臺用戶用於製作短視頻內容。文章探討了張楠的辭職原因,未來發展計劃,以及剪映軟件的最新動態。
    澳洲聯儲宣佈將政策利率維持在12年高點4.35%不變。澳洲聯儲還發布了對未來經濟前景的預測,強調通脹迴歸目標是當務之急。本文涉及澳洲聯儲、利率決議、通貨膨脹等內容。
    你可能也想看
    Google News 追蹤
    Thumbnail
    *合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
    Thumbnail
    AI交易的定義: AI交易是指使用人工智慧、預測分析和機器學習來分析歷史數據和外匯、股票數據斗、獲取投資理念、建立投資組合並自動買賣股票或外匯的過程。 AI交易可以利用計算能力來執行模仿人類邏輯和專業知識的任務,並在高度先進的水準上進行。 不同的AI交易系統或軟體可能會使用不同的策略、算法和技
    Thumbnail
    AI股當沖熱度不減,緯創分盤交易降溫 今天要跟大家分享一下最近台股的熱門話題:AI股。AI股是指與人工智慧相關的產業或公司,包括伺服器、雲端運算、晶片、模組等等。近期因為外資看好台灣的AI供應鏈,以及蘇姿丰將來台訪問的消息,引發了市場對AI股的熱烈追捧,尤其是緯創、光寶科、英業達、廣達、仁
    Thumbnail
    在這個數據驅動的時代,人工智能(AI)已經成為我們生活中的一部分,從自動駕駛汽車到智能家居系統,它的應用無所不在。然而,你可能不知道的是,它也正在改變我們的投資方式。
    Thumbnail
    近幾個月來,第三代半導體產業再度嶄露頭角,吸引了大量資金流入IC設計、伺服器和半導體設備類股......
    Thumbnail
    AI當道 先進封裝需求爆發 台廠受惠大 什麼是AI晶片和先進封裝? AI晶片是一種專門用於人工智慧(AI)應用的晶片,可以提供高效能的運算和記憶體傳輸能力。AI晶片通常需要搭配高頻寬記憶體(HBM),也就是一種可以提供高速數據傳輸的記憶體。 先進封裝是一種將多個晶片組合在一起的技術,可以減少晶片之間
    Thumbnail
    大家好,身為兩位孩子的爸爸,我是一位理工科出身的在職工程師,也是一位對經濟有興趣的財經素人,今天要分享投資人必須要知在AI 浪潮背後,大資金背後的故事與博弈。 首先還是要澄清,我當然深信不疑人工智能(AI)的進展是無可逆轉的,如大浪淘沙般不斷塑造著夢想的將來,是一種長期趨勢,是無可阻擋的;然而,當我
    Thumbnail
    台股利多匯聚,指數先攻萬七在望。輝達公布優於預期的展望,帶動台美科技股蝴蝶效應。 瑞銀證券重申台股「加碼」投資評等,尤其樂觀情境直逼「萬九」。白宮與共和黨就提高美國債務上限,達成初步協議。輝達公布2024會計年度第一季財報,超出市場預估。 外資調升輝達目標價,籌碼湧入使輝達股價短短兩個交易日飆漲約3
    Thumbnail
    Hi 我是安娜媽咪,最近AI、GPU、CPU相關議題不斷,相關類股的新聞非常多,先是OpenAI開發的聊天機器人Chatgpt、谷歌(Google)開發的聊天機器人Bard、微軟與超微的世紀大合作、蘋果與高盛的合作、蘋果新品發表,特斯拉Q1交車輛創新高甚至是這一兩天焦點,NV公布超亮眼的財報等,
    Thumbnail
    AI技術的發展為人們的生產和生活帶來了巨大的變革,從智能家居、智能醫療、自動駕駛等,現在AI已經漸漸地出現在你的生活中,如果未來AI會更盛行的,我們可以從中找到甚麼投資機會 那以下就要稍微介紹一下AI,但因為菜鳥也是自己去爬文,去找資料,不是相關的專業人士,所以僅供參考就好了,那AI也有蠻多法規跟倫
    Thumbnail
    墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市
    Thumbnail
    *合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
    Thumbnail
    AI交易的定義: AI交易是指使用人工智慧、預測分析和機器學習來分析歷史數據和外匯、股票數據斗、獲取投資理念、建立投資組合並自動買賣股票或外匯的過程。 AI交易可以利用計算能力來執行模仿人類邏輯和專業知識的任務,並在高度先進的水準上進行。 不同的AI交易系統或軟體可能會使用不同的策略、算法和技
    Thumbnail
    AI股當沖熱度不減,緯創分盤交易降溫 今天要跟大家分享一下最近台股的熱門話題:AI股。AI股是指與人工智慧相關的產業或公司,包括伺服器、雲端運算、晶片、模組等等。近期因為外資看好台灣的AI供應鏈,以及蘇姿丰將來台訪問的消息,引發了市場對AI股的熱烈追捧,尤其是緯創、光寶科、英業達、廣達、仁
    Thumbnail
    在這個數據驅動的時代,人工智能(AI)已經成為我們生活中的一部分,從自動駕駛汽車到智能家居系統,它的應用無所不在。然而,你可能不知道的是,它也正在改變我們的投資方式。
    Thumbnail
    近幾個月來,第三代半導體產業再度嶄露頭角,吸引了大量資金流入IC設計、伺服器和半導體設備類股......
    Thumbnail
    AI當道 先進封裝需求爆發 台廠受惠大 什麼是AI晶片和先進封裝? AI晶片是一種專門用於人工智慧(AI)應用的晶片,可以提供高效能的運算和記憶體傳輸能力。AI晶片通常需要搭配高頻寬記憶體(HBM),也就是一種可以提供高速數據傳輸的記憶體。 先進封裝是一種將多個晶片組合在一起的技術,可以減少晶片之間
    Thumbnail
    大家好,身為兩位孩子的爸爸,我是一位理工科出身的在職工程師,也是一位對經濟有興趣的財經素人,今天要分享投資人必須要知在AI 浪潮背後,大資金背後的故事與博弈。 首先還是要澄清,我當然深信不疑人工智能(AI)的進展是無可逆轉的,如大浪淘沙般不斷塑造著夢想的將來,是一種長期趨勢,是無可阻擋的;然而,當我
    Thumbnail
    台股利多匯聚,指數先攻萬七在望。輝達公布優於預期的展望,帶動台美科技股蝴蝶效應。 瑞銀證券重申台股「加碼」投資評等,尤其樂觀情境直逼「萬九」。白宮與共和黨就提高美國債務上限,達成初步協議。輝達公布2024會計年度第一季財報,超出市場預估。 外資調升輝達目標價,籌碼湧入使輝達股價短短兩個交易日飆漲約3
    Thumbnail
    Hi 我是安娜媽咪,最近AI、GPU、CPU相關議題不斷,相關類股的新聞非常多,先是OpenAI開發的聊天機器人Chatgpt、谷歌(Google)開發的聊天機器人Bard、微軟與超微的世紀大合作、蘋果與高盛的合作、蘋果新品發表,特斯拉Q1交車輛創新高甚至是這一兩天焦點,NV公布超亮眼的財報等,
    Thumbnail
    AI技術的發展為人們的生產和生活帶來了巨大的變革,從智能家居、智能醫療、自動駕駛等,現在AI已經漸漸地出現在你的生活中,如果未來AI會更盛行的,我們可以從中找到甚麼投資機會 那以下就要稍微介紹一下AI,但因為菜鳥也是自己去爬文,去找資料,不是相關的專業人士,所以僅供參考就好了,那AI也有蠻多法規跟倫
    Thumbnail
    墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市