Google 發表新 AI 模型 Gemini 1.5,提供更大的「腦容量」和效率

更新於 2024/02/17閱讀時間約 3 分鐘

今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大的「腦容量」。

支援高達 100 萬 token,可以進行更複雜的任務

Gemini 1.5 和前一代同樣是屬於多模態的 AI 模型,今天發布 Gemini 1.5 Pro 在 Google 的定義是屬於中型 AI 模型,但它的能力已與 Gemini 1.0 Ultra 相當。最大的突破是一口氣將模型可以處理的資訊量提升到 1,000,000 個 token,這是目前所有 AI 語言模型中最大規模的容納量。

你可以將單次能處理的 token 數當作是 AI 的「大腦容量」,能處理的 token 越多,表示 AI 越不會忘記之前的對話。而 Gemini 1.5 高達 100 萬的單次 token 處理量,相當於可以處理 1 小時影片、11 小時聲音,或者超過 30 萬行的程式碼。

Google 發表下一代 AI 語言模型 Gemini 1.5,支援高達 100 萬 token

Google 發表下一代 AI 語言模型 Gemini 1.5,支援高達 100 萬 token

Google 也對 Gemini 1.5 進行許多實際測試,並製作成以下影片。

對大量訊息進行複雜推理

將阿波羅 11 號登月任務的 402 頁紀錄丟給 Gemini 1.5 Pro 處理,它可以推理文檔中的對話、事件和細節。另外在測試中也可以看到 Gemini 1.5 Pro 可以同時從圖片和文字間找出邏輯上的關聯,並做出回應。


更棒的跨模態推理

除了理解文字外,Gemini 1.5 Pro 也可以理解影片內的每個畫面。例如這個範例要求「找出從人的口袋取出一張紙的那一刻」,如果是透過人眼來看,至少也要花個幾十分鐘,但 Gemini 1.5 Pro 只花了不到 1 分鐘的時間就將這個畫面出現的時間點找了出來。


支援更長的程式碼區塊,解決複雜問題

寫程式時搭配一些 Lib 會讓系統更加龐大,但 Gemini 1.5 Pro 能一次吃下 100 萬個 token,因此對於解決更複雜的程式開發問題也有很大的改進。


效率

在同時搭配文字、程式碼、圖形、聲音、影片進行評估時,Gemini 1.5 Pro 在大型語言模型測試基準中有 87% 表現優於前一代的 Gemini 1.0 Pro;在星相同的測試基準中,效能甚至已經和 Gemini 1.0 Ultra 不相上下,也就意味著 Gemini 1.5 Pro 可以使用更少的資源得到同等的結果,更有機會在不同的運行環境下使用。

另外 Gemini 1.5 Pro 也展開了「情境學習」技能,在不需要微調的狀況下 AI 模型就能自行推理。這個試驗使用了 MTOB 基準測試,將英文翻譯成網路上少見的卡拉曼語 (Kalamang),它的學習程度和學習相同內容的人相當。

為了提高模型訓練效率,Google 也使用了新的專家混合 (MoE) 訓練架構,讓 Gemini 1.5 可以更快速的學習複雜的任務,同時也能保持訓練品質。

歡迎到《硬是要學》AI 專欄,瀏覽更多 AI 科技發展趨勢文章
avatar-img
1會員
4內容數
Hi 我是手哥!專研 3C 手機、家電,以及各種科技、AI、商務應用
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
手哥科科 的其他內容
Google 近來宣佈在即將推出的 Chrome M121 版本中導入 3 個 AI 功能,包括整理分頁、建立個人主題和幫你寫,將增進使用者的瀏覽體驗。本文介紹這些新功能以及自 Google 推出 Gemini AI 模型後,AI 功能擴展至不同產品的趨勢。
Google 近來宣佈在即將推出的 Chrome M121 版本中導入 3 個 AI 功能,包括整理分頁、建立個人主題和幫你寫,將增進使用者的瀏覽體驗。本文介紹這些新功能以及自 Google 推出 Gemini AI 模型後,AI 功能擴展至不同產品的趨勢。
你可能也想看
Google News 追蹤
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
工作時常會需要固定發廣告信,或業務開發信的話,可以考慮用google app script,呼叫gmail 的方式來處理。
Thumbnail
Golang(Go)是由Google開發的一種開源的、靜態型別的編程語言,目的在提供一個簡單、高效、安全以及易於擴展的程式語言,特別適用於並發和平行處理,Go語言設計上著重於開發者的生產力,並提供了現代化的語法和豐富的標準庫。 強調簡單易讀,讓我們回歸原始以最簡易的方式來撰寫程式,併發的特性讓日趨
Thumbnail
你好,我是股市鴿~ Google與聯發科合作開發AI伺服器晶片 Google是全球最大的網路搜尋引擎,也是人工智慧(AI)的領導者之一。Google多項服務都與AI有關,例如語音助理、翻譯、地圖、雲端運算等。為了提升AI的運算效能和效率,Google自行開發了專用於深度學習的處理器晶片,稱為張量處理
Thumbnail
《靜下來工作:一位禪師與Google團隊共同開發的七項覺知練習Seven Practices of a Mindful Leader》 📖書摘介紹:   本書每一章節都有許多習題、嘗試和活動,幫助你將正念導入日常生活。每一種修練皆相輔相成,前面的四項正念修練著重於探索內在、自我覺知;接下來的兩項正
Thumbnail
  同時,Facebook 於 2014 年宣布收購 Oculus,以加速 Oculus 在遊戲、通信和新社交體驗方面的增長。
Thumbnail
從Material Design發表至今,Google的設計語言已經7歲了!然而,隨著生活環境的改變,人們的需求也從實用層面轉變到情感價值。因此,Google在2021年5月的開發者大會中推出最新的設計語言Material You,並特別強調其「個人化」使用者體驗。
Thumbnail
如果是拍照上傳手寫作業,教師端在批改時常要反覆下載、上傳,面對一大堆照片,特別混亂。這邊推薦一個Chrom的擴充功能,能夠讓老師們在雲端硬碟上「直接編輯圖檔」,並且「覆蓋儲存到原檔上」,不會另外生出一堆檔案!
Thumbnail
2016年Google發布在組織內進行了五年的一項研究「亞里斯多德計畫」的結論,計畫內容是「找出具有高績效團隊的成功因素」,為了探討組織內造成績效好壞的差異處到底是什麼?針對200組內部團隊進行訪談,他們發現真正的答案就是心理安全感。你的組織裡有「心理安全感」的文化嗎?該如何建立與維持?讓本書告訴你
Thumbnail
Google 官方今日發布了一支影片,說明了近期Google 搜尋的發展近況。影片中很大部分與BERT 有關,BERT 厲害的地方是語意分析,能分析網頁是一篇食譜文章,還是一篇食記,另外搭配分析使用者前後的關鍵字來判斷搜尋意圖,來改善搜尋結果。
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
工作時常會需要固定發廣告信,或業務開發信的話,可以考慮用google app script,呼叫gmail 的方式來處理。
Thumbnail
Golang(Go)是由Google開發的一種開源的、靜態型別的編程語言,目的在提供一個簡單、高效、安全以及易於擴展的程式語言,特別適用於並發和平行處理,Go語言設計上著重於開發者的生產力,並提供了現代化的語法和豐富的標準庫。 強調簡單易讀,讓我們回歸原始以最簡易的方式來撰寫程式,併發的特性讓日趨
Thumbnail
你好,我是股市鴿~ Google與聯發科合作開發AI伺服器晶片 Google是全球最大的網路搜尋引擎,也是人工智慧(AI)的領導者之一。Google多項服務都與AI有關,例如語音助理、翻譯、地圖、雲端運算等。為了提升AI的運算效能和效率,Google自行開發了專用於深度學習的處理器晶片,稱為張量處理
Thumbnail
《靜下來工作:一位禪師與Google團隊共同開發的七項覺知練習Seven Practices of a Mindful Leader》 📖書摘介紹:   本書每一章節都有許多習題、嘗試和活動,幫助你將正念導入日常生活。每一種修練皆相輔相成,前面的四項正念修練著重於探索內在、自我覺知;接下來的兩項正
Thumbnail
  同時,Facebook 於 2014 年宣布收購 Oculus,以加速 Oculus 在遊戲、通信和新社交體驗方面的增長。
Thumbnail
從Material Design發表至今,Google的設計語言已經7歲了!然而,隨著生活環境的改變,人們的需求也從實用層面轉變到情感價值。因此,Google在2021年5月的開發者大會中推出最新的設計語言Material You,並特別強調其「個人化」使用者體驗。
Thumbnail
如果是拍照上傳手寫作業,教師端在批改時常要反覆下載、上傳,面對一大堆照片,特別混亂。這邊推薦一個Chrom的擴充功能,能夠讓老師們在雲端硬碟上「直接編輯圖檔」,並且「覆蓋儲存到原檔上」,不會另外生出一堆檔案!
Thumbnail
2016年Google發布在組織內進行了五年的一項研究「亞里斯多德計畫」的結論,計畫內容是「找出具有高績效團隊的成功因素」,為了探討組織內造成績效好壞的差異處到底是什麼?針對200組內部團隊進行訪談,他們發現真正的答案就是心理安全感。你的組織裡有「心理安全感」的文化嗎?該如何建立與維持?讓本書告訴你
Thumbnail
Google 官方今日發布了一支影片,說明了近期Google 搜尋的發展近況。影片中很大部分與BERT 有關,BERT 厲害的地方是語意分析,能分析網頁是一篇食譜文章,還是一篇食記,另外搭配分析使用者前後的關鍵字來判斷搜尋意圖,來改善搜尋結果。