AI說書 - 從0開始 - 405 | PaLM 特色

2025/05/08 更新2025/05/08 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

Google AI 的 Pathways Language Model（PaLM）擁有 5400 億個參數，並且是在稍早探討的 Pathways ML 系統上訓練的，PaLM 是在 6144 個 TPU v4 晶片上進行訓練的，Google 改進了 LLM 訓練過程中的許多方面，以下介紹其關鍵進展之一：

一個 Transformer 模塊是一個計算單元，其主要由一個注意力層、前饋神經網路（MLP）以及層正規化層構成，我們可以用以下方程來表示經典的 Transformer 模塊：y = x + MLP(LayerNorm(x + Attention(LayerNorm(x))))，這個概念的核心在於，MLP 包含了之前的子層和正規化，注意力子層緊隨嵌入輸入子層之後，而 MLP 則涵蓋了所有這些內容。

而 Google AI 團隊則以以下方式實踐 Transformer 模塊，以實現平行處理：y = x + MLP(LayerNorm(x)) + Attention(LayerNorm(x))。

Learn AI 不 BI三分鐘學AI (3)AI從0開始-十四章

留言

留言分享你的想法！

Learn AI 不 BI

240會員

885內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/05/07

AI說書 - 從0開始 - 404 | Pathways 特色

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Pathways 的創新可以用下圖表示：當中說明為：客戶端將程序提交給資源管理器並控制這些程序的執行，當客戶端將程序提交給資源管理器時，資源管理器會為客戶端分配

2025/05/07

AI說書 - 從0開始 - 404 | Pathways 特色

2025/05/06

AI說書 - 從0開始 - 403 | Pathways 特色

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 PaLM 和 PaLM2 是基於 Pathways 技術構建的，Pathways 是 Google 的一項技術，通過數據並行、模型並行和執行級別並行來提高訓練大型語言模

2025/05/06

AI說書 - 從0開始 - 403 | Pathways 特色

2025/05/05

AI說書 - 從0開始 - 402 | 第十四章涵蓋範圍

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。本章節將涵蓋以下主題： Pathways 架構 PaLM 架構 PaLM 2 架構 Google 的 Transformer 驅動的生成人工智慧助手 Gemi

2025/05/05

AI說書 - 從0開始 - 402 | 第十四章涵蓋範圍

#AI 的其他內容

《鴻海已經達標5月預期的估值，而2026年還有多少本益比想像價值?》

普普文創

【踏青漫步】剪刀石山 258公尺

林位青的沙龍

Google Stitch 生成 UI 介面設計，加速產品原型開發與協作

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15