AI 訓練浮點數格式解析

JH Young

發佈於滴咕雞

2026/03/02 更新2026/03/02 發佈閱讀 3 分鐘

AI 在訓練時，**浮點數格式（Floating Point Format）**決定了：

權重（weights）如何儲存
梯度（gradients）如何計算
訓練速度
VRAM 需求
數值穩定性

這其實是你之前問「怎樣算 VRAM」的核心之一。

一、為什麼 AI 訓練需要浮點數？

神經網路本質是：

所有：

權重 W
偏置 b
梯度
activation

都是連續實數

電腦只能用浮點數表示。

二、IEEE 754 浮點數結構

FP32（單精度）

結構：

精度：約 7 位有效數字

FP16（半精度）

結構：

精度：約 3–4 位有效數字

三、AI 訓練常見數值格式

四、BF16 為什麼重要？

BF16 結構：

👉 重點：Exponent 和 FP32 一樣大

這代表：

數值範圍接近 FP32
不容易梯度爆炸
非常適合 Transformer

所以現在：

NVIDIA H100/B200 主打 BF16
Google TPU 也主推 BF16

五、為什麼不能全用 FP16？

問題：梯度 underflow

當梯度太小：

FP16 表示不出來 → 直接變 0

結果：

模型不學習
Loss 卡死

所以現代做法是：

六、混合精度訓練（Mixed Precision）

流程：

權重用 FP16 / BF16
反向傳播用 FP32 master copy
使用 Loss Scaling

這樣可以：

VRAM 減半
訓練速度 ×2
幾乎不掉精度

七、VRAM 佔用怎麼算？

假設：

7B 模型
FP32

FP16：

再加上：

梯度
optimizer states（通常 ×2）

實際訓練需求：

FP32 7B 可能需要 80–100GB VRAM

這就是為什麼：

RTX 4090 很難訓練 7B 全參數
H100 可以

八、FP8 是未來嗎？

FP8 常見格式：

E4M3
E5M2

優點：

VRAM 再減半
訓練更快

缺點：

數值不穩定
需要特製硬體（Transformer Engine）

九、給一個武俠式比喻 😄

FP32 = 重劍無鋒（穩）
FP16 = 輕劍快攻（快）
BF16 = 內力深厚（範圍大）
FP8 = 飛刀（危險但高效）

十、總結（工程角度）

AI 訓練核心其實是：

在「數值穩定」與「顯存成本」之間取得平衡

目前主流：

訓練 → BF16 + FP32 master
推理 → FP16 / FP8 / INT8

留言

sirius數字沙龍

7會員

190內容數

吃自助火鍋啦！不要客氣，想吃啥，請自行取用！

sirius數字沙龍的其他內容

2026/03/01

設計一個「武俠小說寫作」訓練資料格式

設計一套專門為武俠小說微調（LoRA）設計的資料格式，比如：唐玄宗開元年間絲路 / 祆教 / 波斯密使軋犖山（安祿山）華山派、公孫嫣宗教與權謀交織我們目標不是普通小說生成，而是： 🎯 訓練出「懂世界觀、會寫武功、能操控角色」的武俠模型

2026/03/01

設計一個「武俠小說寫作」訓練資料格式

2026/03/01

如何用家用 GPU 訓練自己的小模型？

在家用 GPU（例如 RTX 3060 / 4070 / 4090）是可以訓練「小型 LLM」的 —— 但要方法正確。我給你一個完整可執行流程圖。 🎯 先講現實 ❌ 你做不到的從零訓練 7B 模型用幾 TB 數據做 pretraining

2026/03/01

如何用家用 GPU 訓練自己的小模型？

2026/03/01

如何訓練LLM？

訓練一個 LLM（大型語言模型），本質上是讓一個巨大的 Transformer 神經網路，學會「預測下一個字」。我們分成完整流程 7 個階段來看。 🏗 整體流程總覽資料蒐集 → 清洗 → 分詞 → 建模 → 預訓練 → 對齊訓練 → 部署優化 ① 模型架構選擇（Transfor

2026/03/01

如何訓練LLM？

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14