FID（Fréchet Inception Distance）

iPAS AI應用規劃師學習筆記

發佈於生成式AI技術與應用

2025/08/18 更新2025/08/18 發佈閱讀 2 分鐘

FID（Fréchet Inception Distance）是一種用來評估生成式模型（如GAN或擴散模型）所產生圖像品質的指標。其核心目標是比較生成圖像與真實圖像的分布差異，以量化生成圖像的真實性和多樣性。

FID 的工作原理

• 使用預訓練的 Inception-v3 網路提取生成圖像和真實圖像的高維特徵向量（通常取最後池化層的2048維特徵）。

• 假設這兩組特徵符合多維高斯分布，計算兩個高斯分布的均值和協方差矩陣。

• 利用 Fréchet 距離（或稱 Wasserstein-2 距離）衡量這兩個分布間的差距。

• FID 值越小代表生成圖像的質量和多樣性越接近真實圖像，分數為 0 表示完美匹配。

FID的優點與應用

• 比較整體分布而不是單張圖片，能有效捕捉圖像質量和樣本多樣性。

• 是目前生成式模型（如 StyleGAN、Stable Diffusion）評估的標準指標之一。

• 能對模糊、噪聲等圖像質量下降敏感。

限制和改進

• FID 假設特徵服從高斯分布，可能影響精準度。

• 需要大量圖像樣本才能穩定估計。

• 研究者提出使用CLIP特徵或其他指標來改進評估準確性。

總結：

FID 是一種基於深度特徵分布差異衡量生成圖像質量的指標，數值越小代表生成結果越真實和多樣化，是現今圖像生成模型效果最重要的量化評估工具。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記生成式AI技術與應用

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

25會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/08/18

Positional Encoding

Positional Encoding 是深度學習中 Transformer 模型用來表示序列中各個元素（例如詞語）位置的技術。由於 Transformer 自身的自注意力機制（self-attention）在處理序列時會把輸入視為一個集合，缺乏對元素順序的內建感知，因此需要注入位置信息讓模型能理解

2025/08/18

Positional Encoding

2025/08/18

AI alignment

AI alignment（人工智慧對齊）是一個研究領域，目標是確保人工智慧系統的行為和結果符合人類的意圖、價值觀和目標。換句話說，就是讓 AI 的行動方向與人類設計者或使用者真正想要達成的目標保持一致，避免 AI 產生不符合預期甚至危害性的行為。為什麼 AI alignment 重要？ •

2025/08/18

AI alignment

2025/08/18

Instruction fine-tuning

Instruction fine-tuning 是指對預訓練模型（例如 Stable Diffusion）進行微調，使模型能更好地理解並執行用戶的「指令」（instruction），即根據特定的描述或操作說明來生成對應的結果。具體解釋： • 傳統微調會針對特定任務或數據進行調整，但指令微調則

2025/08/18

Instruction fine-tuning

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15