Fréchet Inception Distance(FID)是一種用於評估生成模型(特別是生成對抗網絡GAN)生成圖像質量和多樣性的指標。它通過比較生成圖像和真實圖像在深度特徵空間(通常使用Inception v3模型的中間層激活)中的分佈差異,衡量兩者之間的相似度。
FID 的特點與優勢:
• 衡量真實感:量化生成圖像與真實圖像的差異,分數越低,兩者越相似。• 考慮多樣性與質量:同時反映生成圖像的多樣性和逼真度。
• 克服Inception Score限制:FID 不僅評估生成圖像分佈,還考慮與真實圖像分佈的差異,更全面。
• 廣泛應用:成為評估GAN及其他生成模型效果的標準指標。
限制:
• 對樣本數量和質量敏感,樣本不足時不穩定。
• 雖然適合圖像評估,但對其他模態如文字或音頻的評估能力有限。
簡單比喻:
FID 就像比較兩幅畫裡圖案和色彩的整體風格差異,不是只看一兩處細節,而是評估全局的相似程度。
總結:
Fréchet Inception Distance(FID)通過比較生成圖像與真實圖像在深度特徵空間的統計分布差異,成為衡量生成模型圖像質量和多樣性的關鍵指標,分數越低表示生成結果越接近真實。Fréchet Inception Distance(FID)是一種評估生成模型(如GAN)生成圖像質量和多樣性的指標。FID 通過比較生成圖像和真實圖像在預訓練的 Inception v3 模型中某一中間層激活特徵的統計分布差異來衡量兩者的相似性。
具體來說,FID 將真實圖像和生成圖像的特徵分布視為兩個多維高斯分布,分別計算它們的均值和協方差矩陣。然後通過計算這兩個高斯分布之間的 Fréchet 距離(也稱為 Wasserstein-2 距離)來衡量差異。
FID 分數越低,表示生成圖像與真實圖像的分布越相似,質量越高。FID 同時衡量圖像的真實感和多樣性,被廣泛認為是評估生成圖像效果的標準指標之一。
簡單比喻:FID 就像衡量兩組畫作在整體風格和細節上的相似度,不僅看每幅畫,還看整體分布。
總結:
Fréchet Inception Distance 是評估生成模型圖像真實性和多樣性的關鍵指標,通過比較生成與真實圖像特徵分布差異來量化畫像質量,分數越低越佳。