Inception Score(IS)是一種用於評估生成式模型(特別是生成對抗網絡GAN)生成圖像質量和多樣性的指標。它利用一個預訓練的Inception v3圖像分類模型,對生成的圖像進行分類,評估圖像是否清晰且內容多樣。
Inception Score 的評估原理:
1. 圖像質量:對單張生成圖像,Inception模型應該給出明確且確信的分類結果(低熵),這代表圖像清晰且主題明確。2. 圖像多樣性:所有生成圖像的分類結果分布應該涵蓋多個類別,表現為高熵,代表生成結果多樣豐富。
計算方式(簡化):
• 利用Inception v3模型對生成圖像集合中每一圖像計算條件概率分布 。
• 計算整體類別概率 作為邊際分布。
• 利用KL散度衡量 與 的差異,反映圖像對特定標籤的確定性與整體多樣性。
• 對所有圖像取平均並取指數,得到最終Inception Score。
特點與限制:
• 範圍:無上限,分數越高表示圖片既清晰又多樣。
• 優勢:不需標註數據即可評估生成模型性能。
• 限制:無法直接評估生成圖片與真實圖片的相似度,對類別不平衡敏感,容易受到Inception模型本身的偏差影響。
• 補充指標:Fréchet Inception Distance(FID)常用以補充IS,對真實與生成分布進行比較。
簡單比喻:
Inception Score 就像請一位圖像專家(Inception模型)判斷一組畫作:他希望每幅畫都清晰具體(像貓、狗),且整體畫集涵蓋豐富多樣的主題(不同種動物)。
總結:
Inception Score 是評估生成式模型圖像清晰度與多樣性的量化指標,廣泛用於衡量GAN等模型的生成效果,是生成圖像質量衡量的重要工具。