《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 不再使用人眼評估,你訓練的GAN還OK嗎?

不再使用人眼評估,你訓練的GAN還OK嗎?

2018-08-27

生成對抗網絡(GAN)是當今最流行的圖像生成方法之一,但評估和比較 GAN 產生的圖像卻極具挑戰性。之前許多針對 GAN 合成圖像的研究都只用了主觀視覺評估,一些定量標準直到最近才開始出現。本文認為現有指標不足以評估 GAN 模型,因此引入了兩個基于圖像分類的指標——GAN-train 和 GAN-test,分別對應 GAN 的召回率(多樣性)和精確率(圖像質量)。研究者還基于這兩個指標評估了最近的 GAN 方法并證明了這些方法性能的顯著差異。上述評估指標表明,數據集復雜程度(從 CIFAR10 到 CIFAR100 再到 ImageNet)與 GAN 質量呈負相關關系。


生成對抗網絡(GAN)[19] 是由一對存在競爭關系的神經網絡——生成器判別器——組成的深度神經網絡架構。通過交替優化兩個目標函數訓練該模型,這樣可以讓生成器 G 學會產生與真實圖像類似的樣本,還能讓判別器 D 學會更好地甄別真假數據。這種范式潛力巨大,因為它可以學會生成任何數據分布。這種模型已經在一些計算機視覺問題上取得了一定成果,例如文本到圖像的轉換 [56] 和圖像到圖像的轉換 [24,59]、超分辨率 [31] 以及逼真的自然圖像生成 [25]。


自從提出了 GAN 模型后,近幾年間出現了許多變體,如以提升生成圖像質量為目的的 GAN 模型 [12,15,25,36] 和以穩定訓練過程為目的的 GAN 模型 [7,9,20,34,36,40,57]。通過調整附加信息(如類別標簽),GAN 還可以被修改為生成給定類別圖像的網絡 [16,35,37,41]。實現這一想法有許多方法:連結標簽 y 和生成器的輸入 z 或中間特征映射 [16,35],使用條件批歸一化 [37] 以及用輔助分類器增強鑒別器 [41]。隨著這些方法的提出,有一個問題就變得重要了起來:該如何評價和比較這些模型呢?


評估和比較 GAN,或者說評估和比較 GAN 產生的圖像,是一件極具挑戰性的事,部分原因是缺乏明確的、在可比較概率模型中常用的似然方法 [51]。因此,之前許多針對 GAN 合成的圖像的工作都只用了主觀視覺評估。如圖 1 所示,當前最佳 GAN 生成圖像的樣本 [36],用主觀評估方法無法精確評估圖像質量。近兩年的研究已經開始嘗試通過定量方法評估 GAN[22,25,32,46]。

微信圖片_20180827221204.jpg

圖 1:當前最佳 GAN 模型(如 SNGAN)[36] 生成逼真圖像,這些圖像難以用主觀評估法與真實圖像進行比較。我們的基于準確率的圖像分類新方法解決了這個問題,并展示了真實圖像和生成圖像間的顯著差異。


將 Inception 分數(IS)[46] 和 Fr′echet Inception 距離(FID)[22] 作為與生成圖像視覺質量相關的臨時指標。IS 通過計算圖像產生的 (logit) 響應和邊際分布(即在 ImageNet 上訓練出來的 Inception 網絡生成的全部圖像的平均響應)之間的 KL 散度衡量生成圖像的質量。換句話說,IS 無法與目標分布的樣本進行比較,僅可用于量化生成樣本的多樣性。FID 比較的是真實圖像和生成圖像間的 Inception 激活值(Inception 網絡中倒數第二層的響應)。但這樣的比較將真實圖像和生成圖像的激活值近似為高斯分布(參見等式(2)),計算其平均值和方差,但因為太過粗糙而無法捕捉其細節。這些評估方法都依賴于經過 ImageNet 預訓練的 Inception 網絡,這對其他數據集(如面部數據集和生物醫學成像數據集)來說遠不夠理想??偠灾琁S 和 FID 是評估訓練進展的有用指標,但它們無法評估真實世界中的任務。正如我們在第 5 節中討論的那樣,與我們的指標(以表 2 中的 SNGAN 和 WPGAN-GP(10M)為例)不同,這些指標不足以精確地區別出當前最佳的 GAN 模型。


還有一種評估方法是根據精確率和召回率計算生成樣本到真實數據流形間的距離 [32]。高精確率意味著生成樣本與數據流形很接近,而高召回率意味著生成器的輸出樣本很好地覆蓋了流形。這些指標還是很理想主義的,因為無法在流形未知的自然圖像數據上進行計算。實際上,[32] 中的評估方法也只能用在由灰度三角形組成的合成數據中。另一種用于比較 GAN 模型距離的是 SWD[25]。SWD 是真實圖像和生成圖像間的 Wasserstein-1 距離的估計值,它計算的是從圖像的 Laplacian 金字塔表征中提取的局部圖像之間的數據相似性。正如第 5 節所說,SWD 的信息量低于我們的評價指標。


我們在本文中提出了新的評價指標,是用 GAN-train 分數和 GAN-test 分數比較類條件的 GAN 架構。對于這兩種指標,我們都依賴神經網絡架構來進行圖像分類。為了計算 GAN-train,我們用 GAN 生成的圖像訓練了分類網絡,然后在由真實圖像組成的測試集上評估了其表現。直接地說,這度量了學習到的(生成圖像)分布和目標(真實圖像)分布間的差異??梢缘贸鼋Y論:如果學習用于區分針對不同類別的生成圖像特征的分類網絡可以對真實圖像進行正確分類,那么生成圖像與真實圖像相似。換句話說,GAN-train 類似于召回率度量,因為 GAN-train 表現好意味著生成的樣本足夠多樣化。但是,GAN-train 也需要足夠的精確率,否則分類器會受到樣本質量的影響。


我們的第二個指標,GAN-test,是在真實圖像上訓練并在生成圖像上評估得到的網絡的準確率。該指標與精確率類似,值比較高意味著生成的樣本與(未知)自然圖像分布近似。除了這兩個指標外,我們還研究了 GAN 生成圖像在強化訓練數據方面的作用。可以將其視為衡量生成圖像多樣性的指標。我們在圖 1 中用 GAN-train 指標闡明了我們的評估方法的效果,尤其是在主觀評價不充分的情況下。我們將在第 3 節討論這些評估指標的細節。


正如第 5 節中廣泛的實驗結果以及補充材料和技術報告中的附錄 [5] 所示,與之前討論的所有評估指標相比(包括沒有得出結論的人類研究),這些指標在評估 GAN 方面的信息要豐富得多。尤其是我們還對當前最佳的兩個 GAN 模型(WGAN-GP[20] 和 SNGAN[36])以及其他一些生成模型 [45,47] 進行了評估,以提供基線比較。用 MNIST[30]、CIFAR10、CIFAR100[28] 和 ImageNet[14] 數據集評估了圖像分類表現。實驗結果表明,隨著數據集復雜度的增加,GAN 圖像的質量顯著降低。


論文:How good is my GAN?

微信圖片_20180827221231.jpg

論文鏈接:https://arxiv.org/pdf/1807.09499.pdf


摘要:生成對抗網絡(GAN)是當今最流行的圖像生成方法之一。盡管已經有了不少可以直觀感受到的令人印象深刻的成果,但一些定量標準直到最近才出現。我們認為現有指標不足以評估模型,因此在本文中引入了兩個基于圖像分類的指標——GAN-train 和 GAN-test,這兩個指標分別對應的是 GAN 的召回率(多樣性)和精確率(圖像質量)。我們基于這兩個指標評估了最近的 GAN 方法并證明了這些方法性能的顯著差異。此外,我們的評估指標清楚地表明,數據集復雜程度(從 CIFAR10 到 CIFAR100 再到 ImageNet),與 GAN 質量呈負相關關系。


3. GAN-train 和 GAN-test


條件 GAN 模型的一個重要特征是生成的圖像不僅要逼真,還要能辨識出屬于一個給定的類別。一個可以完美捕獲目標分布的理想 GAN 可以生成一個新的圖像數據集 S_g,這個數據集與原始的訓練集 S_t 沒什么區別。假設這些數據集大小相同,根據這兩個數據集中的任意一個訓練出來的分類器應該有同樣的驗證準確率。當數據集足夠簡單(例如 MNIST[48])時確實是這樣(見 5.2 節)。在這種最佳 GAN 特性的推動下,我們設計了兩個分數來評估 GAN,如圖 2 所示。

微信圖片_20180827221302.jpg

圖 2:GAN-train 和 GAN-test 圖示。GAN-train 根據 GAN 生成圖像訓練了一個分類器,并在真實圖像上進行測試。該指標評估了 GAN 生成圖像的多樣性和真實性。GAN-test 根據真實圖像訓練了分類器,并在 GAN 生成圖像上進行評估。該指標評估了 GAN 生成圖像的真實性。


GAN-train 是在 S_g 上訓練,在由真實圖像組成的驗證集 S_v 上測試的分類器的準確率。當 GAN 不夠好的時候,GAN-train 會比在 S_t 上訓練出來的分類器的驗證準確率低。造成這種情況的原因有很多,例如,(i)與 S_t 相比,模式下降導致 S_g 的多樣性降低;(ii)生成樣本不夠逼真,以至于分類器無法學到相關特征;(iii)GAN 可以將類別混在一起并混淆分類器。不幸的是,我們無法確定 GAN 的問題在哪。當 GAN-train 的準確率與驗證集的準確率相近時,意味著 GAN 產生的圖像質量很高且和訓練集一樣多樣化。正如我們在 5.3 節中所說的那樣,多樣性會隨著生成圖像數量的變化而變化。我們將在本節末尾的評價討論中對其進行分析。


GAN-test 是在原始訓練集 S_t 上訓練,但在 S_g 上測試得到的分類器的準確率。如果 GAN 能很好地進行學習,這就會是一項簡單的任務,因為這兩個數據集的分布是一樣的。理想情況下,GAN-test 應該和驗證準確率相近。如果 GAN-test 明顯高了,那就意味著 GAN 過擬了,即它只是簡單地記住了訓練集。相反,如果 GAN-test 明顯低了,則說明 GAN 無法很好地捕獲目標分布且 GAN 生成的圖像質量堪憂。注意,該指標無法說明樣本的多樣性,因為可以完美記憶每一個訓練圖像的模型可以得到很高的分數。GAN-test 與 [32] 中的精確度相關,它量化了生成圖像與數據流形之間的接近程度。


為了深入了解 GAN 生成圖像的多樣性,我們通過大小不同的生成圖像數據集得到了 GAN-train 準確率,將其與根據相應大小的真實數據訓練得到的分類器的驗證準確率相比較。如果所有的生成圖像都是完美的,GAN-train 的 S_g(其中 GAN-train 等于小尺寸訓練集的驗證精度)的大小將會是 S_g 中不同圖像數量的良好估計。我們在實踐中觀察到,在 GAN 生成樣本數量確定的情況下,GAN-train 準確率是飽和的(見第 5.3 節中的圖 4(a)和 4(b))。這是一種度量 GAN 多樣性的方法,與 [32] 中的召回率相似,都是度量 GAN 覆蓋的數據流形的分數的方法。


5. 實驗

微信圖片_20180827221329.jpg

表 1:CIFAR10 實驗。IS:越高越好。FID 和 SWD:越低越好。為了提高可讀性,此處的 SWD 值擴大了 1000 倍。GAN-train 和 GAN-test 是以百分比形式給出的準確率(越高越好)。

微信圖片_20180827221354.jpg

圖 3:第一列:SNGAN 生成的圖像。其他列:來自 CIFAR10「train」的 5 幅圖像,最接近基線 CIFAR10 分類器特征空間中第一列的 GAN 圖像。

微信圖片_20180827221416.jpg

表 2:CIFAR100 實驗。細節參考表 1 標題。

微信圖片_20180827221439.jpg

表 3:ImageNet 實驗。SNGAN* 指經過 850k 次迭代訓練得到的模型。細節參考表 1 標題。

微信圖片_20180827221506.jpg

圖 4:改變生成圖像數據集大小對 GAN-train 準確率產生的影響。為了便于比較,我們還展示改變真實圖像訓練數據集大小對結果(藍色曲線)產生的影響(最好以 pdf 格式查看)。

微信圖片_20180827221535.jpg

圖 5:用真實圖像和 SNGAN 生成的圖像結合的數據集訓練分類器的結果。

微信圖片_20180827221559.jpg

表 4:用縮減的真實圖像數據集訓練的 SNGAN 的數據強化。在真實圖像數據集或真實圖像和 SNGAN 生成的圖像相結合的數據集(real+GAN)上訓練得到的分類器。分類器準確率以百分數形式表示。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          亚洲在线观看免费视频| 亚洲精品乱码久久久久久日本蜜臀| 国产午夜精品美女视频明星a级| 欧美成人日韩| 欧美成人精精品一区二区频| 蜜臀久久久99精品久久久久久| 9色porny自拍视频一区二区| 亚洲国产精品尤物yw在线观看| 欧美午夜不卡影院在线观看完整版免费| 欧美激情综合五月色丁香小说| 欧美看片网站| 欧美精品二区三区四区免费看视频| 亚洲国产电影| 午夜精品久久久久久久99樱桃| 精久久久久久| 久热re这里精品视频在线6| 一区二区三区四区国产精品| 日韩一级不卡| 国产日韩精品视频一区| 国产精品毛片| 在线视频国内自拍亚洲视频| 最新成人在线| 午夜精品99久久免费| 一区二区三区国产精华| 国内精品一区二区| 国产精品久久久久久户外露出| 亚洲精品网址在线观看| 欧美久久精品午夜青青大伊人| 欧美国产日韩a欧美在线观看| 欧美激情视频一区二区三区免费| 91久久国产精品91久久性色| 久久精品视频导航| 性欧美xxxx大乳国产app| 国产日本欧美一区二区| 久久国产精品久久久久久久久久| 国产精品国码视频| 欧美中文字幕在线| 亚洲综合色激情五月| 国产精品国产三级国产aⅴ入口| 亚洲黄色av一区| 欧美视频在线观看免费网址| 一区二区在线视频播放| 一本色道久久综合一区| 亚洲精品一区二区三区av| 伊人久久久大香线蕉综合直播| 欧美日韩综合在线免费观看| 欧美日韩国产va另类| 亚久久调教视频| 国内成+人亚洲+欧美+综合在线| 亚洲精品精选| 伊人成年综合电影网| 欧美视频久久| 牛牛精品成人免费视频| 国产精品久久国产精品99gif| 亚洲国产高清一区| 久久艳片www.17c.com| 欧美中文字幕视频| 国产一区高清视频| 永久免费毛片在线播放不卡| 久久青青草综合| 亚洲电影第1页| 毛片精品免费在线观看| 久久一区中文字幕| 欧美成人嫩草网站| 午夜精品一区二区三区电影天堂| 欧美高清视频| 在线观看日韩av电影| 亚洲一区二区三区激情| 一个色综合导航| 国产精品自在欧美一区| 鲁大师影院一区二区三区| 亚洲精品欧美日韩专区| 欧美成人精品激情在线观看| 久久人人爽国产| 国产精品igao视频网网址不卡日韩| 噜噜爱69成人精品| 国产精品一区视频网站| 尹人成人综合网| 欧美成人一区在线| 亚洲欧美国产视频| 国产精品久久福利| 欧美三区在线观看| 一区二区三区四区蜜桃| 国产日韩欧美一区在线| 欧美+亚洲+精品+三区| 亚洲欧洲中文日韩久久av乱码| 看片网站欧美日韩| 国产亚洲精品高潮| 亚洲图片在区色| 亚洲午夜激情网页| 亚洲欧洲精品一区二区精品久久久| 午夜精品电影| 亚洲国产天堂久久国产91| 欧美欧美全黄| 久久九九全国免费精品观看| 久久一区欧美| 国产精品欧美日韩久久| 美国成人毛片| 亚洲伊人一本大道中文字幕| 国产精品v一区二区三区| 欧美日韩黄色一区二区| 欧美体内she精视频在线观看| 亚洲国产精品一区二区第四页av| 裸体歌舞表演一区二区| 亚洲视频精选在线| 欧美激情精品久久久久| 欧美日韩精品一区二区| 欧美日韩国产经典色站一区二区三区| 国产精品网站在线观看| 日韩网站在线观看| 亚洲国产网站| 亚洲一区欧美二区| 麻豆精品视频在线| 最新国产拍偷乱拍精品| 久久一区国产| 国产精品porn| 国产伦精品一区二区三区照片91| 久久久久久久久久久久久9999| 亚洲日韩中文字幕在线播放| 亚洲综合清纯丝袜自拍| 一本久道久久综合婷婷鲸鱼| 艳妇臀荡乳欲伦亚洲一区| 裸体女人亚洲精品一区| 久久综合影视| 美脚丝袜一区二区三区在线观看| 欧美国产精品| 亚洲免费在线观看视频| 亚洲美女精品成人在线视频| 国产精品xxx在线观看www| 久久久久国产一区二区三区| 国产亚洲二区| 亚洲综合另类| 亚洲特级片在线| 亚洲欧洲久久| 亚洲性线免费观看视频成熟| 亚洲一区二区不卡免费| 欧美日韩国产精品一区二区亚洲| 一本久久精品一区二区| 亚洲精品一二三| 亚洲激情视频在线观看| 久久国产精品一区二区三区四区| 亚洲欧美日韩人成在线播放| 亚洲一区二区3| 欧美日韩国产精品一卡| 一区二区欧美视频| 欧美日产在线观看| 国产欧美日韩综合一区在线播放| 亚洲欧洲精品一区二区三区| 久久久水蜜桃av免费网站| 国内视频精品| 久久青草欧美一区二区三区| 国产欧美一区二区精品婷婷| 欧美aaaaaaaa牛牛影院| 国产视频久久网| 欧美成人一品| 国产主播一区二区| 国产模特精品视频久久久久| 欧美xxxx在线观看| 欧美一级午夜免费电影| 欧美三级电影大全| 国产精品国产三级国产普通话99| 亚洲人成网站在线观看播放| 亚洲高清在线| 国产精品国产| 免费观看亚洲视频大全| 久久亚洲精品欧美| 亚洲免费久久| 免费观看成人网| 欧美午夜视频在线观看| 欧美 亚欧 日韩视频在线| 国产一区二区av| 麻豆精品精品国产自在97香蕉| 欧美日本在线| 美脚丝袜一区二区三区在线观看| 伊人婷婷久久| 亚洲精品乱码久久久久| 日韩视频一区二区在线观看| 99精品国产在热久久婷婷| 国产视频精品va久久久久久| 国产在线播放一区二区三区| 在线亚洲+欧美+日本专区| 欧美日韩精品免费观看视频完整| 久久激情综合网| 久久久www| 亚洲日本va午夜在线电影| 国产欧美一区二区在线观看| 1000精品久久久久久久久| 欧美日韩国产综合在线| 国产欧美一区二区视频| 99视频在线观看一区三区| 国产精品视频免费| 国产精品入口麻豆原神| 99精品热视频只有精品10| 欧美日韩一级大片网址| 欧美丝袜一区二区三区| 欧美亚洲一区二区在线观看| 欧美一区二区三区喷汁尤物| 亚洲激情黄色| 国产精品素人视频| 久久久久九九九九| 韩国在线视频一区| 亚洲精品资源美女情侣酒店| 亚洲影视中文字幕| 欧美性色aⅴ视频一区日韩精品| 亚洲视频在线观看| 洋洋av久久久久久久一区| 亚洲高清不卡av| 黑人极品videos精品欧美裸| 国产亚洲一本大道中文在线| 国产一区二区三区四区| 亚洲国产va精品久久久不卡综合| 欧美精品三级日韩久久| 亚洲欧洲在线免费| 亚洲国产一二三| 久久久一二三| 欧美一区二区三区视频免费| 久久国产夜色精品鲁鲁99| 1000精品久久久久久久久| 国产精品视频大全| 欧美承认网站| 久久精品动漫| 亚洲综合日韩中文字幕v在线| 亚洲肉体裸体xxxx137| 欧美日韩一区在线| 裸体女人亚洲精品一区| 蜜臀91精品一区二区三区| 亚洲久久在线| 欧美影院精品一区| 国产精品色一区二区三区| 欧美国产日韩xxxxx| 老**午夜毛片一区二区三区| 最新日韩在线视频| 亚洲人久久久| 老牛国产精品一区的观看方式| 午夜一区二区三区在线观看| 亚洲国产日韩欧美在线图片| 国产精品二区二区三区| 亚洲一级网站| 欧美国产日韩a欧美在线观看| 老鸭窝毛片一区二区三区| 国产亚洲欧美日韩美女| 久久香蕉国产线看观看网| 一区二区三区成人精品| 国产麻豆成人精品| 欧美日韩国产系列| 久久久久免费视频| 黑人巨大精品欧美一区二区小视频| 亚洲午夜精品福利| 中文精品一区二区三区| 欧美激情亚洲激情| 欧美www视频在线观看| 欧美精品123区| 亚洲小视频在线观看| 欧美日韩免费观看一区=区三区| 蜜臀a∨国产成人精品| 国产精品高清一区二区三区| 欧美日韩一区二区三区免费看| 亚洲国产成人久久综合| 欧美精品成人91久久久久久久| 亚洲国产第一| 亚洲精品国产系列| 亚洲人成绝费网站色www| 国产亚洲一本大道中文在线| 欧美在线综合| 日韩视频免费观看高清在线视频| 欧美激情1区2区3区| 亚洲欧美在线观看| 久久青草福利网站| 亚洲日本va午夜在线电影| 羞羞漫画18久久大片| 蜜臀久久99精品久久久画质超高清| 久久一区免费| 欧美日韩一级视频| 在线观看亚洲精品| 国产日本欧美一区二区| 亚洲人成网站影音先锋播放| 亚洲黄色影片| 激情成人综合网| 国产精自产拍久久久久久| 亚洲欧美韩国| 亚洲午夜激情网站| 欧美女激情福利| 在线视频中文亚洲| 国语自产精品视频在线看抢先版结局| 欧美一区二区三区在线视频| 欧美午夜精品理论片a级大开眼界| 国产午夜精品久久久久久久| 在线看片第一页欧美| 欧美精品亚洲精品| 久久综合一区二区| 亚洲精品视频在线看| 久久久久欧美精品| 国产精品swag| 国产香蕉久久精品综合网| 久久尤物电影视频在线观看| 欧美中文在线观看| 国产精品看片资源| 欧美a级片网站| 亚洲国产欧美国产综合一区| 欧美激情一二区| 亚洲福利专区| 美日韩丰满少妇在线观看| 在线成人性视频| 国产精品影音先锋| 欧美日韩在线不卡| aa国产精品| 亚洲国产美国国产综合一区二区| 欧美亚男人的天堂| 欧美国产日本| 久久精品国产第一区二区三区最新章节| 亚洲激情在线播放| 亚洲欧美中文日韩v在线观看| 欧美精品一区二区高清在线观看| 国产精品扒开腿爽爽爽视频| 欧美三级欧美一级| 亚洲国产精品视频| 欧美少妇一区二区| 国产一区二区三区视频在线观看| 欧美日韩国产色综合一二三四| 国产综合精品一区| 久久久久免费观看| 欧美成人日韩| 女生裸体视频一区二区三区| 久久久久久亚洲精品杨幂换脸| 欧美一区二区三区免费大片| 国产日产精品一区二区三区四区的观看方式| 国产区亚洲区欧美区| 久久国产精品99国产|