换个角度看GAN:另一种损失函数
轉(zhuǎn)載自:機器之心
選自Medium
作者:Phúc Lê
機器之心編譯
參與:張璽
「本質(zhì)上,GAN 就是另一種。」
Jeremy Howardf 老師曾在(GAN)課程中說過:「……本質(zhì)上,GAN 就是另一種損失函數(shù)。」
本文將在適合的相關(guān)背景下討論上面的觀點,并向大家闡述 GAN 這種「學(xué)得」(learned)損失函數(shù)的簡潔優(yōu)美之處。
首先,我們先介紹相關(guān)背景知識:
從函數(shù)逼近的角度看神經(jīng)網(wǎng)絡(luò)
在數(shù)學(xué)中,我們可以把函數(shù)當(dāng)做機器,往機器中輸入一或多個數(shù)字,它會相應(yīng)地生成一或多個數(shù)字。
將函數(shù)比作「機器」或「黑箱」。(圖源:https://www.wikiwand.com/en/Function_%28mathematics%29)
如果我們能夠用數(shù)學(xué)公式表示函數(shù),這很好。可如果大家不能或尚未想明白如何將想要的函數(shù)寫成一系列加減乘除(譬如分辨輸入是貓圖像還是狗圖像的函數(shù))又該如何呢?
如果無法用公式表達,那我們能否至少逼近函數(shù)呢?
來拯救我們了。萬能逼近定理表明,一個具有充足隱藏單元且足夠大的神經(jīng)網(wǎng)絡(luò)可以計算「任何函數(shù)」。
具備 4 個隱藏單元的簡單神經(jīng)網(wǎng)絡(luò)逼近塔型函數(shù)。(圖源:http://neuralnetworksanddeeplearning.com/chap4.html)
神經(jīng)網(wǎng)絡(luò)的顯式損失函數(shù)
掌握神經(jīng)網(wǎng)絡(luò)后,我們就可以構(gòu)建一個神經(jīng)網(wǎng)絡(luò)以逐步逼近上文所述的貓狗分類函數(shù),而無需顯式地表達該分類函數(shù)。
為了獲得更好的函數(shù)逼近能力,神經(jīng)網(wǎng)絡(luò)首先需要知道其當(dāng)前性能有多差。計算神經(jīng)網(wǎng)絡(luò)誤差的方式被稱為損失函數(shù)。
目前已經(jīng)有很多損失函數(shù),對于損失函數(shù)的選擇依賴于具體任務(wù)。然而,所有損失函數(shù)具有一個共同特性──它必須能以精確的數(shù)學(xué)表達式表示損失函數(shù)。
L1 損失(絕對誤差):用于回歸任務(wù)
L2 損失(平方誤差):與 L1 類似,但對于異常值更加敏感
交叉熵誤差:通常用于分類任務(wù)
Dice 損失 (IoU) :用于分割任務(wù)
KL 散度:用于衡量兩種分布之間的差異
……
關(guān)于神經(jīng)網(wǎng)絡(luò)逼近特性的好壞,損失函數(shù)承擔(dān)著十分重要的作用。對于神經(jīng)網(wǎng)絡(luò)構(gòu)建人員來說,針對具體任務(wù)去理解和選擇恰當(dāng)?shù)膿p失函數(shù)是最重要的技能。
目前,設(shè)計更好的損失函數(shù)也是活躍度極高的研究領(lǐng)域。譬如,論文《Focal Loss for Dense Object Detection》介紹了一種名為「Focal loss」的新型損失函數(shù),用于解決單階段目標(biāo)檢測模型的不平衡性。
顯式損失函數(shù)的局限
前文所述的損失函數(shù)在分類、回歸及圖像分割等任務(wù)中的表現(xiàn)相當(dāng)不錯,而針對輸出具有多模態(tài)分布的情況,則效果堪憂。
以黑白圖片著色任務(wù)為例。
L2 損失函數(shù)的思考過程。(圖源:https://youtu.be/8881p8p3Guk?t=2971)
輸入是黑白色的鳥,真實圖像是相同的藍色的鳥。
采用 L2 損失函數(shù)計算模型的輸出顏色與真實圖像的像素級差異。
接下來,輸入是與剛才實驗相似的一只黑白色的鳥;真實圖像是一只相同的紅色的鳥。
L2 損失函數(shù)試圖最小化模型的輸出顏色與紅色的差異。
基于 L2 損失函數(shù)的反饋,模型已學(xué)習(xí)出一只相似的鳥,但模型應(yīng)該輸出一種與紅色及藍色都接近的顏色。模型會怎么做?
模型會輸出一種黃色的鳥,這是最小化紅色與藍色距離的最安全選擇,即便模型在訓(xùn)練過程中從未觀察到一只黃色的鳥。
由于實際上沒有黃色鳥,所以你知道模型不夠逼真。
基于均方差預(yù)測的下一幀圖像非常模糊。(圖源:https://arxiv.org/pdf/1605.08104.pdf)
這種均化效應(yīng)在許多實例中會導(dǎo)致非常糟糕的結(jié)果。以預(yù)測視頻下一幀任務(wù)為例,下一幀的可能性非常多,你想要的是能輸出「其中某一幀」的模型。但是,如果采用 L2 或 L1 訓(xùn)練模型,模型將平均所有可能結(jié)果,生成一張十分模糊的均化圖像。
GAN 作為新的損失函數(shù)
首先,你并不知道復(fù)雜函數(shù)的精確數(shù)學(xué)表達式(比如函數(shù)的輸入是一組數(shù)字,輸出是一張狗狗的逼真圖像),所以你使用神經(jīng)網(wǎng)絡(luò)逼近此函數(shù)。
神經(jīng)網(wǎng)絡(luò)需要損失函數(shù)告知它目前性能的好壞,但沒有任何顯式損失函數(shù)能夠很好的完成此項工作。
嗯,要是有一種既無需顯式數(shù)學(xué)表達式,又能夠直接逼近神經(jīng)網(wǎng)絡(luò)損失函數(shù)的方法,該多好。譬如神經(jīng)網(wǎng)絡(luò)?
所以,如果我們用神經(jīng)網(wǎng)絡(luò)模型替代顯式損失函數(shù),將會怎樣?恭喜,你發(fā)現(xiàn)了 GAN。
通過下面的 GAN 架構(gòu)和 Alpha-GAN 架構(gòu),你能觀察地更清晰。如圖,白色框代表輸入,粉色框和綠色框代表你想構(gòu)建的網(wǎng)絡(luò),藍色框代表損失函數(shù)。
GAN 架構(gòu)。(圖源:http://efrosgans.eecs.berkeley.edu/CVPR18_slides/VAE_GANS_by_Rosca.pdf)
Alpha-GAN 架構(gòu)。(圖源:http://efrosgans.eecs.berkeley.edu/CVPR18_slides/VAE_GANS_by_Rosca.pdf)
在原版 GAN 中僅有一種損失函數(shù)——判別器網(wǎng)絡(luò) D,其自身就是另一種神經(jīng)網(wǎng)絡(luò)。
而在 Alpha-GAN 中,模型有 3 種損失函數(shù):輸入數(shù)據(jù)的判別器 D、用于已編碼潛變量的潛碼判別器 C,以及傳統(tǒng)像素級 L1 損失函數(shù)。其中,D 和 C 并不是顯式損失函數(shù),而只是其近似──神經(jīng)網(wǎng)絡(luò)。
梯度
如果將判別器(同樣也是神經(jīng)網(wǎng)絡(luò))作為損失函數(shù)來訓(xùn)練生成器網(wǎng)絡(luò)(與 Alpha-GAN 的編碼器),那么用什么損失函數(shù)來訓(xùn)練判別器呢?
判別器的任務(wù)是區(qū)分真實數(shù)據(jù)分布與生成數(shù)據(jù)分布。用監(jiān)督方式訓(xùn)練判別器時,標(biāo)簽可隨意使用,所以采用二元交叉熵等顯式損失函數(shù)訓(xùn)練判別器就很簡單。
但由于判別器是生成器的損失函數(shù),這代表判別器的二元交叉熵損失函數(shù)的累積梯度同樣會被用于更新生成器網(wǎng)絡(luò)。
觀察 GAN 中的梯度變化,就非常容易發(fā)現(xiàn)改變其軌跡的新思路。如果顯式損失函數(shù)的梯度無法在兩個神經(jīng)網(wǎng)絡(luò)間(判別器和生成器)回流,卻可以在三個神經(jīng)網(wǎng)絡(luò)間回流,那么它能被應(yīng)用在何處?如果梯度無法通過傳統(tǒng)損失函數(shù)回流,卻可在這些神經(jīng)網(wǎng)絡(luò)之間直接來回呢?從基本原理出發(fā),我們很容易發(fā)現(xiàn)未被探索的路徑以及未被解答的問題。
結(jié)論
通過傳統(tǒng)損失函數(shù)與神經(jīng)網(wǎng)絡(luò)的集成,GAN 使將神經(jīng)網(wǎng)絡(luò)作為損失函數(shù)來訓(xùn)練另一神經(jīng)網(wǎng)絡(luò)成為可能。兩個神經(jīng)網(wǎng)絡(luò)間的巧妙交互使得深度神經(jīng)網(wǎng)絡(luò)能夠解決一些先前無法完成的任務(wù)(如生成逼真圖像)。
將 GAN 本質(zhì)上視為一種學(xué)得的損失函數(shù),我希望這篇文章能夠幫助大家理解 GAN 的簡潔和力量。
原文鏈接:https://medium.com/vitalify-asia/gans-as-a-loss-function-72d994dde4fb
本文為機器之心編譯,轉(zhuǎn)載請聯(lián)系本公眾號獲得授權(quán)。
?------------------------------------------------
加入機器之心(全職記者 / 實習(xí)生):hr@jiqizhixin.com
投稿或?qū)で髨蟮?#xff1a;content@jiqizhixin.com
廣告 & 商務(wù)合作:bd@jiqizhixin.com
總結(jié)
以上是生活随笔為你收集整理的换个角度看GAN:另一种损失函数的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 收集一些常用查询SQL语句以及显示格式
- 下一篇: JAX-RS之Jersey入门