[機器學習 ML NOTE]Generative Adversarial Network, GAN 生成對抗網路

Published in

雞雞與兔兔的工程世界

8 min readSep 14, 2018

我覺得GAN是近期Deep learning裡面最有趣也是最厲害的一個技術，他可以自動生成training data，甚至data跟真實的資料非常的相似，甚至可以做出圖像特徵的轉變(畫風改變，人臉改變等技術)，這些生成的資料便可以拿去training model，也可以生成一些自己的所想要的資料，接下來我就來介紹一下GAN的原理，下面我也會用Tensorflow把GAN給實作出來，生成Mnist手寫資料!!

Generative Adversarial Network 生成對抗網路

“GAN!!這也太厲害了吧!!!” GAN的出來讓我們可以很大聲的說髒話了(誤

GAN是2014年的一個大神 Ian Goodfellow 提出來的方法，我用簡單一點的話來表達什麼是GAN，在GAN組織裡面中有二個角色，一個是專門偽造假名畫來去賣的G先生，一個是專門鑑定此符畫是不是真畫的D先生，D先生會從G先生那邊拿到假畫來辨斷真假，G先生則是利用D先生的鑑定來改良自己製造假畫的技術，G先生跟D先生互相共同合作，GAN! 這跟本要大賺了。

我們來看下面的圖，你能相信這些寢室圖都是GAN所製造出來的假圖嗎？我是看不太出來啦，GAN這個組織跟本可怕!!

*圖片來自 “Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks”* *https://arxiv.org/abs/1511.06434v2*

我們可以從前面的話整理出GAN的簡單Flow架構

上面的Flow是一個最基本的GAN的Flow，可以看出GAN中有二個Neural Network需要去Train，接下來我就來介紹Discriminator跟Generator這二個神經網路應該要怎麼去訓練。

Discriminator Network(鑑別器網路)

鑑別器網路簡單一點說明的就是，訓練出一個Neural Network可以分辨偽造出來的圖跟真實的圖，那要怎麼訓練這個網路呢？我自己畫了用以下的圖來理解。

沒錯，就是很直觀的，我們把Generator出來的圖標記為0(fake image)，然後把真實的圖標記為1，這樣的training data 丟進我們的Discriminator Network做訓練，這就是每一次Discriminator訓練的步驟了，接下來我們來看Generator怎麼做，然後再把二個連結再一起。

Generator Network (生成器網路)

生成器網路的概念也很簡單，就是要訓練出一個Neural Network可以讓Discriminator分辨出來的結果越接近真實(1)的結果越好，我畫了以下的圖來理解生成器網路的訓練方式。

從以上的圖中就可以知道，我們可以把Generator+ Discriminator看成是一個大的Neural Network，假設生成器是前5層的Neural，鑑定器是後5層的Neural，然後這個10層的Neural Network 預估出來的值越接近1越好，但是這裡我們只update Generator 的weight，Discriminator的Weight要Keep，這樣才可以用更新後 Generator出來的假圖在Discriminator上的值越接近真實的結果，我們可以用一個結論來表示，其實就是更新生成器的參數讓Discriminator接近真實的結果。

GAN (Generative Adversarial Network)

我們可以從上面看出生成器跟鑑定器的參數要怎麼update，下面是論文中GAN的演算法

依照演算法上的Loss function，我統整了整個GAN的流程，希望可以更容易了解GAN的基本運作。

G_Loss就是我們把生成器產生的偽造圖輸入進鑑定器中的輸出跟1的loss

D_Loss就是我們把生成器產生的偽造圖輸入進鑑定器中的輸出跟0的loss+真實的圖輸入進鑑定器中的輸出跟1的loss。

整個GAN的架構大概就是這樣，接下來就來實作啦!!!!!!

MNIST 手寫數字 GAN TENSORFLOW 實作

下面的CODE就是我用MNIST資料來實作GAN

https://github.com/super13579/tensorflow-GAN-MNIST/blob/master/GAN_MNIST.pyscript

Generator (生成器)

為4層網路，都為fully connect layer，input為1*100的random noise data，這裡要注意的是最後一層的activate function是用tanh

Discriminator (鑑別器)

鑑別器也是4層網路，input為攤平的28*28的image data，也就是1*784的array，最後output layer出來的是鑑別圖片是真是否的預估值，每一層最後都會有個dropout防止overfitting的狀況 (想了解什麼是overfitting可以看我前面介紹的文章)

Save Image

生成16張假資料並save，就像這樣。

Loss function跟訓練器的設定

這裡我們需要Generator先去產生一個假圖片，這裡我們把real跟fake的資料分開進鑑別器(discriminator)去預估出是真是假的預估值，這裡要注意的是D_fake那邊必須要開reuse，不然會有error(我當時debug超久…)，loss function就照論文上的演算法設定，前面都要加個負號，不加負號loss會出現nan的狀況…至於為什麼我就不太清楚了QQ