• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能學術 正文
    發私信給MrBear
    發送

    0

    GAN 為什么需要如此多的噪聲?

    本文作者: MrBear 編輯:幸麗娟 2020-05-12 11:12
    導語:從統計角度看 GAN

    GAN 系列模型強大的生成能力有目共睹。然而,為什么我們使用一組白噪聲作為輸入就可以生成逼真的樣本呢?在這個生成的過程中,GAN 是如何擬合數據分布的呢?且看本文從統計的視角為大家揭秘 GAN 生成模型背后的那些事。

    對抗生成網絡(GAN)是一種在給定一組舊的「真實」樣本的情況下,生成新的「人造」樣本的工具。這些樣本幾乎可以是任何的東西:手寫數字、人臉圖片、表現主義繪畫作品,等等所有你能想出的物體。

    為了實現這一點,GAN 會學習到原始數據集背后的底層數據分布。在整個訓練過程中,生成器會近似這個分布,而判別器將會告訴它哪里產生了錯誤,在這種博弈中,二者交替地得到提升。

    為了從分布中抽取出隨機的樣本,我們將會把隨機噪聲作為生成器的輸入。然而,你是否曾經想過:為什么 GAN 需要隨機輸入呢?

    一種廣為接受的答案是:這樣,GAN 就不會每次生成相同的結果。這確實是事實,但這個問題的真正答案實際上還暗藏玄機!

    一、隨機采樣

    在我們繼續討論 GAN 之前,不妨先宕開一筆,討論一下從正態分布中采樣的問題。

    假設你想要在 Python 環境下做到這一點,而你從未閱讀過有關「numpy」庫的文件,也不知道「np.random.normal()」方法的存在,此時你只能利用「random.random()」(該方法會均勻地生成(0,1)區間內的值)。

           GAN 為什么需要如此多的噪聲?      

    圖 1:從我們的輸入中采樣得到 100,000 個樣本的直方圖,藍色為均勻分布,橙色為我們的目標:正態分布。

    簡而言之,我們希望將圖 1 中藍色的分布轉換為橙色的分布。幸運的是,有一種函數可以做到這一點:逆累積分布函數(又稱分位函數)。

    (非逆的)累積分布函數(CDF)如圖二所示,它描述了從所討論的分布中任意抽取出的值小于等于特定的 x 值的概率。

           GAN 為什么需要如此多的噪聲?      

    圖 2:標準正態分布的 CDF 曲線

    舉例而言,如圖 2 所示,在 x = 0 時,y = 0.5;這意味著 50% 的分布落在 x = 0 左側。CDF

    的一個方便的特性是:輸出的范圍在 0 到 1 之間,這正是我們可以通過「random.random()」函數得到的輸入!如果我們對 CDF 求反函數(將其坐標軸翻轉),我們就可以得到分位函數:

           GAN 為什么需要如此多的噪聲?      

    圖 3:標準正態分布的分位函數

    該函數為我們給出了確切的分位數(范圍在 0 到 1 之間的 x)和相應的正態分布中的值的對應關系,讓我們可以直接從正態分布中采樣。也就是說「 f(random.random()) ~ N(0, 1)」,其中輸入空間中的每個點都對應于輸出空間中的唯一一個點。

           GAN 為什么需要如此多的噪聲?      

    圖 4:使用分位函數將均勻分布(藍色)映射到正態分布(橙色)的示意圖。

    二、這與 GAN 有何關系?

    在上述場景下,我們在處理過程中使用了分位函數。但如果我們不這么做,并且必須學習一個從輸入空間到輸出空間的映射,那該怎么辦呢?這正是 GAN 旨在解決的問題。

    在《Training a GAN to Sample from the Normal Distribution》(https://towardsdatascience.com/training-a-gan-to-sample-from-the-normal-distribution-4095a11e78de)中,我們解釋了在數據緊缺、并且沒有可以使用的分位函數的情況下,如何使用 GAN 從正態分布中采樣。

    從這個角度看來,我們發現不將 GAN 看做隨機采樣的工具,而是將 k 維潛在(輸入)空間映射到 p 維采樣(輸出)空間是很有益的,后者可以被用來將潛在空間中的樣本變換為采樣空間中的樣本。這樣看的話,正如分位函數一樣,就不會涉及到隨機性的問題。

    在這種映射下,我們不妨考慮一下如何只將 0 到 1 之間的一維隨機樣本作為輸入,從一個二維的正態分布中抽取隨機樣本。

           GAN 為什么需要如此多的噪聲?      

    圖 5:一個二維的正態分布(橙色)和一維的均勻分布(藍色)的示意圖,樣本量為 100,000。

    我們如何將藍色直線中的 100,000 份樣本映射到橙色部分中的 100,000 分樣本中去呢?貌似沒有很好的方法能做到這一點。

    當然,我們可以使用 Peano 曲線,但是這樣我們就會失去某種很有用的特性,即:令數據點在輸入空間中距離相近,也會使數據點在輸出空間中接近,反之亦然。

    正因為如此,GAN 的潛在空間的維度必須大于或等于其采樣空間的維度。這樣的話,函數就有足夠的自由度將輸入映射到輸出上。

    出于興趣,讓我們將只擁有一維輸入的 GAN 學習多維分布的過程可視化出來。也許你不會對這些結果感到驚訝,但它們仍然非常有趣,值得一看。

    三、二維高斯分布

    首先,讓我們討論一下如圖 5 所示的問題:將 0 到 1 之前的數據映射到二維正態(又稱「高斯」)分布上。我們在這里將使用一個典型的原始 GAN 架構(代碼鏈接見文末)。

           GAN 為什么需要如此多的噪聲?       

    圖 6:一個潛在空間維數為 1 的 GAN 試圖學習二維高斯分布。灰色的點是從真實分布中抽樣得到的樣本,紅色的點是生成的樣本。每一幀都是一個訓練步。

    如你所見,這種糟糕的辦法并不知道應該要做什么。由于只有一個自由度,它很難探索采樣空間。

    更糟糕的是,由于生成的樣本被密集地包圍在一個一維的流形中(實際上,這個動圖中灰色的點和紅色點的數量是一樣的!),判別器就可以懈怠了,永遠不用努力地將真實點和生成的點區分開來,這樣一來生成器就不會得到非常有用的信息(即使它有能力,也不足以學習一個空間填充曲線)。

    圖 6 展示了前 600 個訓練步的情況。三萬步后,結果如下圖所示:

           GAN 為什么需要如此多的噪聲?      

    圖 7:在 30,000 個訓練步后,圖 6 中的 GAN 學到的分布。

    這個涂鴉一樣的曲線很可愛,但它幾乎與高斯分布無關。GAN 在 30,000 步后完全沒有學習到映射。在這種背景下,讓我們考慮一下具有相同架構和訓練例程的 GAN 在給定二維、三維、十維,以及一百維潛在空間時,映射到上述分布時的表現:

    GAN 為什么需要如此多的噪聲?      

    圖 8:擁有二維、三維、十維,以及一百維潛在空間的 GAN 在訓練了 30,000 訓練步后的輸出。

    擁有二維潛在空間的 GAN 的性能要遠優于一維潛在空間的 GAN,但是仍然與目標分布差距很大,存在一些明顯的扭結。擁有三維和十維潛在空間的 GAN 生成了具有視覺說服力的結果,而一百維的 GAN 生成了似乎具有正確方差但是均值錯誤的高斯分布。

    但是我們要注意到,高維 GAN 在輸出空間為高斯分布的前提下,實際上是有一定特殊性的,因為大量均勻分布的均值近似于正態分布(中心極限定理)。

    四、八個高斯分布

           GAN 為什么需要如此多的噪聲?      

    圖 9:八個高斯分布

    顧名思義,圖 9 中的八個高斯分布指的是:八個二維高斯分布圍繞原點排列成一個圓圈,每個高斯分布的方差足夠小、幾乎沒有重疊,協方差為零。

    雖然樣本空間是二維的,但這種分布的合理編碼需要三個維度:第一個維度是離散的,描述了模式(編號為 1 到 8),另外的兩個維度分別描述了該模式的 x 和 y 坐標。我將「latent_dim」設置為 1,在八個高斯分布上將 GAN 訓練了 600 步,結果如下:

           GAN 為什么需要如此多的噪聲?       

    圖 10:潛在維度為 1 的 GAN 試圖學習八個高斯分布。灰色的點是從真實分布中抽取出來的樣本,紅色的點代表生成的樣本。每一幀都是一個訓練步。

    正如所料,GAN 很鬧學習到有效的映射。在 30,000 個訓練步后,學到的分布如下:

           GAN 為什么需要如此多的噪聲?      

    圖 11:圖 10 中的 GAN 經過了 30,000 個訓練步后學到的分布。

    顯然,GAN 很難將一維潛在空間映射到這個三維分布中:最右邊的模式被忽略掉了,模式之間的區域生成了大量的樣本,而且這些樣本也并不服從正態分布。

    作為對比,我們不妨再考慮下面四個 GAN,他們的潛在維度分別為 2,3,10,以及100,在經過了 30,000 個訓練步后,結果如下所示:GAN 為什么需要如此多的噪聲?       

    圖 12:潛在空間為二維、三維、十維以及一百維的 GAN,在經歷了 30,000 個訓練步后的輸出。

    在沒有實際度量真實分布和學習到的分布之間的 KL 散度時,很難說上面哪種情況是最好的,但是潛在空間維度較低的 GAN 似乎在模式之間的負空間內生成的樣本更少。

    更有趣的是,二維的 GAN 并沒有展現出模式崩潰的問題,三維和十維的 GAN 僅僅顯示出了輕微的模式崩潰,而一百維的 GAN 在兩個模式上并未能生成樣本。

    五、螺旋式分布

           GAN 為什么需要如此多的噪聲?      

    圖 13:螺旋式分布。隨著螺旋從圓心向外擴展,分布的密度在減小,在懸臂上橫向的密度是均勻的。

    如圖 13 所示的螺旋式分布,從某種程度上來說比八個高斯分布的問題更簡單。螺旋式分布只有一種模式(盡管被拉長和扭曲了),GAN 不會被迫將其連續輸入離散化。它可以被高效地描述為兩個維度:一個維度描述沿著螺旋的位置,另一個維度描述在螺旋內橫向的位置。

    我將 「latent_dim」設置為 1,對 GAN 訓練了 600 步,結果如下:

           GAN 為什么需要如此多的噪聲?       

    圖 14:潛在維度為 1 的 GAN 試圖擬合螺旋分布。灰色的點是從真實分布中抽取出的樣本,紅色的點是生成的樣本。每一幀都是一個訓練步。

    相同的,GAN 也難以學到有效的映射。在經歷了 30,000 個訓練步后,學到的分布如下:

           GAN 為什么需要如此多的噪聲?      

    圖 15:圖 14 中的 GAN 學到的分布,在經歷了 30,000 個訓練步后的結果。

    與「八個高斯分布」一節中的情況相類似,GAN 在映射螺旋式分布時性能很差。螺旋中有兩個區域沒有能夠被擬合,而且在負空間內生成了許多樣本。

    我在文章《GANs and Inefficient Mappings》(https://towardsdatascience.com/gans-and-inefficient-mappings-f185fdd62a78)中詳細地討論了這個低效率的映射問題,因此這里不再贅述;相反,我們不妨再考慮下面四個 GAN,他們的潛在維度分別為 2,3,10,以及100,在經過了 30,000 個訓練步后,結果如下所示:

    GAN 為什么需要如此多的噪聲?

    圖 16:潛在空間為二維、三維、十維和一百維的 GAN 在經歷了 30,000 個訓練步后的輸出。

    同樣的,在沒有真正度量 KL 散度的情況下,很難說上面哪種情況是最好的,但是覆蓋率、均勻性、在負空間內的樣本是很值得研究的問題。雷鋒網雷鋒網雷鋒網

    六、結語

    人們很容易陷入對 GAN 的狂熱中,把它們當作“魔法機器”,用隨機數作為燃料來創造出新的樣本。了解一個工具如何工作的基本原理,對于有效地使用它以及在它損壞時進行故障排除是至關重要的。

    對于 GAN 來說,這就意味著理解生成器所做的是學習從一些潛在空間到一些采樣空間的映射,并理解學習是如何進行的。將一維分布映射到高維分布的極端情況清晰地說明了這種任務有多復雜。

    本項目使用的所有代碼可以從下面的 GitHub 代碼倉庫中獲取:

    https://github.com/ConorLazarou/medium/tree/master/12020/visualizing_gan_dimensions

    Via https://towardsdatascience.com/why-do-gans-need-so-much-noise-1eae6c0fb177


    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    GAN 為什么需要如此多的噪聲?

    分享:
    相關文章

    知情人士

    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 欧美日韩国产亚洲沙发| 国产人妻无套一区二区普通话对白 | 日韩一区二区a片免费观看| 精品一区二区亚洲国产| 人妻少妇白浆| 人妻无码一二三区免得| 亚洲 国产 制服 丝袜 一区 | 亚洲国产综合有精品| 亚洲第一视频区| 少妇无套内射中出视频| 成人免费无码大片a毛片软件| 两个人免费视频大全毛片| 无套内射极品少妇chinese| 日本九州不卡久久精品一区| 成年女人免费碰碰视频| 亚洲日韩国产精品综合在线观看| 色欲天天综合| 国产三级国产精品国产专| 亚洲第1色电影。| 中年国产丰满熟女乱子正在播放| 捆绑av一区二区三区| 国产盗摄人妻精品一区| 国产v综合v亚洲欧美大天堂| 国产精品久久vr专区| 国产日韩在线视看高清视频手机| 国产午夜无码精品免费看动漫 | 51妺嘿嘿午夜福利| 麻豆乱码国产一区二区三区| 粉嫩导航| 国产欧美VA天堂在线观看视频| 国产精品中文一区二区| 国产成人高清精品免费软件| 国产女人网站在线观看| 精品人妻久久| 一级片黄色一区二区三区| 欧美乱色| 66久久| 成人福利视频| 人妻内射一区二区在线视频| av天堂久久精品影音先锋| 韩日一级|