• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能 正文
    發(fā)私信給雪莉?休斯敦
    發(fā)送

    0

    大批量深度學(xué)習(xí)為何泛化效果差?西北大學(xué)聯(lián)合英特爾給出了答案 | ICLR 2017

    本文作者: 雪莉?休斯敦 編輯:郭奕欣 2017-04-25 10:23 專(zhuān)題:ICLR 2017
    導(dǎo)語(yǔ):大量的證據(jù)證明,大批量的方法會(huì)傾向于將模型和函數(shù)歸一化,從而導(dǎo)致尖銳收斂,并最終生成了比較差的泛化效果。

    雷鋒網(wǎng)AI科技評(píng)論按:ICLR 2017 于4月24-26日在法國(guó)土倫舉行,雷鋒網(wǎng)AI科技評(píng)論的編輯們也于法國(guó)帶來(lái)一線(xiàn)報(bào)道。在這個(gè)深度學(xué)習(xí)會(huì)議舉辦之際,雷鋒網(wǎng)也圍繞會(huì)議議程及論文介紹展開(kāi)一系列的覆蓋和專(zhuān)題報(bào)道,敬請(qǐng)期待。

    大批量深度學(xué)習(xí)為何泛化效果差?西北大學(xué)聯(lián)合英特爾給出了答案 | ICLR 2017

    由西北大學(xué)(Northwestern U)的Nitish Shirish Keskar和Jorge Nocedal和英特爾的Dheevatsa Mudigere,Mikhail Smelyanskiy以及Ping Tak Peter Tang近期發(fā)表的論文《ON LARGE-BATCH TRAINING FOR DEEP LEARNING: GENERALIZATION GAP AND SHARP MINIMA》,當(dāng)選 ICLR 2017的oral paper。文章描述了在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí),大的 batch size(如,超過(guò)512)會(huì)導(dǎo)致網(wǎng)絡(luò)模型泛化能力下降的問(wèn)題,并通過(guò)實(shí)驗(yàn)證明其原因是泛化誤差和尖銳收斂,并提出了一些解決方案。

    很多深度學(xué)習(xí)過(guò)程中都在算法上應(yīng)用了隨機(jī)梯度下降的方法或隨機(jī)梯度下降的衍生方法。但是這種方法一般適用于小批量(樣本數(shù)量在32-512之間)的計(jì)算。觀察數(shù)據(jù)顯示,當(dāng)大批量計(jì)算時(shí)(樣品數(shù)量超過(guò)512),如果用泛化能力作為標(biāo)準(zhǔn)的話(huà),模型的計(jì)算質(zhì)量就會(huì)下降。Intel與西北大學(xué)研究的這篇文章,就這個(gè)問(wèn)題進(jìn)行了討論,并提出了大量的證據(jù)證明大批量的方法會(huì)傾向于將模型和函數(shù)歸一化,從而導(dǎo)致尖銳收斂,并最終生成了比較差的泛化效果。

    論文分析了在小批量情況下結(jié)果不同的原因,并提出這種不同來(lái)自于在梯度預(yù)測(cè)時(shí)內(nèi)部噪聲的差異。如下圖片,在這個(gè)案例中,隨機(jī)的選擇一組小批量(SB)和大批量(LB)的最小值,可以發(fā)現(xiàn),LB極小值比SB極小值更加尖銳。因此,泛化能力則更低一些。同時(shí),論文還就減小泛化間隙的問(wèn)題提出了在大批量計(jì)算中適用的幾種策略,開(kāi)放性的預(yù)留了未來(lái)的討論點(diǎn),包括在大批量計(jì)算中可進(jìn)行的尖銳收斂和可能的優(yōu)化方案。

    大批量深度學(xué)習(xí)為何泛化效果差?西北大學(xué)聯(lián)合英特爾給出了答案 | ICLR 2017

    論文鏈接:https://openreview.net/pdf?id=H1oyRlYgg

    原文鏈接:https://openreview.net/forum?id=H1oyRlYgg&noteId=H1oyRlYgg 

    ICLR評(píng)論:

    ICLR委員會(huì)最終決定:

    對(duì)這篇論文的評(píng)論普遍非常正面,這說(shuō)明了這篇論文映射了一個(gè)在工程應(yīng)用領(lǐng)域普遍存在的問(wèn)題。我相信整個(gè)研究環(huán)境會(huì)通過(guò)閱讀這篇論文得到一些建設(shè)性的解決問(wèn)題的新思路。

    決定:接受(Oral)

    大批量訓(xùn)練的分析

    評(píng)分:8分,Top 50%,明確接受

    評(píng)論:這是一篇很有趣的文章,就為什么大批量訓(xùn)練效果變差的原因進(jìn)行了分析,這對(duì)整個(gè)深度學(xué)習(xí)的社區(qū)有著重要的意義。

    很好的文章

    評(píng)論:我想這篇文章明確了一點(diǎn),大批量計(jì)算時(shí),泛化效果就會(huì)變差。并通過(guò)對(duì)比分析大批量和小批量的失真函數(shù)進(jìn)行了很好的闡釋。

    文章不夠新穎但是實(shí)驗(yàn)數(shù)據(jù)非常有價(jià)值

    評(píng)分:10分,Top 5%,這是一篇研討會(huì)文章

    很好的文章:

    評(píng)分:6分,剛好及格

    評(píng)價(jià):我覺(jué)得這篇文章還不錯(cuò),很有趣也很有用,但是如果增加更多的論證,比如增加一些高斯噪聲梯度的分析。

    大批量深度學(xué)習(xí)為何泛化效果差?西北大學(xué)聯(lián)合英特爾給出了答案 | ICLR 2017

    分享:
    相關(guān)文章
    當(dāng)月熱門(mén)文章
    最新文章
    請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
    姓名
    電話(huà)
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說(shuō)
    主站蜘蛛池模板: 好湿好爽好疼免费视频| 日韩成人无码影院| 2020精品国产自在现线看| 国产欧美日韩综合精品一区二区| 久久天天躁狠狠躁夜夜躁| 亚洲有码av| 人成午夜大片免费视频77777| 欧美一区二区三区成人久久片| 成a人片亚洲日本久久| 国产精品成人不卡在线观看| 3d动漫精品一区二区三区| 国产99视频精品免费视频6| 国产欧美精品一区aⅴ影院| 亚洲线精品一区二区三区八戒| 99国产精品久久久久久久日本竹| 亚洲精品一区二区三区大桥未久 | 亚洲精品天堂在线观看| 激情综合色五月六月婷婷| 亚洲AV第一页国产精品| 久久久久久AV无码免费网站动漫| 熟妇高潮精品一区二区三区| 男女吃奶做爰猛烈紧视频| 国产精品7m凸凹视频分类大全| wwwjizzjizz| 女人喷水高潮时的视频网站| 色天天综合久久久久综合片| 精品丰满人妻一区二区三区免| 成人免费一区二区三区视频| 欧美极品色午夜在线视频 | 色爱无码综合网| 欧美亚洲国产精品第一页| 日日橹狠狠爱欧美视频| 国产高清一区二区不卡| 人禽杂交18禁网站免费 | 亚洲人午夜精品射精日韩| 亚洲欧美中文日韩AⅤ| 久久9999国产精品免费| 日韩AV有码无码一区二区三区| 欧美极品色午夜在线视频 | 亚洲AV无码成人精品区一本二本| 国产高清在线男人的天堂|