• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
    人工智能 正文
    發(fā)私信給camel
    發(fā)送

    0

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    本文作者: camel 2017-08-10 23:58 專題:ACL 2017
    導(dǎo)語:這次報告講了他們使用GDAN方法訓(xùn)練半監(jiān)督問答模型的工作。

    雷鋒網(wǎng)AI科技評論按:雖然ACL 2017早已落下帷幕,但對精彩論文的解讀還在繼續(xù)。下面是雷鋒網(wǎng)在ACL現(xiàn)場記錄的Zhilin Yang的報告。Zhilin Yang 是卡耐基·梅隆大學(xué)計算機(jī)學(xué)院語言技術(shù)研究院的一名博士生,William W. Cohen和Ruslan Salakutdinov兩位大牛的高徒。

    目前,QA對數(shù)據(jù)集的獲取需要人工標(biāo)注,這往往代價比較大。Z Yang他們提出了一種半監(jiān)督的Generative Domain-Adaptive Nets模型,通過引入GAN和domain tag,同時利用標(biāo)注的數(shù)據(jù)和未標(biāo)注數(shù)據(jù)訓(xùn)練模型,能夠得到很好的效果。

    圖文分享總結(jié)

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    大家好,我是Zhilin Yang,下面我將要講的是半監(jiān)督問答。這項(xiàng)工作是我與Junjie Hu,Ruslan Salakhutdinov 和William W. Cohen共同完成的。

    動機(jī)及問題

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    近來在QA方面出現(xiàn)了很多神經(jīng)網(wǎng)絡(luò)模型。這些模型一般面臨一個問題,即要想訓(xùn)練好就需要大量的訓(xùn)練數(shù)據(jù)。目前有一些這樣的數(shù)據(jù)庫,例如SQuAD等,他們通過人工來生成問答對。這種數(shù)據(jù)庫收集是非常耗時耗力的。也有一些無監(jiān)督模型來做這種自動問答對生成,它們會使用多層RNN、關(guān)注、匹配等技術(shù),但這種模型一般較為龐大。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    一邊是比較耗時耗力的人工問答對,一邊是可以從Wikipedia上大量下載的未標(biāo)記文本。那么我們就自然想到“半監(jiān)督問答”。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    所謂“半監(jiān)督問答”就是,用少量標(biāo)記的問答對和大量未標(biāo)記的文本來訓(xùn)練問答模型,由未標(biāo)記文本來提升問答的表現(xiàn)。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    但我們會遇到幾個困難。首先,標(biāo)準(zhǔn)的半監(jiān)督學(xué)習(xí)(semi-supervised learning)方法在這里并不適用。我們比較一下半監(jiān)督學(xué)習(xí)的問答設(shè)置和標(biāo)準(zhǔn)設(shè)置,我們可以看到數(shù)據(jù)格式是不一樣的,例如標(biāo)記數(shù)據(jù)中,標(biāo)準(zhǔn)設(shè)置只有(x, y)兩項(xiàng),而問答設(shè)置則有段落、問題和答案三項(xiàng)。所以我們不能使用標(biāo)準(zhǔn)的半監(jiān)督學(xué)習(xí)算法,只能自己另開發(fā)出一種新的方法了。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    第二個困難是,我們只有少量的標(biāo)記數(shù)據(jù)可用,我們該如何利用未標(biāo)記的文本來提升問答模型的表現(xiàn)呢?

    半監(jiān)督問答模型

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    針對前面兩個問題,我們采用一種修改版的生成對抗網(wǎng)絡(luò)的方法來構(gòu)建一個半監(jiān)督問答模型。首先,我們從未標(biāo)記的文本出發(fā),我們使用NLP標(biāo)記以及一些規(guī)則從文本中生成可能的“答案”(answers)。我們應(yīng)該注意這里的標(biāo)記方式和規(guī)則是固定的。隨后我們會通過一個問題生成器利用“段落”和“答案”來自動生成“問題”。于是“段落”、“問題”和“答案”就可以視為一個“標(biāo)記”的數(shù)據(jù)組了。我們利用這個數(shù)據(jù)組來訓(xùn)練問答模型中的判別器。不過有幾個問題需要解決。首先我們注意到模型生成的數(shù)據(jù)組和人類注解數(shù)據(jù)組其分布是不一樣的。其次,我們該如何將生成器和判別器連接起來?

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    針對第一個問題,我們采用域標(biāo)記的方式來把模型生成的數(shù)據(jù)和人類生成的數(shù)據(jù)區(qū)分開來。我們用“true”標(biāo)簽來表示人類標(biāo)記數(shù)據(jù),用“fake”標(biāo)簽來表示未標(biāo)記數(shù)據(jù)(或模型生成數(shù)據(jù))。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    如何將生成器和判別器連接起來呢?我們使用自動編碼器將“段落”自動編碼成一個“01”序列,選為“答案”的部分則為“1”,否則為“0”。通過生成器生成“問題”,隨后產(chǎn)生的“答案”也將是“段落”中的“1”。通過比較前后兩次“答案”的序列的重合度將得到損失函數(shù)。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    這張圖顯示了我們?nèi)绾瓮ㄟ^生成對抗網(wǎng)絡(luò)來訓(xùn)練半監(jiān)督問答模型的。首先我們未標(biāo)記的“段落”和用生成器生成的“問題”來訓(xùn)練辨別器,注意這里用的域標(biāo)簽是“fake”。在右側(cè)的圖中,我們訓(xùn)練生成器,不過這里用“true”標(biāo)簽來替代“fake”標(biāo)簽,也即用人類標(biāo)記的“段落”和“問題”。這種結(jié)果對抗訓(xùn)練的結(jié)果可以用辨別器對問題答案判別的概率來測量。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    這是生成域?qū)咕W(wǎng)絡(luò)(GDAN)模型的數(shù)學(xué)公式。模型中,我們選用gated-attention reader來作為辨別器,用seq2seq模型來作為生成器。

    模型訓(xùn)練

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    在我們的GDAN模型中,如果訓(xùn)練沒有停止,那么首先我們固定生成器,通過域標(biāo)簽為“fake”的數(shù)據(jù),用最陡梯度下降法(SGD)來更新辨別器。另一方面,我們固定辨別器,通過域標(biāo)簽為“true”的數(shù)據(jù),用用增強(qiáng)學(xué)習(xí)法(Reinforce)和最陡梯度下降法來更新生成器。

    實(shí)驗(yàn)及結(jié)果分析

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    接下來,讓我們看一下試驗(yàn)。

    我們選取SQuAD的數(shù)據(jù)作為標(biāo)記數(shù)據(jù),取10%作為測試集。未標(biāo)記數(shù)據(jù)則來自Wikipedia,我們從Wikipedia上采集一百萬個“段落”,并生成五百萬的“答案”,這個量大概是SQuAD的50倍。我們選取四種模型作為對比,分別為SL(監(jiān)督學(xué)習(xí))、Context(使用附近單詞作為問題)、GAN(用GAN生成器訓(xùn)練)、AE(用自動編碼目標(biāo)訓(xùn)練)。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    這是我們試驗(yàn)的結(jié)果。第一列Labeling rate是我們標(biāo)記數(shù)據(jù)使用率。這里0.1,是使用了8000條標(biāo)記樣本。從中可以看到我們的模型無論是F1-score(測試精確度的一種測量)還是EM(Exact matching)上都優(yōu)于其他幾個模型。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    我們先來看與SL模型的對比。我們看到當(dāng)標(biāo)記數(shù)據(jù)使用率為0.1時,我們的模型F1-score要比SL模型高出10%,EM高出7%。當(dāng)數(shù)據(jù)使用率為0.2時,仍然能夠F1仍然高出7%,EM高出6%。所以我們的模型要遠(yuǎn)遠(yuǎn)優(yōu)于監(jiān)督學(xué)習(xí)模型。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    與其他幾種模型相比,精確度方面也有很大的提升。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    甚至,我們看,當(dāng)SL模型使用了0.2的數(shù)據(jù)時,其模型精度也沒有我們使用0.1數(shù)據(jù)時的精度高。所以我們的模型即使只使用一半的數(shù)據(jù),仍然比SL模型好。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    不過有一個問題是,當(dāng)標(biāo)記數(shù)據(jù)較為豐富時,想要通過增大未標(biāo)記數(shù)據(jù)的量很難提升模型的表現(xiàn)。我希望我們以后能解決這個問題。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    這張圖中展示的是生成的“問題”樣本,其中,“Ground truth question”是人工標(biāo)記的“問題”,“MLE”表示通過最大似然估計方法生成的“問題”,“RL”表示通過增強(qiáng)學(xué)習(xí)方法生成的“問題”。我們看到,相比于MLE方法生成的“問題”,RL方法生成的“問題”包含更多的信息,更少的“UNK”(unknown)標(biāo)識。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    在這里我們也會看到在生成的“問題”中包含著一些語法錯誤。不過我們要強(qiáng)調(diào),只要它能夠在QA模型中提升模型的表現(xiàn),出現(xiàn)這些語法錯誤并沒有關(guān)系。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    在這張圖上我們能更好地看到,隨著未標(biāo)記數(shù)據(jù)量的增加,生成問答對的訓(xùn)練損失函數(shù)將會迅速減下。當(dāng)數(shù)據(jù)量達(dá)到一定值后,損失函數(shù)下降就不怎么明顯了。另外,我們還可以看到RL方法要比MLE方法更優(yōu),這主要就是對抗訓(xùn)練的結(jié)果。

    結(jié)論

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    我們在此做一個總結(jié)。我們使用少量標(biāo)記問答數(shù)據(jù)和大量未標(biāo)記文本數(shù)據(jù)設(shè)計一個半監(jiān)督問答模型,這個模型使用了生成對抗模型,不同的是我們增加了域條件來進(jìn)行對抗增強(qiáng)訓(xùn)練。我們使用Wikipedia文本和SQuAD標(biāo)記數(shù)據(jù)來訓(xùn)練模型,我們的結(jié)果顯示在標(biāo)記數(shù)據(jù)較少的時候可以有高達(dá)10%的增益。

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    最后一張,這個網(wǎng)址里有我們所使用的數(shù)據(jù)。感興趣的話可以下載下來使用。謝謝大家!

    <完>

    雷鋒網(wǎng)AI 科技評論整理。

    論文下載:https://arxiv.org/pdf/1702.02206.pdf

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

    ACL論文分享:修改生成對抗網(wǎng)絡(luò),訓(xùn)練半監(jiān)督問答模型|分享總結(jié)

    分享:
    相關(guān)文章
    當(dāng)月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說
    主站蜘蛛池模板: 伊人久久综合热线大杳蕉| 久久精品国产一区二区三| 丰满少妇高潮在线观看| 亚洲精品92内射| 免费va国产在线观看| 天堂一区在线观看| 亚洲成片在线看一区二区| 91牛| 亚洲精品无码a| 91社网| 亚洲午夜伦费影视在线观看| 中国女人和老外的毛片| 国产成人午夜福利在线观看| 亚洲国产成人综合精品| 久9视频这里只有精品试看| 我国产码在线观看av哈哈哈网站| 欧美黄色网| 日韩欧美人妻一区二区三区| 亚洲高清中文字幕在线看不卡| 亚洲春色在线视频| 亚洲aaaaaa| 真实国产精品视频400部| 国产观看免费高清视频| 一级有乳奶水毛片免费| 四虎影视一区二区精品| 国产SUV精品一区二区88L| 欧美黑吊大战白妞| 精品 无码 国产观看| 久久亚洲精品11p| 亚洲VA久久久噜噜噜久久无码| 福利社午夜| 亚洲乱人伦中文字幕无码| 四川丰满少妇无套内谢| 精品无码人妻一区二区三区| 亚洲国产理论片在线播放| 久久国产免费直播| 日韩欧美亚洲综合久久影院| 中文无码AV一区二区三区| 日本无码中出| 精品国产中文字幕在线| 久久亚洲精品亚洲人av|