• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給楊曉凡
    發送

    0

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    本文作者: 楊曉凡 2017-10-31 09:57
    導語:模仿人類語言的生成思路帶來良好的結果

    雷鋒網 AI 科技評論按:文本生成是自然語言處理NLP領域的重要問題,許多知名學者都提出了自己的方法,改善現階段文本生成中豐富性不足、句法語意不自然、長句生成困難等問題,比如不久之前我們做過報道的上海交通大學俞勇、張偉楠聯合UCL汪軍發表的“LeakGAN”、Percy Liang的ICML2017最佳論文「Understanding Black-box Predictions via Influence Functions」。

    Percy Liang是NLP領域的著名研究者,師從Michael I. Jordan,現為斯坦福大學教授;除了論文得到廣泛認可之外,Percy Liang還拿下了 IJCAI 2016 計算機和思想獎(Computers and Thought Award)。

    近期,Percy Liang團隊的一篇新論文提出了一種新的文本生成新方法,「Generating Sentences by Editing Prototypes」(用修改草稿的方式生成句子),這個方法不僅符合直覺,生成的效果也非常好,引起了很多研究者的注意和贊譽。以下雷鋒網 AI 科技評論對這篇論文做簡單介紹。

    論文內容

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽


    這篇論文中提出了一種新的句子生成模型。它首先從樣本語料庫中隨機采樣一個句子作為“草稿”(論文中prototype),然后再把這個草稿編輯為一個新的句子(如下圖)

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    此前表現較好的系統大多數都是基于循環神經語言模型(NLM)的,它們“從零開始”生成句子,順序往往從左到右。這類模型中很容易觀察到生成通用化應答的問題,比如“我不知道”這樣。為了提高生成文本的豐富性,目前采用的比較直白的策略都會導致語法準確性的降低,表明目前的NLM模型可能并不具備對復雜應答的各種可能性做完全表征的能力。

    論文作者們由此想到了人類寫作時常常有先打草稿、再逐漸把它修改為一篇精美文章的做法,由此提出了文中的模型。模型首先會從訓練語料庫中隨機采樣一個草稿句子,然后激活一個神經網絡編輯器;這個編輯器會生成隨機的“編輯向量”,然后根據編輯向量對草稿句子做條件編輯,從而生成新的句子。

    這個思路的出發點在于,語料庫中的句子提供了一個高質量的起點:它們語法正確,天然地具有復雜性,而且不會對長短和模糊性有任何偏好。編輯器中的注意力機制就會從草稿中提取出豐富的文本信息,然后把它泛化為新的句子。

    模型的訓練方式是最大化估計生成模型的對數最大似然。這個目標函數是訓練集中具有相似詞法的句子對的和,從而可以用局部敏感哈希(Locality Sensitive Hashing)做量化估計。論文中同時用實證方法表明,多數詞法相同的句子同時在語義上也是相似的,這樣給神經編輯器的語義結構方面帶來了額外的益處。比如,作者們可以讓一個神經編輯器從一個種子句子出發,探索很大一片語義空間。

    作者們從兩個方面對比了這個“先打草稿再優化”的模型和以往從零生成的模型:語言生成質量以及語義屬性。對于語言生成質量,人類評價者給論文中的模型打了更好的分數,在Yelp語料庫上把復雜度(perplexity)提升了13分,在One Billion Word Benchmark中提升了7分。對于語義屬性,論文中表明隱編輯向量在語義相似性、局部控制文本生成和句子模擬任務中優于標準的句子可變編碼器。

    下圖是一組草稿句子和修改后句子的對比,有顯著的不同,并且保持了高質量

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    社交網絡上的評價

    論文公布并經過轉推擴散開來后,許多研究者都在推特上表示了對這篇論文的認可

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    (Percy Liang實驗室帶來的聰明的句子生成方法:從語料庫中的例子開始,學習加上有模有樣的變化)

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    (下面網友說:“這看起來很像我學英語的方法”)

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    更多論文細節請閱讀原文 https://arxiv.org/abs/1709.08878 

    雷鋒網 AI 科技評論編譯

    相關文章:

    如何讓對抗網絡GAN生成更高質量的文本?LeakGAN現身說法:“對抗中,你可能需要一個間諜!”

    強化學習在生成對抗網絡文本生成中扮演的角色(Role of RL in Text Generation by GAN)(下)

    強化學習在生成對抗網絡文本生成中扮演的角色(Role of RL in Text Generation by GAN)(上)

    《安娜卡列尼娜》文本生成——利用 TensorFlow 構建 LSTM 模型

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    分享:
    相關文章

    讀論文為生

    日常笑點滴,學術死腦筋
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 色yeye免费视频免费播放| 噜噜爱蜜芽色爱爱| 亚洲成人高清av在线| 日韩欧美2| 欧美自拍嘿咻内射在线观看| 狠狠干| 欧美黑人一区| 人妻精品久久久久中文字幕86| 日韩精品一区二区三区中文9| 日韩人妻熟女中文网| 99久久激情国产精品| 精品国产成人国产在线观看| 亚洲 中文 欧美 日韩 在线| 亚洲最大AV在线观看| 国产精品涩涩涩视频网站| 国产老头多毛Gay老年男| 国产九九| 亚洲中文字幕人妻系列| 狠狠撸| AVtt手机版天堂网国产| 日本熟妇XXXX潮喷视频| 中文字幕有码高清日韩| 少妇人妻综合久久中文字幕| 西西午夜无码大胆啪啪国模| 国产视频网| 久久人人97超碰精品| 国产精品久久一区二区三区| 亚洲AV无一区二区三区久久| 国产蜜臀在线一区二区三区| 亚洲国产精品中文字幕日韩| 久久精品中文字幕有码| 国产精品18久久久久久麻辣 | 国产成人一区二区三区视频免费| 中文字幕乱码中文乱码毛片| 中文字幕精品一区二区年下载| 亚洲中文字幕毛片在线播放| 亚洲成综合人在线播放| 亚洲欧美v国产蜜芽tv| 久久热这里只有精品国产| 深夜av在线| 亚洲老妈激情一区二区三区|