• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給楊曉凡
    發送

    0

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    本文作者: 楊曉凡 2017-10-31 09:57
    導語:模仿人類語言的生成思路帶來良好的結果

    雷鋒網 AI 科技評論按:文本生成是自然語言處理NLP領域的重要問題,許多知名學者都提出了自己的方法,改善現階段文本生成中豐富性不足、句法語意不自然、長句生成困難等問題,比如不久之前我們做過報道的上海交通大學俞勇、張偉楠聯合UCL汪軍發表的“LeakGAN”、Percy Liang的ICML2017最佳論文「Understanding Black-box Predictions via Influence Functions」。

    Percy Liang是NLP領域的著名研究者,師從Michael I. Jordan,現為斯坦福大學教授;除了論文得到廣泛認可之外,Percy Liang還拿下了 IJCAI 2016 計算機和思想獎(Computers and Thought Award)。

    近期,Percy Liang團隊的一篇新論文提出了一種新的文本生成新方法,「Generating Sentences by Editing Prototypes」(用修改草稿的方式生成句子),這個方法不僅符合直覺,生成的效果也非常好,引起了很多研究者的注意和贊譽。以下雷鋒網 AI 科技評論對這篇論文做簡單介紹。

    論文內容

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽


    這篇論文中提出了一種新的句子生成模型。它首先從樣本語料庫中隨機采樣一個句子作為“草稿”(論文中prototype),然后再把這個草稿編輯為一個新的句子(如下圖)

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    此前表現較好的系統大多數都是基于循環神經語言模型(NLM)的,它們“從零開始”生成句子,順序往往從左到右。這類模型中很容易觀察到生成通用化應答的問題,比如“我不知道”這樣。為了提高生成文本的豐富性,目前采用的比較直白的策略都會導致語法準確性的降低,表明目前的NLM模型可能并不具備對復雜應答的各種可能性做完全表征的能力。

    論文作者們由此想到了人類寫作時常常有先打草稿、再逐漸把它修改為一篇精美文章的做法,由此提出了文中的模型。模型首先會從訓練語料庫中隨機采樣一個草稿句子,然后激活一個神經網絡編輯器;這個編輯器會生成隨機的“編輯向量”,然后根據編輯向量對草稿句子做條件編輯,從而生成新的句子。

    這個思路的出發點在于,語料庫中的句子提供了一個高質量的起點:它們語法正確,天然地具有復雜性,而且不會對長短和模糊性有任何偏好。編輯器中的注意力機制就會從草稿中提取出豐富的文本信息,然后把它泛化為新的句子。

    模型的訓練方式是最大化估計生成模型的對數最大似然。這個目標函數是訓練集中具有相似詞法的句子對的和,從而可以用局部敏感哈希(Locality Sensitive Hashing)做量化估計。論文中同時用實證方法表明,多數詞法相同的句子同時在語義上也是相似的,這樣給神經編輯器的語義結構方面帶來了額外的益處。比如,作者們可以讓一個神經編輯器從一個種子句子出發,探索很大一片語義空間。

    作者們從兩個方面對比了這個“先打草稿再優化”的模型和以往從零生成的模型:語言生成質量以及語義屬性。對于語言生成質量,人類評價者給論文中的模型打了更好的分數,在Yelp語料庫上把復雜度(perplexity)提升了13分,在One Billion Word Benchmark中提升了7分。對于語義屬性,論文中表明隱編輯向量在語義相似性、局部控制文本生成和句子模擬任務中優于標準的句子可變編碼器。

    下圖是一組草稿句子和修改后句子的對比,有顯著的不同,并且保持了高質量

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    社交網絡上的評價

    論文公布并經過轉推擴散開來后,許多研究者都在推特上表示了對這篇論文的認可

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    (Percy Liang實驗室帶來的聰明的句子生成方法:從語料庫中的例子開始,學習加上有模有樣的變化)

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    (下面網友說:“這看起來很像我學英語的方法”)

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    更多論文細節請閱讀原文 https://arxiv.org/abs/1709.08878 

    雷鋒網 AI 科技評論編譯

    相關文章:

    如何讓對抗網絡GAN生成更高質量的文本?LeakGAN現身說法:“對抗中,你可能需要一個間諜!”

    強化學習在生成對抗網絡文本生成中扮演的角色(Role of RL in Text Generation by GAN)(下)

    強化學習在生成對抗網絡文本生成中扮演的角色(Role of RL in Text Generation by GAN)(上)

    《安娜卡列尼娜》文本生成——利用 TensorFlow 構建 LSTM 模型

    先打草稿可以生成更高質量的文本,Percy Liang新論文廣受贊譽

    分享:
    相關文章

    讀論文為生

    日常笑點滴,學術死腦筋
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 中文精品久久久久中文| 国产乱妇无码毛片A片在线看下载 中韩日电影在线看完整 | 色欲综合久久中文字幕网| 97色色资源总站| 亚洲精品综合网二三区| www插插插无码免费视频网站| 成人国内精品久久久久一区| 9l精品人妻中文字幕色| 农村欧美丰满熟妇xxxx| 国产精品一区二区婷婷| 国产精品自在欧美一区| 亚洲国产高清在线视频| 老司机亚洲精品一区二区| 国产精品亚洲精品日韩已方| 最新91精品国产手机| 成人做受120秒试看试看视频| 探花av| WWWW狠狠操夜夜操天天操| 国产成人午夜福利院| 国产av熟女一区二区三区| 日韩欧美人妻一区二区三区| av无码av在线a∨天堂app| 久久99热只有频精品8| 丁香婷婷久久| 竹菊影视欧美日韩一区二区三区四区五区 | 免费 黄 色 人成 视频 在 线| 亚洲av午夜福利大精品| 激情一区二区三区视频| 中文无码日| 国产精品天天看天天狠| 丰满少妇影音| 亚洲日韩AV无码一区二区三区人 | 国产精品福利一区二区在线播放| 日韩高清无码电影网| 春色校园综合人妻av| 亚洲丰满老熟女激情av| 久久精品国产精品亚洲毛片| av一区二区三区入口| 久久99国产乱子伦精品免费| 亚洲中文字幕人妻系列| 亚洲一人综合|