• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能學(xué)術(shù) 正文
    發(fā)私信給叢末
    發(fā)送

    0

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    本文作者: 叢末 2020-01-03 10:58
    導(dǎo)語(yǔ):作者 | 劉宇宸、張家俊本文對(duì)中科院宗成慶、張家俊團(tuán)隊(duì)完成、被 AAAI-20 錄用的口頭報(bào)告論文《Synchronous Speech Recognition

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    作者 | 劉宇宸、張家俊

    本文對(duì)中科院宗成慶、張家俊團(tuán)隊(duì)完成、被 AAAI-20 錄用的口頭報(bào)告論文《Synchronous Speech Recognition and Speech-to-Text Translation with Interactive Decoding》進(jìn)行解讀。

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    語(yǔ)音翻譯技術(shù)是指利用計(jì)算機(jī)實(shí)現(xiàn)從一種語(yǔ)言的語(yǔ)音到另外一種語(yǔ)言的語(yǔ)音或文本的自動(dòng)翻譯過(guò)程。該技術(shù)可以廣泛應(yīng)用于會(huì)議演講、商業(yè)會(huì)談、跨境客服、出國(guó)旅游等各個(gè)領(lǐng)域和場(chǎng)景,具有重要的研究?jī)r(jià)值和廣闊的應(yīng)用前景。

    近年來(lái),隨著人工智能技術(shù)在語(yǔ)音、翻譯等相關(guān)領(lǐng)域的蓬勃發(fā)展,語(yǔ)音翻譯技術(shù)逐漸成為學(xué)術(shù)界和企業(yè)界競(jìng)相研究的熱點(diǎn)。當(dāng)前的語(yǔ)音翻譯系統(tǒng)通常由語(yǔ)音識(shí)別、機(jī)器翻譯和語(yǔ)音合成等多個(gè)模塊串聯(lián)組成,方法簡(jiǎn)單,但面臨著噪聲容錯(cuò)、斷句標(biāo)點(diǎn)、時(shí)間延遲等一系列技術(shù)難題。

    端到端的語(yǔ)音翻譯模型在理論上可以緩解級(jí)聯(lián)系統(tǒng)的缺陷,它通過(guò)直接建立源語(yǔ)言語(yǔ)音到目標(biāo)語(yǔ)言文本的映射關(guān)系,一步實(shí)現(xiàn)跨模態(tài)跨語(yǔ)言的翻譯,一旦技術(shù)成熟,理論上可以讓語(yǔ)音翻譯更準(zhǔn)更快,極大地提升模型的性能。我們發(fā)現(xiàn)語(yǔ)音識(shí)別和語(yǔ)音翻譯兩個(gè)任務(wù)是相輔相成的。

    如圖1所示,

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    圖1語(yǔ)音識(shí)別和語(yǔ)音翻譯交互示例相比于直接將原始語(yǔ)音作為輸入,如果能夠動(dòng)態(tài)獲取到識(shí)別出的文本信息,語(yǔ)音翻譯將變得更加容易;而翻譯出的結(jié)果也有助于同音詞識(shí)別的消歧,使識(shí)別結(jié)果更加準(zhǔn)確。因此,我們希望設(shè)計(jì)一種交互式的模型,讓語(yǔ)音識(shí)別與語(yǔ)音翻譯兩個(gè)任務(wù)可以動(dòng)態(tài)交互學(xué)習(xí),實(shí)現(xiàn)知識(shí)的共享和傳遞。

    方  法

    針對(duì)上述問(wèn)題,中科院自動(dòng)化所自然語(yǔ)言處理組博士生劉宇宸、張家俊研究員、宗成慶研究員和百度公司合作提出了一種基于交互式解碼的同步語(yǔ)音識(shí)別與語(yǔ)音翻譯模型。

    如圖2所示,

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    圖 2 基于交互式解碼的同步語(yǔ)音識(shí)別與語(yǔ)音翻譯

    我們使用基于自注意力機(jī)制的Transformer模型作為主框架,語(yǔ)音識(shí)別任務(wù)和語(yǔ)音翻譯解碼任務(wù)共享同一個(gè)編碼器,在解碼器中加入一個(gè)交互注意力機(jī)制層,實(shí)現(xiàn)兩個(gè)任務(wù)的知識(shí)交互和傳遞。

    如圖3所示,

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    圖3 交互注意力機(jī)制層

    交互注意力機(jī)制層包含一個(gè)自注意力模塊和一個(gè)跨任務(wù)注意力模塊。其中前者用于提取當(dāng)前任務(wù)輸出端的特征表示,后者用于提取另一個(gè)任務(wù)輸出端的特征表示,兩者通過(guò)一個(gè)線性插值函數(shù)融合得到包含兩個(gè)任務(wù)信息的特征表示。

    在訓(xùn)練階段,兩個(gè)任務(wù)同時(shí)優(yōu)化;在解碼階段,兩個(gè)任務(wù)同步進(jìn)行。如此,在預(yù)測(cè)下一個(gè)詞的過(guò)程中既可以用到當(dāng)前任務(wù)的已生成的詞語(yǔ),也可以利用到另一個(gè)任務(wù)上已生成的詞語(yǔ)。為了進(jìn)一步提升語(yǔ)音翻譯的性能,我們采用了一種wait-k的方法,使得語(yǔ)音翻譯任務(wù)相比語(yǔ)音識(shí)別任務(wù)延遲k個(gè)詞語(yǔ)進(jìn)行,以獲得更多更可靠的文本信息作為輔助。

    實(shí)驗(yàn)結(jié)果

    目前語(yǔ)音翻譯數(shù)據(jù)十分匱乏且質(zhì)量不高,為此我們構(gòu)建了一個(gè)新的語(yǔ)音翻譯數(shù)據(jù)集。我們從TED網(wǎng)站上爬取了視頻和字幕文件,從中提取出音頻、英文字幕和多語(yǔ)言翻譯字幕,得到了語(yǔ)音、識(shí)別文本、翻譯文本的對(duì)齊語(yǔ)料。這里使用了英德、英法、英中、英日四種語(yǔ)言,前兩種屬于較為相似的語(yǔ)言對(duì),后兩種是不相似的語(yǔ)言對(duì)。

    語(yǔ)音識(shí)別和語(yǔ)音翻譯的結(jié)果分別使用詞錯(cuò)誤率(WER)和BLEU進(jìn)行衡量。我們與多個(gè)強(qiáng)基線模型進(jìn)行了對(duì)比,包括由語(yǔ)音識(shí)別和機(jī)器翻譯模型串聯(lián)組成的級(jí)聯(lián)系統(tǒng)(Pipeline),在語(yǔ)音識(shí)別語(yǔ)料上進(jìn)行預(yù)訓(xùn)練的端到端語(yǔ)音翻譯模型(E2E),語(yǔ)音識(shí)別和語(yǔ)音翻譯共享編碼器的多任務(wù)模型(Multi-task),以及一個(gè)兩階段模型(Two-stage)(第一階段解碼器用于獲取識(shí)別文本的中間表示,第二階段解碼器基于編碼器的表示和第一階段解碼器的中間表示生成對(duì)應(yīng)的翻譯)。

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    表1不同模型在多個(gè)語(yǔ)言對(duì)上的實(shí)驗(yàn)結(jié)果

    表1給出了不同模型在英德、英法、英中、英日不同語(yǔ)言對(duì)上的識(shí)別和翻譯效果。可以看出在大多數(shù)情況下,基于交互式解碼的同步語(yǔ)言識(shí)別與語(yǔ)音翻譯模型的性能表現(xiàn)不管在語(yǔ)音識(shí)別任務(wù)還是語(yǔ)音翻譯任務(wù)上都要顯著高于預(yù)訓(xùn)練的端到端模型、多任務(wù)模型和兩階段模型。在相似的語(yǔ)言對(duì)上基于交互式解碼的模型可以超越級(jí)聯(lián)系統(tǒng),在不相似的語(yǔ)言對(duì)上也與級(jí)聯(lián)系統(tǒng)可比。值得注意的是之前端到端的語(yǔ)音翻譯模型幾乎都很難達(dá)到級(jí)聯(lián)系統(tǒng)的性能。

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    表2 wait-k對(duì)翻譯性能的影響

    為了進(jìn)一步提升語(yǔ)音翻譯的性能,我們讓語(yǔ)音翻譯任務(wù)相比語(yǔ)音識(shí)別任務(wù)延遲k個(gè)詞語(yǔ)進(jìn)行,以獲得更多的文本信息作為輔助。表2給出了在開(kāi)發(fā)集和測(cè)試集上不同的延遲詞語(yǔ)數(shù)對(duì)于模型性能的影響。可以看出,雖然延遲詞語(yǔ)會(huì)輕微影響識(shí)別任務(wù)的表現(xiàn),但是語(yǔ)音翻譯任務(wù)的性能可以得到提升。

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    表3 模型參數(shù)、訓(xùn)練速度和解碼速度

    我們也對(duì)比了不同模型的參數(shù)量、訓(xùn)練和解碼速率。表3給出了模型的參數(shù)量大小、每秒的訓(xùn)練步數(shù)和每秒的解碼句子數(shù)。可以看出,我們的模型較好的平衡了參數(shù)量和解碼速率,相比級(jí)聯(lián)系統(tǒng),參數(shù)量獲得的大幅降低;訓(xùn)練和解碼速率顯著低于兩階段模型;雖然解碼速率略低于預(yù)訓(xùn)練端到端模型和多任務(wù)模型,但是我們的方法可以實(shí)現(xiàn)兩個(gè)任務(wù)的同步解碼。

    相關(guān)細(xì)節(jié)可參考發(fā)表于人工智能頂級(jí)學(xué)術(shù)會(huì)議AAAI2020的論文:

    Yuchen Liu, Jiajun Zhang,Hao Xiong, Long Zhou, Zhongjun He, Hua Wu, Haifeng Wang, and Chengqing Zong.Synchronous Speech Recognition and Speech-to-Text Translation with InteractiveDecoding. AAAI-2020. (available on https://arxiv.org/abs/1912.07240)

    Youtube上也有學(xué)者介紹我們的工作:https://www.youtube.com/watch?v=ZgbUBmVFcBc

    雷鋒網(wǎng) AI 科技評(píng)論報(bào)道   雷鋒網(wǎng)雷鋒網(wǎng)

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

    AAAI 2020 | 中科院自動(dòng)化所:通過(guò)識(shí)別和翻譯交互打造更優(yōu)的語(yǔ)音翻譯模型

    分享:
    相關(guān)文章
    最新文章
    請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
    姓名
    電話(huà)
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說(shuō)
    主站蜘蛛池模板: 亚洲欧美日产综合一区二区三区| 久久九九青青国产精品| 久久精品国产99精品国产2021| 日韩有码中文字幕av| 中文字幕无码乱码人妻日韩精品| 久久亚洲午夜牛牛影视| 亚洲69视频| 免费的特黄特色大片| 国产精品禁18久久久夂久 | 亚洲色大成网站WWW久久| 97人人干| 国产精品亚| 亚洲激情图| 久久久久青草线综合超碰| 91精品亚洲一区二区三区| 日日碰狠狠躁久久躁| 国产成人综合亚洲网| 人人网aV| 国产精品自拍视频第一页| 免费国产va| 克东县| 亚洲另类激情综合偷自拍图| 青青青久热国产精品视频| 亚州人妻中文| 闸北区| 97porm国内自拍视频| 真实国产熟睡乱子伦视频| 黄色www| 国产精品久久无码一区二区三区网| 国产AV天堂亚洲国产AV天堂| 女同性恋一区二区三区视频| 国产精品一区av在线观看| 少妇下面好爽一区二区三区网站 | 人妻av无码系列一区二区三区| 乱色精品无码一区二区国产盗| 欧亚无码av一区二区| 丰满人妻熟妇乱又伦精品视频三| 国产精品人妻中文字幕| 日韩AV高清在线看片| 国产精品视频一区二区不卡 | 无码久久精品人妻一区二区三区|