• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業界 正文
    發私信給楊麗
    發送

    0

    讓米粉為之瘋狂的聲音克隆技術:深聲科技如何用90秒錄音克隆出你的聲音?

    本文作者: 楊麗 2020-03-18 16:32
    導語:聲音,正成為消除人與機器之間隔閡的關鍵。

    “通過克隆,把自己心愛之人的聲音永久珍藏……這可能就是科技應該有的溫度吧。”

    與小米的最近一次合作中,深聲科技為其提供了聲音克隆技術,應用在其最新發布的小愛同學定制聲音功能上,能讓米粉合成自己的、甚至是父母、兒女、戀人的聲音,同時還支持音色分享功能。比如,明星將自己音色分享給粉絲后,就能通過聲音實現明星和粉絲的“常相伴”。

    讓米粉為之瘋狂的聲音克隆技術:深聲科技如何用90秒錄音克隆出你的聲音?

    智能語音助手這個頗具想象力的AI應用,正逐漸成為智能終端的基礎功能,包括智能手機、智能家居、車載、陪伴機器人等,其普及率有了較大提升,而聲音克隆技術的應用,很可能會加速整個進程。

    說到聲音克隆技術,并非深聲科技所獨有的,但與競爭對手相比,深聲科技CEO周俊明表示:“聲音克隆技術上,我們在音色還原度、發音準確率、音質清晰度等方面,具有明顯的優勢,手機語音助手是我們首個落地場景。” 

    聲音克隆面臨哪些技術挑戰?

    2020年1月中旬,深聲科技聲音克隆產品正式上線。在此期間,深聲團隊在眾多競爭者中成功拿下了小米方的需求標的。作為與小米小愛同學的一次深度合作,深聲科技將為之提供聲音克隆核心技術支持。

    包括雙方的需求對接、內部評估,再到交付,前后用了1個多月時間。

    與傳統語音合成相比,聲音克隆面臨更大的技術挑戰。首先,聲音克隆需要C端用戶配合錄音,就不能對其錄音環境和設備有過分要求。

    我們會建議用戶選擇一個盡可能安靜的地方,使用手機完成錄音過程。 

    其次,考慮用戶的體驗,需要盡可能縮短錄音的時長。

    這就對我們有很高的要求,傳統的語音合成需要幾十分鐘到幾個小時的語音數據,相比之下,聲音克隆的數據量少,對聲學模型的訓練有更高的要求,比如發音模糊、發錯音、音素覆蓋等一系列問題。當然,最重要的還是音色還原度的問題。

    現在,用戶只需配合朗讀20句話短文本,大約錄音90秒的語音數據,就能快速克隆出自己的聲音,將個人的情感表達、發音特點等信息遷移到合成聲音中,就連口音也能很好地克隆出來。

    再次,在實際應用中,還要考慮海量用戶發起聲音克隆請求的高并發問題。為了節約成本,提升用戶體驗,就要解決模型切換、模型并發數,以及合成延遲等一系列挑戰。

    海量用戶對聲音克隆的頻繁調用時,模型間的切換邏輯非常重要。

    最后,因為采集到的用戶數據會上傳到服務器進行模型訓練,考慮到用戶隱私安全的保護,團隊提供了私有化部署的方案,以確保用戶數據不外泄。

    是否迎來大規模商業化? 

    過去一段時間,百度、訊飛、搜狗等公司也曾推出聲音克隆服務,但似乎并未贏得用戶市場的關注。為什么深聲科技此次聲音克隆技術的上線,會在用戶市場引起如此大的反響呢?

    周俊明表示,聲音克隆大規模商業化需要具備幾個條件:

    一是克隆的聲音有較高的音色還原度,跟真人聲音無差異;

    二是用戶使用門檻不能太高,例如錄音條件、發音標準等不能有太高要求;

    三是對計算資源的消耗,需要具備個人都能用得起的基礎;

    四是具備創造出真正的價值,能夠提升人們的生活品質。

    從這個角度來講,深聲科技與小米的合作開始,就已經具備了將聲音克隆技術大規模商業化的能力。

    在談到與普通語音合成的差異時,周俊明表示:

    普通語音合成,解決的是如何將語音內容很好地傳遞出去、更容易地被接收的問題。而聲音克隆,體現了用戶的社會屬性,能夠讓用戶通過聲音來服務于他人。這就意味著,每個人的聲音的價值能夠得到充分體現,在包括親子互動、情感陪伴、泛娛樂在內的各種場景中具有巨大的應用價值。

    讓米粉為之瘋狂的聲音克隆技術:深聲科技如何用90秒錄音克隆出你的聲音?

    安全問題如何解決?

    將聲音克隆引入智能語音助手,會不會引發更多語音詐騙案件的發生?

    目前可能普通存在這樣的擔憂:合成技術的水平發展越高,合成語音與人聲的差異就越小,技術鑒定的難度就越大。對此,周俊明也指出,

    不必過度擔心。問題在于人耳的敏感度不夠高,才會對克隆聲音沒有發覺。但應用技術手段進行區分還是毫無壓力的,克隆出來的聲音在語譜圖中跟真人的聲音有明顯區別,克隆聲音中的很多特征信息已經丟失了。

    作為技術服務的輸出方,深聲科技也十分關注如何規避這項技術的非法應用,在推出之前就考慮了到法律倫理的問題,并給出了三點應對方案:

    • 一是將聲音克隆能力只授權給那些有控制能力的企業客戶,對于C端用戶來講,只有選擇音色的權限,沒有自定義克隆聲音內容的權限;

    • 二是加強對內容安全的嚴格審核。不支持用戶用隨意一段語音進行克隆,要求用戶對指定文本進行錄音,從而降低聲音被利用的風險;

    • 三是通過身份認證、結合生物識別等技術,以限制聲音克隆的使用。

    關于深聲

    深聲科技是一家專注于“智能語音”技術研發和業務落地的人工智能公司,于2018年在廣州天河成立。深聲科技擁有一支頂級的人工智能技術團隊,自主研發了行業領先的語音合成、聲音定制、聲音克隆等語音AI技術。

    深聲的語音AI技術已在眾多場景中落地,包括語音助手、智能客服、有聲閱讀、車載語音、AI教育、動漫等。深聲提供的“文字轉語音”技術服務,支持的語言也從中文、英文,逐步擴展到了國內方言和海外語種。除了持續不斷的技術突破,深聲的語音數據制作效率也有了大幅度提升,比如三天交付客戶專屬定制聲音, 兩個月支持一門新語種。

    讓聲音服務好每個人的生活,深聲致力于將語音AI技術融入人們生活的點滴之中,賦予企業和用戶以創新與科技力量來創造更美好的世界。

    對深聲科技智能語音技術感興趣的讀者,可前往深聲科技的官網http://www.deepsound.cn/ 或微信小程序“深聲AI”親身體驗。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章

    高級主筆

    關注企業軟件、操作系統、云原生(PaaS)、數據中臺 | 微信:leeyangamber
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 国产成人无码精品久久久露脸 | 黑丝足交在线| 99热国产这里只有精品9| 国产私拍大尺度在线视频| 久久亚洲人成网站| 日韩一区二区大尺度在线| 播放灌醉水嫩大学生国内精品| 97精品人妻系列无码人妻老牛| 在线观看成人av天堂不卡| 91老肥熟女九色老女人| 久久久精品人妻一区二区三区日本 | 国产互换人妻xxxx69| 国产无套白浆一区二区| 国产一区二区三区最新视频| 中日韩精品视频一区二区三区 | 国产精品一区二区久久精品无码| www.97| 一本色道久久综无码人A片| 成人特黄A级毛片免费视频| 久久精品国产亚洲夜色AV网站| 欧洲一区二区| 国产精品成人av电影不卡| 日本成人在线视频网站| 国产亚洲制服免视频| 国产性色的免费视频网站| 国产精品无码久久综合网| 色哟哟精品无码网站在线播放视频| 4虎四虎永久在线精品免费| 激情五月开心婷婷深爱| 日韩欧美高清dvd碟片| 日屄视频在线观看| www.jizzjizz| 日韩人妻无码精品专区综合网| 国产成人一区在线播放| 久久精品国产亚洲AV品善| 国产成人精品无人区一区| 巨熟乳波霸若妻在线播放| 国产?无码?天天干| 2019国产精品青青草原| 超碰在线91| 亚洲人成亚洲人成在线观看|