• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發(fā)私信給camel
    發(fā)送

    0

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    本文作者: camel 2019-10-20 08:03 專題:CNCC 2019
    導語:深挖洞,廣積糧!

    語音播放文章內容

    由深聲科技提供技術支持

    雷鋒網AI科技評論報道,2019年10月17日-19日,CNCC 2019在蘇州金雞湖國際會議中心舉辦,雷鋒網作為戰(zhàn)略合作媒體,對大會進行全程報道。

     數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    在18日上午的特邀報告中,數據挖掘領域巨擘美國伊利諾大學芝加哥分校俞士綸教授做了“Broad Learning:A New Perspective on Mining Big Data”(廣度學習:大數據挖掘的新視角)的分享。

    當前大家普遍對深度學習了解較多,而事實上對于數據我們不僅要挖得深,還需要挖得廣。例如對于網頁數據,深度學習能夠單獨學習文本數據或圖像數據等里面的特性。但是真實的網頁可能同時包含文本、圖片、音頻、鏈接等等的數據。

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    事實上,我們講的大數據并不是說所有數據都很大,只是整體很大而已。更多的情況是,我們擁有許多不同來源的(小)數據,它們之間相互有或多或少地聯系。如果能夠將這些不同的數據源整合在一起,那么我們將挖掘出更多有價值的信息。

    俞士綸教授認為,首先我們應當認同這樣一個觀點,即所有類型的數據都是可用的,換句話說就是沒有沒價值的數據。問題的關鍵就在于我們如何將這些數據融合在一起。那么如何做呢?這就需要「廣度學習」了。

    所謂「廣度學習」,俞士綸教授認為其本質就是如何將各種各樣的數據整合在一起,以獲取更多的信息。

    在采訪中,俞教授向AI科技評論強調說,廣度學習在研究上的側重點是數據,而深度學習的側重點則在于模型;換句話說深度學習的「深」是指對數據訓練的模型層數深;而廣度學習的「廣」是指我們訓練模型的數據類型廣。這兩個概念側重的點不同,但可以結合在同一個模型當中。

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    要做好「廣度學習」,俞教授認為需要以下三步:

    • 首先,定義并獲取相關的有用數據源,也即找到對你的問題有用的數據。

    • 其次,設計一種模型來將異質數據源信息融合起來。

    • 最后,基于模型整體的需求從各種數據源中深度地去挖掘信息。

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    而從具體的技術路線角度來看,俞士綸教授認為廣度學習的類型大致可以分為三類:

    • 首先是在同一個實體上有不同類型信息的學習。這種類型的廣度學習包括 Multi-view Learning、Multi-source Learning、Multi-model Learning 等。

    • 其次是在不同的但類型相似的實體上信息的學習。這包括 Transfer Learning。

    • 另外是在有復雜網絡類型關系的不同類型實體信息的學習。這包括基于融合的異質信息網絡(HIN)。

    對于廣度學習,最為關鍵的任務主要有兩個:信息融合和知識發(fā)現。因此對應的就有兩個基本的挑戰(zhàn),其一是發(fā)現什么數據是有用的,如何將這些數據融合在一起;其二就是要明白想要挖掘什么(并不是所有數據對特定的知識發(fā)現都有用),以及如何從融合的數據中挖掘出有用的知識。

    這有很多例子。

    例如藥物發(fā)掘。新藥上市通常很貴,原因在于研發(fā)新藥的成本非常高,發(fā)現一個新藥之前可能失敗成千上萬次。但如果我們能夠用大數據的技術來做預測,把那些不成功的案例刪除掉,那么就能夠在很大程度上降低新藥研發(fā)的成本。但是,決定一種藥物能否治療一種疾病,并不僅僅是看藥物的化學成分的;事實上,這需要很多種不同類型的信息或數據。例如基因信息、器官組織信息、藥物傳播臨床試驗信息等。傳統(tǒng)的數據挖掘方法僅僅能夠針對一種信息進行深度挖掘,但事實上若想要取得較好的效果,則需要將多種信息綜合起來。下面這張圖融合了多個不同數據之間的關系,這在本質上是一個異質網絡。

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    在這張圖上,可以定義所謂的Meta-Path,來表示兩個數據之間的關系:

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    比如兩個數據雖然不一樣,但相互有影響,那么就可以直接連在一起;兩個化學藥品,如果它們有相同的副作用,那么就可以說它們有關系。這種關聯可以幫我們來決定一個藥物是否可能有用。

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    再例如,在電影推薦中,傳統(tǒng)的方法往往只是根據用戶的打分信息進行推薦,但事實上用戶是否喜歡一部電影往往還取決于更多的因素,例如用戶的個人背景、用戶的朋友圈以及其他因素(例如電影是某個導演拍攝或某個演員主演等)都會影響用戶是否觀影以及觀影體驗。

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    類似于前面的例子,也可以采用相似的方法將不同的信息進行融合來提高推薦的準確性。

     數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    俞士汶教授認為,在大數據時代數據是最為寶貴的資源。對個人和企業(yè)來講,對大數據的挖掘將是一次顛覆性的機會;大數據有四個「V」,所以對大數據的挖掘同時也是一種挑戰(zhàn)。俞教授在報告中則主要是解決大數據的Variety,也即通過融合異質數據源來進行廣度學習。真實生活中的數據一般都不是只有一個數據源,而是要融合多個數據源才行。因此有效的學習應當同時需要廣度和深度。

    雷鋒網報道。

    雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知

    數據挖掘巨擘俞士綸:真實數據源不止一個,學習不僅要有深度還要有廣度 | CNCC 2019

    分享:
    相關文章
    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 2021国内精品久久久久精免费| 国产精品一码在线播放| 无码人妻AⅤ一区二区三区三级| 人妻少妇嫩草AV无码| 日韩视频a| 国外少妇视频网站| 在线观看日韩亚洲综合| 国产制服丝袜在线播放| 亚洲AV中文| 亚洲免费一区二区三区视频| 亚洲AV成人片不卡无码| 野花社区www高清视频| 成年女人永久免费观看视频| 九九九999热想热视频| 蜜臀av一区二区精品字幕| 天堂无码久久| 国产免费AV片无码永久免费| 国产国产人免费人成免费| 极品人妻少妇一区二区三区| 姝姝窝人体色WWW在线观看| 日韩午夜福利视频在线观看| 久久亚洲AV成人网站玖玖| av无码中出一区二区三区| 96精品专区国产在线观看高清| 国产欧美日韩综合精品二区| 另类专区一区二区三区| 欧美精品黑人粗大| 久热精品免费在线视频| 黄又色又污又爽又高潮| 免费播放在线观看av| 蜜桃网址| 影音先锋啪啪av资源网站| 欧美3p两根一起进高清免费视频| 国产成年无码久久久久下载 | 久久波多野结衣av| 中文字幕精品久久久久人妻红杏1| 亚洲色天| 国产普通话刺激视频在线播放| 无码人妻斩一区二区三区| 97青草香蕉依人在线播放| 亚洲欧美日韩高清一区|