• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能學術 正文
    發私信給camel
    發送

    0

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    本文作者: camel 2019-11-06 19:36
    導語:無結構數據->有結構數據->有用的知識

    語音播放文章內容

    由深聲科技提供技術支持

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    雷鋒網 AI 科技評論按:這幾日,對于許多數據挖掘領域的研究者來說,北京是一個關注的焦點,原因無他,作為數據挖掘領域的兩大頂會CIKM 2019和ICDM 2019相繼在北京召開,甚至連開會地點(國家會議中心)都沒有變化。

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    兩個會議同為CCF B類,其區別在于前者是ACM舉辦,而后者是IEEE舉辦;此外CIKM覆蓋范圍更廣,包括了數據庫、信息檢索和數據挖掘三個領域,而ICDM則更為專注數據挖掘。

    在兩次會議中,數據挖掘領域的巨擘韓家煒教授將就其研究分別做主題為《From Unstructured Text to TextCube: Automated Construction and Multidimensional Exploration》(@CIKM2019)和《Embedding-Based Text Mining: A Frontier in Data Mining》(@ICDM2019)的報告。

    現實世界中的大數據在很大程度上是非結構化的、互聯的和動態的,且以自然語言文本的形式出現,將此類龐大的非結構化數據轉換為有用的知識是一條必由之路。目前大家普遍采用勞動密集型的方法對數據進行打標簽從而提取知識,這種方法短時來看可取,但卻無法進行擴展,特別是許多企業的文本數據是高度動態且領域相關。

    韓家煒教授認為,大量的文本數據本身就隱含了大量的隱模式、結構和知識,因此我們可以借助domain-independent 和 domain-dependent的知識庫,來探索如何將海量數據從非結構化的數據轉化為結構化的知識。

    如下圖所示,是韓家煒教授及其學生在過去以及未來研究的主線:

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    韓家煒認為要想將現有的無結構的大數據變成有用的知識,首先要做的就是將數據結構化。他提出兩種結構化數據的形式,一種是異質網絡(Heterogeneous Network),另一種是多維文本立方體(Multi-dimensional Text Cube)。由這種結構化數據生成知識已經證明是很強大的,但是如何將原始無結構的數據變成有結構的數據(Network 或 Text Cube)則是非常困難的。

    在 Network/Text Cube 到 Knowledge 的問題上,韓家煒等人已經做了很多研究工作,也已經由此獲得了很多獎項;在無結構文本數據到有結構 Network/Text Cube 的路上他們也做出了許多嘗試和成果,現在仍在進行中。韓家煒認為這是一條很長的路,他們現在只是在這條路上突破了幾個可以往前走的口子,還只是一條小路,要變成一條康莊大道則需要各國學者共同努力。

    韓家煒教授的研究工作并非跟隨熱點,而是在十年如一日地去打通一條從無結構數據到有用的知識的康莊大道,因此脈絡極為清晰且極具連貫性。

    雷鋒網 AI 科技評論在2018年初曾整理過一篇韓家煒教授的演講報告文章《韓家煒在數據挖掘上開辟的「小路」是什么》,值得大家參考。相比一年前,韓家煒教授的團隊也在不斷將當前最新的研究進展融入到他們這條「小路」當中,例如BERT、Spherical Text Embedding等,這些請查閱韓家煒教授團隊近期發表論文:

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?


    在2018年初他提到的以下幾本已經發表的書:

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    站在2019年末,韓家煒的團隊又發布了幾本新書:

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    任翔出了《Mining Structures of Factual Knowledge from Text》,張超也出版了《Multidimensional Mining of Massive Text Data》 。

    雷鋒網 AI 科技評論報道。

    相關文章:

    專訪數據挖掘領頭人韓家煒教授:不要迷信權威,做學問要秉承「三個真實」

    韓家煒在數據挖掘上開辟的「小路」是什么

    CCF ADL 87講習班回顧:韓家煒等13位大牛全方位解析社交網絡和數據挖掘

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    數據挖掘領頭人韓家煒教授:如何從無結構文本到有用的知識?

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 国产高清在线精品一本大道| 国产精品不卡区一区二| 成人午夜精品网站在线观看| 国产精品视频一区二区三区不卡 | 无套內谢波多野结衣| 亚洲AV成人精品日韩在线播放| 久在线精品视频线观看视频| 性夜黄a爽影免费看| 一区二区三区国产不卡| 一个人免费观看WWW在线视频| 欧美A级大片视频免费看| 久久人妻公开中文字幕| 亚洲午夜精品国产电影在线观看| 亚洲欧美中文日韩v在线观看| 无码人妻AⅤ一区 二区 三区| 日本一道本高清一区二区| 又爽又黄又无遮掩的免费视频| 久久AV秘?一区二区三区水生| jzzijzzij亚洲成熟少妇| 国产黄色大片网站| 中文字幕av日韩有码| 一本色道久久88亚州精品综合| 永久免费AV无码网站YY| 久久99精品久久久久久青青| 91久久偷偷做嫩草影院免费看| 在线无码人妻| 色婷婷丁香综合激情| 午夜福利影视| 小伙无套内射老熟女精品| 亚洲综合社区| 综合成人亚洲| 无码少妇一区二区浪潮AV| 国产最大的福利精品自拍| 麻豆色漫| 久热99这里只有精品视频6| 亚洲日本韩国欧美云霸高清| 影音先锋人妻资源| 日韩精品人妻在线| 青青青国产免费全部免费观看| 免费三级网站| 日本视频一区二区三区1|