• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能學術 正文
    發私信給camel
    發送

    0

    華為視覺研究路線圖:三大挑戰,六項計劃

    本文作者: camel 2020-03-30 16:13
    導語:數據、模型、知識

    華為視覺研究路線圖:三大挑戰,六項計劃

    雷鋒網AI科技評論按:昨天在華為開發者大會上,華為首席科學家陳雷發布的全場景AI計算框架MindSpore開源框架,引起業界廣泛關注,畢竟在短短一周之內,國內相繼涌現出計圖(Jittor,清華)、天元(MegEngine,曠視)、MindSpore(華為)三個深度學習開源框架,可謂“2020年是深度學習框架井噴的一年”。

    但在昨天的大會中,華為發布的另一項重要計劃卻似乎受到了忽視,這是由田奇博士主導的“華為計算視覺基礎研究進展暨華為視覺計劃發布”。

    田奇博士,計算機視覺領域的人士應該都不陌生,畢業于清華電工系,后赴伊利諾伊大學香檳分校,師從計算視覺之父 Thomas S.Huang 教授。在2018年加入華為之前,一直在德克薩斯大學圣安東尼奧分校任教,是2016年多媒體領域 10 大最具影響力的學者,并于當年入選IEEE Fellow。

    田奇博士加入之后,華為諾亞方舟在計算機視覺領域的研究突飛猛進。以論文來講,ICCV 2019、CVPR 2019 分別有 19篇和29篇入選論文,CVPR 2020上更是多達 33 篇,且不論他們在類似ICLR、ICML這類篇算法的頂會上發表的論文。

    在這次“研究進展&計劃發布”上,田奇博士將他們的研究內容梳理為三大方向,即

    數據:如何從數據中挖掘有效信息?

    模型:怎樣設計高效的視覺識別模型?

    知識:如何表達并存儲知識?

    在此基礎上,他提出了華為諾亞的六大視覺計劃:數據冰山計劃、數據魔方計劃、模型摸高計劃、模型瘦身計劃、萬物預視計劃、虛實合一計劃。

    每個計劃聽著都很帶感,其中邏輯是什么?各自代表了什么?

     

    一、計算機視覺的三大挑戰及華為的研究

    田奇博士在演講中,將當下計算機視覺面臨的挑戰分為三大方向,分別為數據、模型和知識表達。(為什么沒有算力?畢竟這不是做視覺的人所能決定的,其實對算力的考慮包含在模型里面)

    1、如何從數據中挖掘有效信息?

    在信息時代,做計算機視覺其實面臨一個尷尬的事情,即互聯網上存在著海量的視覺數據,甚至已經遠遠超過了人類處理的極限;標注數據,無論規模多大,都只是視覺大數據中的“滄海一粟”。如何從海量數據中挖掘出有效的信息,依舊是一個很大的挑戰。

    華為在這方面提出了兩個典型的場景,一是如何利用生成數據訓練模型;二是如何對齊多模態數據。

    首先是生成數據,華為在這方面投入了大量的研究。具體來說,分為三部分。

     華為視覺研究路線圖:三大挑戰,六項計劃

    第一,自動數據擴充。這個以發表在ICLR 2020 上的 「Adversarial AutoAugment」為代表,這篇文章針對以前NAS(例如 AutoAugment)做數據增強計算開銷大、policy是靜態的問題,借用 GAN 的“對抗”思想,引入了 adversarial loss,這樣一方面大大減少了訓練所需的時間;另一方面,可以認為policy generator 在不斷產生難樣本,從而能幫助分類器學到 robust features,從而學的更好。(ICLR 2020 | 華為諾亞:巧妙思想,NAS與「對抗」結合,速率提高11倍 )

    第二,利用GAN來模擬更多的數據。這個以發表在CVPR 2018 上的PTGAN 和 CSGAN 為代表。前者(「Person Transfer GAN to Bridge Domain Gap for Person Re-Identification」)是針對行人重識別問題的生成對抗網絡,使用GAN將一個數據集的行人遷移到另一個數據集當中。后者(「Compressed sensing using generative models」)是針對感知的GAN壓縮,換句話來說,即利用GAN來重構出“原始數據”,相比于其他的重構算法來講,CSGAN在更少的測量(可理解為采樣后的數據)情況下能夠重構出很好的原始數據。

    第三,利用計算機圖形學技術來生成虛擬數據。這個以發表在CVPR 2019 上的「CRAVES: Controlling Robotic Arm with a Vision-based, Economic System」為代表。在CRAVES這篇工作中,他們設計了一套基于虛擬數據生成和域遷移的訓練流程,機械臂只需要借助一個額外的攝像頭,便可以完成抓取骰子并放置在指定位置的任務。注意,這里的數據是基于CG技術生成的,對機械臂的訓練完全不需要提供額外的監督數據。

    田奇也介紹了他們在數據生成方面最近的一項工作,這是一項基于知識蒸餾與自動數據擴增結合的方法。我們知道,自動數據擴充(AutoAugment,以下簡寫為 AA)來源于對數據集的全局優化。對每個圖片,AA可能帶來圖像語義的混淆。

    華為視覺研究路線圖:三大挑戰,六項計劃

    如左邊的圖所示,原圖是一只狐貍;如果對它進行亮度變化,它看起來會更像一只狗;如果對它進行反轉,這個時候看起來像一只貓。因此在訓練模型的時候,如果仍然使用原來的硬標簽(“fox”)顯然是不合適的。

    華為視覺研究路線圖:三大挑戰,六項計劃

    為了解決這個問題,華為提出了知識蒸餾的辦法,通過預訓練的模型,對AA的圖片,產生軟標簽,再用軟標簽指導圖形的訓練。上圖便是知識蒸餾后產生的軟標簽。

    華為視覺研究路線圖:三大挑戰,六項計劃

    從結果上來看,這種知識蒸餾與自動數據擴增相結合的方法,在ImageNet上能夠取得85.8%的效果。

     華為視覺研究路線圖:三大挑戰,六項計劃

    針對第二個場景,多模態數據,田奇博士認為多模態學習將成為未來計算機視覺領域的主流學習模式,因此非常重要,他們也將在這個領域進行重點布局。當前多模態學習面臨的挑戰包括:多模態信息表示,模態間的聯合映射,模態對齊,模態融合,多模態協同學習。

     華為視覺研究路線圖:三大挑戰,六項計劃

    針對這方面的工作,即如何對齊多模態數據,田奇重點介紹了他們在ACM MM 2019 上獲得最佳論文提名的論文「Multimodal Dialog System: Generating Responses via Adaptive Decoders」。他們稱之為“魔術模型”,論文本身是針對電子商務場景,用戶在與機器克服對話過程中存在輸入文本或圖片的需求。他們針對這一問題,使用了一個統一的模型來編碼不同模態的信息,從而能夠根據上下文來反饋文字或圖片。

     

    2、怎樣設計高效的視覺識別模型?

    田奇博士提出,華為諾亞在視覺模型方面的主要研究在于如何設計出高效的神經網絡模型以及如何加速/小型化神經網絡計算。換句話來說,即模型如何更快、更小、更高效。

    神經網絡模型的設計,最初都是手工設計,但現階段手工網絡模型設計已經進入了瓶頸期。而作為對應,從2017年開始,自動網絡架構搜索(NAS)迅猛發展,盡管只有三年時間,卻已經取得了可喜的進展。

    華為視覺研究路線圖:三大挑戰,六項計劃

    田奇博士認為,NAS目前存在三大挑戰,分別為:1)搜索空間仍需人工經驗定義;2)待搜算子需要人工設計;3)相較手工設計網絡,可遷移性較差。

    田奇博士在這方面僅舉了他們的一個工作,發表在ICLR 2020 上的「PC-DARTS: Partial Channel Connections for Memory-Efficient Architecture Search」。PC-DARTS針對現有DARTS模型訓練時需要 large memory and computing 問題,提出了局部連接和邊正則化的技術,分別解決了網絡冗余問題和局部連接帶來的不穩定性。這個模型能夠在性能無損的情況下,做到更快(與同類相比快一倍)。

    華為視覺研究路線圖:三大挑戰,六項計劃

    針對如何加速神經網絡及模型小型化,田奇博士是這樣思考的。目前大的網絡模型發展如火如荼,但這樣的模型更適合配置在云側,而無法適配端側。從2016年起,業界便開始探索模型加速和小型化的研究,也提出了大量小型化方案。但這些方案在實際中面臨著諸多問題,包括:1)低比特量化使得精度受限;2)混合比特網絡對硬件卻并不友好;3)新型算子并沒有得到充分的驗證。

    華為視覺研究路線圖:三大挑戰,六項計劃

    田奇博士同樣舉了他們最近的一項工作,是CVPR 2020 上的一篇 Oral:「AdderNet: Do We Really Need Multiplications in Deep Learning?」。在計算機中,浮點運算復雜度相比加法要高很多,但神經網絡中存在大量的乘法運算,這就限制了模型在移動設備上大規模使用的可能性。那么是否能設計一種基于加法的網絡呢?華為的這篇文章正是對這一問題的回答,他們將卷積網絡中的乘法規則變成加法,并對網絡中的多種規則進行修改:1)使用曼哈頓距離(取代夾角距離)作為各層卷積核與輸入特征之間輸出的計算方法;2)為AdderNet設計了一種改進的帶正則梯度的反向傳播算法;3)提出一種針對神經網絡每一層數量級不同的適應性學習率調整策略。實驗結果上表明,AdderNet能夠取得媲美于乘法網絡的效果,且在計算功耗上具有明顯的優勢。

     

    3、如何表達并存儲知識?

     

    田奇表示,華為的目標是打造下一代視覺感知的通用視覺模型,并把該算法遷移到下游任務進行模型復用。

    那么,何為“通用視覺模型”?其核心思想事實上就是如何表達并存儲知識。

    田奇博士提出兩種場景。首先是目前比較熱的預訓練的方式,通過預訓練獲得的模型來表達和存儲知識;其次是通過虛擬環境,在基本不需要標注數據的情況下來學習知識。

    華為視覺研究路線圖:三大挑戰,六項計劃

    針對預訓練模型,田奇博士提到了他們在CVPR 2019上發表的工作:「Iterative Reorganization with Weak Spatial Constraints: Solving Arbitrary Jigsaw Puzzles for Unsupervised Representation Learning」。這篇文章提出了一種適用于處理任意維度拼圖問題的自監督學習方法。

    華為視覺研究路線圖:三大挑戰,六項計劃

    拼圖問題將無標簽圖像按網格分割為圖像塊,并打亂它們的順序,通過網絡恢復正確的圖像塊布局,來達到從無標簽圖像數據中學習語義信息的目的。這篇文章提出,以迭代的方式逐步調整圖像塊的順序直到收斂。在ImageNet上能夠取得非常好的性能。

    華為視覺研究路線圖:三大挑戰,六項計劃

    深度學習大量依賴于可標注的數據,但是很多場景下,數據標注成本很高。同時,標注數據也存在一個致命的問題,即知識表達不準確——比如在自動駕駛中,我們有大量的標注信息,但這些標注數據是否真的“最適合”自動駕駛任務呢?此外,人類對外界的感知依賴于常識,而依賴于標注數據來訓練的模型則存在缺乏常識的問題。

    針對這一問題,田奇博士提出了用虛擬場景構建虛擬場景來學習常識的方法。田奇博士舉了他們發表在CVPR 2019 的文章(CRAVES),主要是通過虛擬場景來訓練機械臂抓骰子。我們在前面已經提到,這里就不再贅述。


    二、華為視覺研究計劃

    延續以上提到的研究內容,田奇在隨后發布了「華為視覺計劃」。簡單來說包括六個子計劃:

    與數據相關的:數據冰山計劃、數據魔方計劃;

    與模型相關的:模型摸高計劃、模型瘦身計劃;

    與知識相關的:萬物預視計劃、虛實合一計劃。

     

    華為視覺研究路線圖:三大挑戰,六項計劃

    1、數據冰山計劃

    該計劃是為了解決數據標注瓶頸問題,讓數據生成真正代替手工標注。這里包含三個子課題,分別為:

    子課題一:數據生成質量拔高。即通過一到兩年時間,解決生成數據質量差和不真實的問題;

    子課題二:數據生成點石成金。即設計數據自動挑選的算法,在海量的生成數據中,挑選高質量的數據;

    子課題三:通用自動數據生成。即對不同的子任務設計不同的生成數據方式,讓數據生成具備普惠能力。

     

    2、數據魔方計劃

    該計劃主要解決多模態數據量化、對齊和融合的問題,從而構建下一代智能視覺。包括構建多模態數據量化指標,從而全面評估性能;多模態數據對應策略研究;多模態數據融合方案等。

     

    3、模型摸高計劃

    該計劃主要是構建云側大模型,來刷新各類視覺任務的性能上限。同樣包括三個子課題:

    子課題一:全空間網絡架構搜索。即突破神經網絡架構搜索空間受限的約束,搜索更多的范式、更多網絡空間結構的變化,讓神經網絡架構真正實現自動搜索。

    子課題二:新型算子搜索。即讓算子的設計從手工復用到創造新的算子。

    子課題三:搜索模型普適能力的提升。目前搜索出的網絡泛化性能、抗攻擊性、遷移性都比較差,該子課題希望能夠提升網絡架構索索的這些性能。

     

    4、模型瘦身計劃

    開發端側小模型,助力各種芯片完成復雜推理,是一個重要的研究方向。華為在這個領域中的目標是,打造高效的端側視覺計算模型。該計劃包含三個子課題:

    子課題一:自動搜索小型化網絡。即將硬件的約束融入自動設計中,使得算法能夠適配不同的硬件。

    子課題二:一比特網絡量化。即設計一比特網絡,使一比特網絡能達到全精度網絡的性能,目標是追求極致的性能。

    子課題三:構建新型加法網絡。即在卷積網絡中,用加法運算代替所有的乘法運算,同時與芯片計算相結合,探索高效計算的新路徑。

     

    5、萬物預視計劃

    所謂萬物預視,即定義預訓練任務,構建通用視覺模型。具體做法是搜集大量公開無標簽的億級數量級的圖片,完成知識的抽取與整理。

     

    6、虛實合一計劃

    該計劃的目標是在虛擬場景下,不通過標注數據,直接訓練智能行為本身。目前業界在這個領域的研究非常還有限。這里涉及如何定義知識、如何構筑虛擬場景、如何模擬用戶的真實行為、如何確保數據與智能體的安全等問題。雖然這個計劃極具挑戰性,但田奇認為這才是通向真正的人工智能的道路。

     雷鋒網報道。


    雷鋒網

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    華為視覺研究路線圖:三大挑戰,六項計劃

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 免费无码一区二区三区蜜桃大| 亚洲国产福利成人一区二区| 国产资源精品中文字幕| 无码人妻精品一区二区三区66| 视频一区二区三区四区五区| 右手影院亚洲欧美| 特黄特色大片免费播放器999 | 国产欧美现场va另类| 亚洲岛国av一区二区| 成人区人妻精品一区二区| 久久精品一品道久久精品| 国产精品亚洲а∨天堂2021| av亚洲一区| 亚洲天堂中文字幕天天码| 2019国产精品青青草原| 九九热精品在线视频观看| 欧美精品乱码99久久蜜桃| 久久变态另类亚洲精品| 亚洲国产大胸一区二区三区| 风流少妇又紧又爽又丰满| 91偷拍视频久久精品| 欧美熟妇色XXXx欧美老妇多毛| 亚洲一区二区三级av| 亚洲天堂二区| 在线a久青草视频在线观看| 亚洲高清在线不卡中文字幕网| 精品成人AV一区二区三区| 伊人天天久大香线蕉av色| 日韩日韩日韩日韩日韩| 成人亚洲欧美久久久久| 亚洲欧美日韩人成在线播放| 亚洲欧洲∨国产一区二区三区 | 成·人免费午夜无码视频在线观看 | 永久免费观看美女裸体的网站| 国产四虎永久免费观看| japan黑人极大黑炮| 亚洲av产在线精品亚洲第一站| 亚欧在线精品免费观看一区| 夜鲁夜鲁很鲁在线视频 视频| 亚洲丝袜熟女| 蜜桃麻豆av在线|