• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業(yè)界 正文
    發(fā)私信給程弢
    發(fā)送

    3

    秒殺英特爾至強,NVIDIA的深度學習超級計算機強在哪?

    本文作者: 程弢 2016-08-18 08:00
    導語:黃仁勛曾表示,3000人花費3年時間才研發(fā)出來這樣一款DGX-1,深度學習超級計算機研發(fā)的難度之大可見一斑。

    硬件和算法在人工智能領域的作用可以說是各占一半的,而在芯片層面上,業(yè)界幾乎觀點一致——GPU在人工智能深度學習算法上的重要性遠高于CPU,這也就是為何NVIDIA在人工智能領域的風頭甚至蓋過了英特爾。

    毫無疑問,GPU是當下訓練深度學習神經(jīng)網(wǎng)絡最熱門的方法,這種方案已經(jīng)受到了谷歌、微軟、IBM、豐田以及百度等企業(yè)的青睞,因此GPU廠商在最近兩年逐漸成為眾企業(yè)膜拜的對象。

    作為GPU領域的絕對主導者,NVIDIA最近動作頻頻,今年早些時候公司專為深度神經(jīng)網(wǎng)絡推出了Tesla P100 GPU,并且發(fā)布了基于該GPU的單機箱深度學習超級計算機——NVIDIA DGX-1。

    秒殺英特爾至強,NVIDIA的深度學習超級計算機強在哪?

    如今這款深度學習超級計算機已經(jīng)問世,NVIDIA CEO黃仁勛日前將DGX-1交付給了馬斯克創(chuàng)辦的人工智能項目OpenAI,OpenAI會用DGX-1做什么項目?如何使用?還不得而知,不過我們可以先聊一聊這款深度學習超級計算機到底是什么?它有什么牛逼的地方。

    深度學習超級計算機是什么?

    顧名思義,深度學習超級計算機是深度學習和超級計算機的結(jié)合體,我們所熟知的“天河一號”、“天河二號”等都是超級計算機,當然不僅如此,通常情況下具備高性能計算(HPC)的計算機都可算作超級計算機,如NVIDIA的Tesla系列。

    因為深度學習神經(jīng)網(wǎng)絡尤其是幾百上千層的神經(jīng)網(wǎng)絡需對計算和吞吐能力的需求非常高,GPU對處理復雜運算擁有天然的優(yōu)勢:它有出色的浮點計算性能,可以同時保證分類和卷積的性能以及精準度。

    所以搭載GPU的超級計算機已經(jīng)成為訓練各種深度神經(jīng)網(wǎng)絡的不二選擇。例如在谷歌Brain項目中,其3臺機器中配置了12顆GPU,性能就達到了包含1000個節(jié)點的CPU簇的水平。

    NVIDIA DGX-1性能如何?

    黃仁勛曾表示,3000人花費3年時間才研發(fā)出來這樣一款DGX-1,深度學習超級計算機研發(fā)的難度之大可見一斑。

    根據(jù)NVIDIA官方的介紹,DGX-1的規(guī)格如下:

    半精度 (FP16) 峰值性能最高可達 170 Teraflops;

    8 個 Tesla P100 GPU 加速器,每顆 GPU 16GB 內(nèi)存;

    NVLink Hybrid Cube Mesh (NVLink 混合立方網(wǎng)格);

    7TB 固態(tài)硬盤 DL 高速緩存;

    雙萬兆以太網(wǎng),四路 InfiniBand 100Gb 網(wǎng)絡連接;

    功耗:3U – 3200W。

    秒殺英特爾至強,NVIDIA的深度學習超級計算機強在哪?

    因為NVIDIA將這些硬件設計在了一個機箱內(nèi),所以DGX-1被稱為單機箱深度學習超級計算機。

    Tesla P100有153億個16nm FinFET晶體管,其核心面積達到了610mm2,按照黃仁勛的說法,這款GPU是迄今為止最大的芯片。

    DGX-1集成的8個16GB顯存GPU吞吐量相當于 250臺傳統(tǒng)服務器的水平,其配置的7 TB固態(tài)硬盤用于儲存神經(jīng)網(wǎng)絡訓練的大量原始數(shù)據(jù)。

    除此之外,DGX-1系統(tǒng)還包含一套深度學習軟件,即深度學習GPU訓練系統(tǒng) (DIGITS?),它可用于設計深度神經(jīng)網(wǎng)絡 (DNN),據(jù)了解DGX-1可以將深度學習的培訓速度加快75倍,將CPU性能提升56倍。這是什么樣的概念呢?

    英特爾雙路至強系統(tǒng)需要250多個節(jié)點和150個小時來訓練Alexnet,而DGX-1只需要一個節(jié)點2個小時,后者在性能和節(jié)點總帶寬上都有明顯的優(yōu)勢。當然在性能的提升下,功耗達到了3200W,售價更是高達129000美元。

    GPU是唯一選擇嗎?

    雖然GPU相比CPU有一定的優(yōu)勢,但是在FPGA和神經(jīng)網(wǎng)絡芯片面前,GPU依然要遜色不少。

    有研究人員測試,相比GPU,F(xiàn)PGA的架構(gòu)更靈活,單位能耗下性能更強。深度學習算法在FPGA上能夠更快、更有效地運行,而且功耗也能做到更低。英特爾甚至為此推出了FPGA和CPU的混合芯片架構(gòu)。

    另一個研究方向就是神經(jīng)網(wǎng)絡芯片,這一領域的代表當屬IBM的TrueNorth和寒武紀的DianNao。根據(jù)模擬實驗測試的結(jié)果,采用DianNaoYu指令集的寒武紀深度學習處理器相對于x86指令集的CPU有兩個數(shù)量級的性能提升;而IBM的Truenorth里含有54億個低成本晶體管神經(jīng)突觸芯片,功耗卻低至700毫瓦,在性能以及功耗的優(yōu)化上都提升到了一個新的高度。

    寒武紀神經(jīng)網(wǎng)絡處理器研究者、中國科學院計算技術研究所研究員陳云霽表示,“加速芯片是神經(jīng)網(wǎng)絡芯片的最終形態(tài)。”

    但是理想很豐滿,現(xiàn)實很骨感!就目前來說,GPU是唯一實現(xiàn)大規(guī)模應用的方案,F(xiàn)PGA或者神經(jīng)網(wǎng)絡芯片想要取代GPU的地位只能說是路漫漫了!

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

    分享:
    相關文章

    略懂技術的小編

    關注一切有未來感的產(chǎn)品及技術!
    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 岛国毛片一级一级特级毛片| 国产精品视频一区二区三区, | 日韩欧美视频第一区在线观看| 久久精品亚洲中文无东京热| 国产av国片精品一区二区| 国产专区一线二线三线码| 热re99久久精品国产99热| 日韩精品欧美国产在线| 2021久久精品国产99国产精品| 国内精品久久久久久久coent| 精品无人码麻豆乱码1区2区| 日韩激情一区二区无码AV| 精品亚洲天堂| 国产精品亚洲精品日韩已满十八小| 国产边打电话边被躁视频| yy6080亚洲国产精品| 久久不卡国产一区二区| 国产精品 无码专区| 少妇高清一区二区免费看| 欧美a在线观看| 中文字幕人妻在线中文乱码怎么解决| 在线观看日韩亚洲综合| 囯产精品久久久久久久久久妞妞| 欧美巨大极度另类| 亚洲精品久久久久久无码色欲四季| 99久久精品免费观看国产| 在线播放国产精品一品道| 精品人妻免费看一区二区三区| 国产最近最新中文天堂| 欧美成人一区二区三区| 精品一卡2卡三卡4卡乱码精品视频| 久久亚洲精品11p| 国产人妇三级视频在线观看| 看av免费毛片手机播放| 亚洲人成网站999久久久综合 | 久久久噜噜噜久久久精品| 国产成人亚洲无码淙合青草| 国产精品亚洲片在线观看麻豆| 午夜诱惑| 亚洲精品自拍视频在线| 国产肥臀视频一区二区三区 |