• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給宗仁
    發送

    0

    經過一年的修煉,AlphaGo的哪些能力突飛猛進了?

    本文作者: 宗仁 2017-05-23 20:12 專題:烏鎮人機決戰:AlphaGo VS 柯潔
    導語:經過一年的修煉,AlphaGo的的哪些能力突飛猛進了?

    雷鋒網AI科技評論按:烏鎮圍棋峰會第一局已經結束了,歷時4個半小時,以柯潔九段執黑負于 AlphaGo,AlphaGo 贏四分之一子告終,這樣風平浪靜的結果想必很多人都預測到了,不過大家從一開始就知道關注的重點,不在于柯潔怎么輸的,而是AlphaGo已經進化到什么程度了,距離Deep Mind團隊出論文來詳解AlphaGo有多強還有一段時間,So我們其實可以從現場觀戰中來看出一些端倪。

    棋速

    第一局棋下到一半的時候,不少棋友群里的人沸騰了,發現AlphaGo落子速度非常快,每步棋落子速度在30S-40S之間波動,對此圍棋業余5段趙老師對雷鋒網AI科技評論表示:“(這局棋)像安樂死,不知不覺就輸了,(相比去年)機器落子飛快但錯誤基本沒有”。

    綜合整局,AlphaGo落子表現冷靜、果斷,而柯潔的落子狀況較多變。最終在比賽進行了四個多小時之后,AlphaGo贏四分之一子。

    棋風

    AlphaGo1.0的時候(去年3月跟李世石對戰的時候),它的棋風概括起來就是擅長記住棋譜+增強學習+計算能力,身上還能看到人類棋風的影子,等AlphaGo喬裝成Master60連勝的時候,許多圍棋大師包括聶衛平在內開始評價其棋風“很難揣測Master的風格……它永遠都沒有表情,永遠不受情緒影響,永遠一個節奏,就是要贏你。”而今天,第一局棋還沒結束的時候,搜狗王小川已在知乎上發文剖析AlphaGo2.0 棋風“完全脫離人類經驗”——“而AlphaGo2.0脫離了機器對人模仿,走棋風格也將完全脫離人的定式。在與柯潔的比賽中,會不斷出現我們意想不到的走棋,而且這些走棋在教科書中會被認為是低級錯誤或者完全不可理喻,但凡一個正常的棋手都不會這么玩,但凡一個新手這么玩都會被點撥這樣不對。而AlphaGo2.0會不斷制造這樣的局面,關鍵他還是對的。”

    不過最后還是柯潔說了算,他在會后的采訪中用了一個很好的例子說明了AlphaGo的棋風莫測:(在回顧比賽時也對第54手的斷)時,他表示了肯定:“很震驚,這在人類的下法中是不能有的。在斷之后,它把自己的腳步實地化,變得更厚,一石二鳥。”。

    算法

    AlphaGo1.0的時候(去年3月跟李世石對戰的時候)使用的算法精髓,根據FB田淵棟看完Nature論文的解讀,由估值網絡評估棋局,策略網絡選擇落子,快速走子(Fast rollout)適當加速,再用蒙特卡羅樹搜索把以上這三個部分連起來,形成一個完整的系統。

    這一次雖然知乎論壇等活躍地盤已經開始紛紛推測這次的AlphaGo2.0用了什么牛叉的算法,有了硬件的預測失誤,真相還是等Deep Mind后面來親自公布,目測算法預測這個要根據它的單機版10個GPU+TPU助力預測比較靠譜。

    硬件需求降低

    根據DeepMind員工發表在2016年1月Nature期刊的論文,分布式版本(AlphaGo Distributed)使用了1202個CPU和176個GPU。

    不過這次比賽AlphaGo用的何種硬件配置,DeepMind在會后的新聞發布會中表示,這次比賽的AlphaGo是新版本,它改善了新的算法,主要進步是計算量少了十倍,自我對弈更強。Hassabis稱,在比賽中程序是在一個單一的機器上運作的,這與去年不一樣,當時是分布式的。這次有更強大的算法,運作起來更簡單也更好,獲得的速度更快。另外Hassabis表示,計算力可以“在Google云中獲得,用的是TPU,十個處理單位,少了十倍的計算量”。簡單點說,這次的AlphaGo是單機版。

    迭代速度

    哈薩比在此鏈接中的劍橋大學的一次演講中提到,以前從零訓練一個AlphaGo要三個月,現在只需要一個星期(“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”)。

    如果稱對戰李世石期間的版本為V18迭代版本,喬裝成Master60連勝并宣布升級完成的時刻為V25版本,現在的AlphaGo又是V多少版本,訓練的時候會不會一周都不要了?這是我們明天要親自問DeepMind團隊的。

    從單人對戰到團隊對戰

    心細的朋友肯定注意到了,柯潔和AlphaGo對弈之外,5月26號上午還有一場配對賽,配對賽雙方---古力+AlphaGoV連笑+AlphaGo,即對弈雙方分別由一位棋手與AlphaGo組成,棋手與AlphaGo合作進行比賽。5月26號上午下午則是陳耀華,周睿羊,羋昱延,時越,唐韋星和AlphaGo的5對1團隊賽。

    Google之所以敢這樣設置賽制,唯一的解釋就是,AlphaGo現在既懂人類下圍棋的那部分,又懂AI下圍棋的那部分,并可以做到融會貫通,所以它才敢挑戰配對賽這種跟另一個同伴高度配合的賽制,又敢挑戰測試自己“戰斗力”極限的團體賽。AI最可怕的部分不是它單個力量有多強,而是它開始懂得和周遭“互動”,這樣的融匯是不是比去年3月的人機大戰可怕多了呢?

    小結:

    上次AlphaGo喬裝成Master測試的時候,柯潔已經落敗給Master過一次,他不是沒見識過AI圍棋的厲害,但結合柯潔今天在現場的冷靜表現,和他昨晚莫名其妙地深夜感慨,我們有理由相信,這不是一場比AI圍棋選手和人類圍棋選手哪個更厲害的選手,DeepMind團隊一定有些懸而未決的答案需要這場比賽給一個肯定的驗證,然后再往那個方向實現更深一步的探索。

    雷鋒網AI科技評論現場報道,未經許可,拒絕轉載。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    經過一年的修煉,AlphaGo的哪些能力突飛猛進了?

    分享:
    相關文章

    專注AIR(人工智能+機器人)

    專注人工智能+機器人報道,經驗分享請加微信keatslee8(請注明原因)。 科學的本質是:問一個不恰當的問題,于是走上了通往恰當答案的路。
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 日韩av无码一区二区三区不卡毛片| 亚洲成AV人不卡无码| 亚州性无码不卡免费视频| 天天躁日日躁狠狠躁超碰97| 亚洲天码中文字幕第一页| 成人精品不卡| 亚洲激情五月天| 激情人妻中出中文字幕一区| av中文字幕在线一区| 国产日韩久久免费影院| 国产精品乱码久久久久久小说| 在线啊v中文字幕| 国产精一区二区黑人巨大| 91性爱视频| 亚洲无码中文字| 中文字幕第一页亚洲| 国产日韩精品视频无码| 97超级碰碰碰久久久久app| 韩国18禁啪啪无遮挡免费| 国产探花精品在线播放| 国产在线精品乱码一区| 中文字幕有码日韩精品| 少妇高潮喷水在线观看| 二区三区av| 无码人妻久久一区二区三区 | www.成人在线| 日本中文字幕一区二区三| 人妻无码中出| 一本色道AV| 日本国产高清色www视频在线| 欧美激情肉欲高潮视频| 亚洲高清aⅴ日本欧美视频 | 四虎国产精品永久在线影视| 欧美老妇刺激福利在线| 亚洲国产日韩a在线亚洲| 看片总站| 欧美?日本?国产| 国产精品露脸国语对白| 高清欧美性猛交xxxx黑人猛交| 国产在线中文字幕精品 | 狠狠综合久久综合中文88|