• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給camel
    發送

    0

    Facebook 開源 AI 圍棋源代碼,擊敗職業棋手只需一塊GPU

    本文作者: camel 2018-05-04 13:40
    導語:以后的圍棋入門,寫代碼會不會成為必修課?

    Facebook 開源 AI  圍棋源代碼,擊敗職業棋手只需一塊GPU

    雷鋒網 AI 科技評論消息:5 月 2 日,Facebook AI Research(FAIR)官網博客中宣布開源其 AI 圍棋機器人 ELF OpenGo(包括源代碼和一個訓練好的模型),該機器人是基于 ELF 平臺研發而成,曾擊敗了 4 位世界排名前 30 的圍棋棋手。

    據雷鋒網了解,該工作主要是受啟于 DeepMind 的工作。今年早些時候 FAIR 啟動了該項工作,期望基于其進行強化學習研究而開發的可擴展、輕量級框架(Extensible Lightweight Framework,ELF)再現 AlphaGoZero 最近的結果。其目的則是創建一個開源實現的系統,該系統能夠自學圍棋進而達到人類職業棋手的水平或更高水平;同時他們也希望通過發布的代碼和模型,激勵更多的人去思考這項技術新的應用和研究方向。

    Facebook 開源 AI  圍棋源代碼,擊敗職業棋手只需一塊GPU

    據這個項目的負責人田淵棟介紹,他們用了兩千塊 GPU 訓練該模型,約兩到三周后得到當前版本的圍棋 AI模型,該模型基本上超過了強職業棋手的水平。ELF OpenGo 在與世界排名前 30 的四位職業圍棋棋手(金志錫,申真谞,樸永訓及崔哲瀚)的對弈中,OpenGo 以 14:0 的成績贏得了所有的比賽;在比賽中OpenGo使用單塊 GPU 每步50秒的搜索時間(每步搜索 8 萬個局面),而人類棋手可以有任意長時間的思考。

    另外,ELF OpenGo 在與目前公開可用的、最強的圍棋機器人 LeelaZero 的對一種,后者采用了除ponder外的缺省配置,以及公開權重(192x15,158603eb, Apr. 25, 2018),結果 OpenGo 贏得了全部 200 場比賽。

    田淵棟博士隨后在知乎上發表的一篇感想文章中提到,OpenGo 這個項目「不是為了做最好的圍棋程序,不是說要打敗誰」。之所以做這個項目有三個目的:

    (1) AlphaGoZero/AlphaZero 算法很有意思,我們想知道為什么它有效果,是怎么會有效果的,是不是如同宣傳的那樣是百試百靈的通用算法,是不是只要堆機器,強人工智能馬上就來了?還是說其實這個算法有什么問題和弱點?DeepMind 不開源也不透露細節,文章里面一些地方也沒有寫得很清楚。我之前寫過 Blog 討論過,但是沒有第一手經驗總不是很踏實。所以本著研究目的,我們需要復現一下,先有復現,才有創新,這個是做研究的習慣。

    (2) 今年年初我重寫了 ELF 的核心代碼,另外也加了分布式訓練,需要找個具體應用來測試一下。站在這個角度上,AlphaGoZero/AlphaZero 是個完美的選擇,再說之前也有 DarkForest 的代碼和圍棋程序的經驗,所以把它們拼起來不用花太多力氣。

    (3) 不管是通用算法還是分布式平臺,都可以用來干很多別的事情,不一定是圍棋,不一定是游戲。如果我們去看 ELF OpenGo 的代碼,會發現其實很大一部分和圍棋一點關系也沒有,完全適用于其它方向的工作。而圍棋對我們來說,只是一個把算法和平臺做好的手段。在這一點上,花點時間把圍棋做好是值得的。

    田淵棟博士表示,隨著今天 ELF OpenGo 的發布,這三個目的都已達到。當然,他們更希望的是能夠借此機會推廣一下 ELF 平臺和 PyTorch 深度學習框架,讓更多的人使用和完善它。

    代碼見:https://github.com/pytorch/ELF

    模型見:https://github.com/pytorch/ELF/releases

    英文 blog 見:https://research.fb.com/facebook-open-sources-elf-opengo/


    ELF 平臺

    ELF 平臺是一個可擴展、輕量級且非常靈活的游戲研究平臺,尤其適用于實時戰略(RTS)游戲的研究,于 2016 年 6 月首次發布。

    Facebook 開源 AI  圍棋源代碼,擊敗職業棋手只需一塊GPU

    在 C++端,ELF 與 C++線程同時托管多個游戲;而在 Python 端,ELF 可以一次返回一批游戲狀態,這使得其對現代的強化學習非常友好。相比之下,其他平臺(例如 OpenAI Gym)則只是使用一個 Python 界面封裝一個單一的游戲,這種情況使得并發游戲(許多現代的強化學習算法都有此要求)的執行就變得比較復雜。

    ELF 具有以下特征:

    • 端到端:ELF 為游戲研究提供了端到端的解決方案。它提供微型實時策略游戲環境、并行模擬、直觀的 API、基于 Web 的可視化,并且還具有由 Pytorch 授權的強化學習后端,資源需求最少。

    • 可擴展性:任何具有 C / C ++接口的游戲都可以通過編寫一個簡單的包裝器插入到這個框架中。

    • 輕量級:ELF 運行速度非常快,開銷很小。在一臺 MacBook Pro 上,基于 RTS 引擎構建的簡單游戲(MiniRTS)使用 ELF 平臺,能夠單核每秒運行 40K 幀;而只使用 6 塊 CPU+1 塊 GPU 從零開始訓練 MiniRTS,也只需要六天。

    • 靈活性:環境和參與者之間的配對非常靈活。例如單個 agent 與單個環境(例如 Vanilla A3C)、多個 agent 與單個環境(Self-play/MCTS),或者單個 agent 與多個環境(BatchA3C、GA3C)等。而且,任何構建在 RTS 引擎之上的游戲都可以完全訪問其內部表示和動態。

    隨著這次 OpenGo 的開源,FAIR 也對 ELF 平臺進行了改進,升級了更高效、更友好的 API 以及支持對數千臺計算機進行分布式計算的框架。作為 PyTorch 的一部分,ELF 能夠是研究人員能輕松地嘗試不同的強化學習思想,并進行快速、靈活的實驗。

    雷鋒網報道。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    Facebook 開源 AI  圍棋源代碼,擊敗職業棋手只需一塊GPU

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 国产亚洲欧美日韩在线专区| 综合人妻久久一区二区精品| 欧美成人精精品一区二区三区| 99蜜桃臀久久久欧美精品网站| 精品国产粉嫩内射白浆内射双马尾| 中文字幕乱码一区二区免费| www.国产在线| 又爽又黄无遮挡高潮视频网站| 91久久精品美女高潮不断 | 色狠狠一区二区| 国语自产拍精品香蕉在线播放| 日韩免费无码视频一区二区三区| 久久99国产精品尤物| 国产成人久久婷婷精品流白浆| 大香伊人久久精品一区二区| 亚洲综合另类小说色区一| 亚洲精国产一区二区三区| 91精品国产一二三产区| 久久无码免费束人妻| 热re99久久这里只有精品国产| 国产中文字幕精品喷潮| 欧美又粗又大又爽| 北岛玲中文字幕人妻系列| 国产无码swag专区| a∨变态另类天堂无码专区| 国产高清精品在线一区二区| 国产精品爆乳在线播放不卡| 大吊一区二区| 视频国产精品丝袜第一页| 国产精品SM捆绑调教视频| chineseav在线观看| 男人j进女人p免费视频| 加勒比综合网| 国产精品午夜精品福利| 国产熟女av一区二区三区| 青青AV| 安平县| 99久久99久久免费精品蜜桃| 亚洲中文精品久久久久久不卡 | 亚洲国产综合精品中文第一区| 亚洲a∨国产av综合av|