• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業界 正文
    發私信給木子
    發送

    0

    歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

    本文作者: 木子 2021-12-10 12:27
    導語:騰訊絕悟AI奪冠Minecraft AI競賽,挑戰開放世界難題

    絕悟AI開始挑戰更復雜的開放世界游戲環境了。

    Minecraft (中文譯名《我的世界》) 是全球最暢銷的開放世界3D游戲。隨機生成的開放地圖、自由靈活的玩法、多線程長鏈條任務,給AI研究帶來了極大挑戰。針對Minecraft的復雜環境,游戲AI賽事MineRL邀請全球程序員在4天時間內用一臺計算機訓練AI找到游戲中的鉆石。 

    12月8日,第三屆MineRL競賽主賽道 (research track) 發布成績,AI 的“鉆石之夢”向前踏進了一大步:騰訊AI Lab“絕悟”以76.970分的絕對優勢奪冠。研究成果已發布在Arxiv上,算法框架可復用于其他復雜決策環境。

    歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

    (論文鏈接:https://arxiv.org/abs/2112.04907

    MineRL競賽由卡內基·梅隆大學、微軟、DeepMind、OpenAI,聯合機器學習頂級會議NeurIPS共同舉辦,極富挑戰性的賽題持續吸引全球開發者關注。今年賽事共有59支團隊、近500名選手投身其中,其中不乏世界頂級學府和研究機構的科研強隊。競賽的研究主題是:訓練樣本高效的Minecraft AI智能體。

    騰訊AI Lab創新性地通過分層強化學習(Hierarchical Reinforcement Learning)、表示學習(Representation Learning)、自模仿學習(Self-imitation Learning)、集成行為克隆(Ensemble Behavior Cloning)等算法高效實現比賽目標。

    歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

     

    歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

    (絕悟AI以壓倒性優勢獲得歷史最高分,今年榜單詳見鏈接

    極度多樣的環境、完全靠隨機種子生成的地圖、長決策序列與復雜的技能學習、高自由度玩法帶來的海量策略偏好都增加了Minecraft AI研究的難度。比如,為了讓AI在15分鐘內找到鉆石,AI需要經歷徒手采集原木、合成木板、木棍與木鎬,采集到鐵礦,經過一系列加工才能合成鉆石。

    此外,主辦方還制定了種種嚴苛的規則:包括禁止參賽者編寫規則、游戲環境甚至將背包信息與動作空間加密、且不允許使用預訓練模型,只允許與環境最多交互八百萬次,每個參賽隊伍只能使用6核CPU與半張NVIDIA K80顯卡訓練4天——這個配置幾乎對于所有高校實驗室與個人研究者都可以負擔的。

    這次比賽的目的在于促進樣本高效 (Sample-efficient) 游戲AI算法的發展。目前流行的強化學習算法一般需要多達成百上千萬次的試錯來尋找最優流程,耗費大量的時間和計算資源。而純靠人類數據的模仿學習算法雖然更快,但性能上往往不盡如人意。

    歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

    (Minecraft 游戲截圖)

    絕悟AI創新性地提出了一種樣本高效的基于分層強化學習(Hierarchical Reinforcement Learning)的解決方案。數據表明,騰訊AI Lab推出的上層控制器的預測準確率可以達到99.95%,也就是說,AI從人類數據中學到了一套幾乎不出錯的宏觀策略,每時每刻都清晰地知道自己下一步的正確動向。

    在狀態空間表征上,Minecraft游戲遇到的最大挑戰在于如何理解復雜的開放地圖。首先被選中的是近年來熱門的表示學習方法 (Representation Learning)。但研究人員很快發現,已有方法只適用于2D場景,在MineCraft游戲環境里效果很差。于是騰訊AI Lab設計了一種“基于動作感知”(Action-aware Representation Learning)的新穎算法,用來捕捉每個動作對環境產生的影響,形成注意力機制。實驗表明,該算法可以顯著提升智能體獲得資源的能力與效率。

    歷史最高分!騰訊絕悟AI斬獲Minecraft AI競賽冠軍

    (不同動作的可視化結果,AI學會了關注當前圖像中的關鍵區域)

    隨著游戲推進,智能體與人類的策略出現了很大的分歧。此時,人類數據已經很難用于指導AI。絕悟AI使用了自模仿學習 (Self-imitation Learning)的思想,提出了基于鑒別器的自模仿學習算法,AI可以從自身過往的成功與失敗中獲得經驗與教訓,并在察覺到當前狀況不妙的時候,主動往更好的方向修正。對比實驗證明,在加入自模仿策略后,智能體探索到的行為更加一致,也可以顯著降低進入危險區域的概率。

    對于合成物品等需要長鏈條的動作序列的任務,研究人員也做了細致的優化。通過動作序列一致性過濾 (Consistency Filtering) 與基于投票的集成學習(Ensemble Learning),模型在合成物品階段的成功率從35%提升到96%,一舉將最薄弱的鏈條扭轉為了最穩定的制勝點。

    利用高度復雜、高度定制化的游戲場景作訓練場,騰訊 AI Lab 的深度強化學習智能體正不斷走近現實。棋牌游戲 AI “絕藝”從圍棋棋盤逐步走向象棋、麻將,策略協作型 AI “絕悟”從MOBA走向FPS、RTS,再到如今的 3D開放世界 MineCraft。它們邁向全新挑戰的每一步,都讓AI離解決現實問題、科技向善的大目標更近了一步。

    隨著虛實集成世界逐步變成現實,這些研究的經驗、方法與結論,將在真實世界創造更大的實用價值。

    雷峰網(公眾號:雷峰網)

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 亚洲人妻在线一区二区| 色欲色香综合网| 亚洲精品国产自在现线最新| 91中文字幕在线一区| 成年女人片免费视频播放A| 中文字幕变态另类| 狠狠五月天| 国自产拍偷拍精品啪啪模特| 蜜桃无码一区二区三区| 美女扒开尿口让男人桶 | 亚洲国产精品一区二区视频| 在线a级毛片无码免费真人| 蜜臀av一区二区| 亚洲永久一区二区三区在线| 亚洲人成网站观看在线观看 | 偷窥盗摄国产在线视频| 色综合久久综合香蕉色老大| 日韩激烈无码| 日韩日夜操| 国产高清在线a视频大全在线| 无遮无挡爽爽免费视频| 亚洲熟妇AV乱码在线观看| 99插插| 国产综合无码一区二区辣椒| 久久久久亚洲av成人网址| 视频一区二区不中文字幕| 99国产精品免费视频观看8| 99精品人妻少妇一区| 免费人成视频在线观看视频| 天天色天天操综合网| 日韩AV中文字幕在线| 国产成人综合色就色综合| 豆国产97在线 | 亚洲| 婷婷久香综合在线| 漂亮的保姆hd完整版免费韩国| 国产成人精品视频三级| 一区二区久久不射av| 99精品热视频| 国产精品久久久久影院亚瑟| 麻豆麻豆麻豆麻豆麻豆麻豆| 一区二区av|