• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能開發者 正文
    發私信給任平
    發送

    0

    DeepMind的智能體成精了,還學會“發脾氣”了?

    本文作者: 任平 2021-08-10 16:01
    導語:我們能離真正的通用人工智能還有多遠?

    DeepMind又造“小人”了!

    DeepMind的智能體成精了,還學會“發脾氣”了?

    這群小人就是英國人工智能實驗室造出的“智能體”,不過只可以在游戲中看到。之前以4:1力挫世界圍棋冠軍李世石的阿爾法狗,就是這家實驗室訓練的智能體。

    但你可能不知道的是,DeepMind”還訓練過“象棋棋手”、“足球球員”、”電競玩家“,甚至提出“人工生命"的言論。

    DeepMind的智能體成精了,還學會“發脾氣”了?

    最近的這群智能體,竟然能直接跳過數據填食,在開放式的任務環境中自我進化。

    此前的阿爾法狗和阿爾法star,能力再強,也只能在各自的游戲里釋放大招,超出自己的游戲范圍立馬“歇菜”。而這批小人卻能在不同的游戲里游刃有余地完成任務,展現出超強的泛化能力。難道人工智能要邁出泛化“頑疾”了嗎?

    在一個搶奪高地金字塔的任務里,兩個不同顏色的小人能力值相當。都沒有跳躍功能的它們,開始“發脾氣"亂扔東西。混亂中,竟把其中一塊板子”扔“成了樓梯,長驅直入,任務完成!

    多次實驗發現,這些小人可以復現這種方法,難道這群智能體有了記憶?

    不僅如此,小人還學會了“相對運動”--我上不去,你下來--借助板子直接把目標扒拉下來了! 甚至為了贏得比賽,多個小人學會了打配合,團體成長力刷刷上漲。

    這種在虛擬游戲中自我進化的智能體,僅僅需要人為搭建一個任務環境,設計大量的任務目標,利用加強深度學習的方法,一步一步打通關,最終成為一個“十八般武藝”的智能體。

    DeepMind的智能體成精了,還學會“發脾氣”了?

    沒有樣本,沒有經驗,這些智能體究竟如何進化,零樣本學習方式是否意味著這些智能體已經具備了基本的“自學意識”?

    社會達爾文主義的訓練場

    相比之前做出的Ai足球場,這批智能體的訓練場更像一個游戲“社會”,里面有無數個游戲房間,每個房間的游戲按照競爭性、平衡性、可選性、探索難度四個緯度進行區分。

    DeepMind的智能體成精了,還學會“發脾氣”了?

    不管是哪種任務,這批智能體都只能從最簡單的開始,一步步解鎖更復雜的游戲,這也導致整個游戲更像一個虛擬社會。

    這些無需大數據集訓練出來的智能體,每玩一次游戲就成長一次,在與各種環境的互動和“獎勵”中,成長為一個更通用的智能體,也更類似于人工“生命”。

    能讓智能體自我進化的關鍵在于正確設計初始智能和進化規則。一開始是非常簡單的,所有的復雜結構都是進化而來。就像嬰兒做不了生孩子的事,布置任務的核心是不要超出智能體自身的改進能力。

    根據 DeepMind的說法,每個AI智能體會在4000 個游戲房間中玩了大約 70萬個獨特的游戲,并在 340 萬個任務中經歷了 2000 億個訓練步驟。1 億個步驟相當于大約 30 分鐘的訓練。按照這種訓練方法,41天就能訓練出一群“成年”智能體。

    它還是不會思考

    DeepMind表示,“單個AI智能體可以開發智能來實現多個目標,而不僅僅是一個目標。”

    AI智能體新科技公司Pathmind 的CEO Chris Nicholson 也說到,“它學到的技能可以舉一反三。例如,智能體學習抓取和操縱物體,就能完成敲錘子或者鋪床的任務。而DeepMind 正在用編程為AI智能體在這個世界上設定目標,而這些AI智能體正在學習如何一一掌握它們。”

    但是南加州大學計算機科學副教授 Sathyanaraya Raghavachary表示,這些智能體并不能定義為“生命”,尤其是關于智能體擁有身體感覺、時間意識以及理解目標的幾個結論。

    “即使是我們人類也沒有完全意識到我們的身體,更不用說那些人工智能了。”

    他講到,一個活躍的身體對于大腦不可或缺,大腦要放在合適的身體意識和空間位置里進化。如果AI智能體能夠理解它們的任務,何必需要 2000 億步的模擬訓練來達到最佳結果。總體而言,這個虛擬環境訓練出來的AI智能體只是和以往的“大同小異”。

    從理論到現實的路還很長

    狹義的人工智能是“復制人類行為的元素”,在計算機中執行某種任務。例如實現對圖像進行分類、定位照片中的對象、定義對象之間的邊界等等。

    這些系統旨在執行特定任務,而不具有解決問題的一般能力。

    相比之下,Deepmind使用的“通用人工智能”有時也被稱為人類級別的人工智能,因為它可以理解上下文、潛臺詞和社會線索,甚至被認為可能完全超過人類。

    但是正如行為主義和認知主義之間的對抗,智能體是否具有解決問題的能力,并不能單純地考慮統計的結果。善于“事后解釋”任何觀察到的行為,在實驗室之外,都無法“預測”哪些行動即將發生。


    編譯來源:

    https://bdtechtalks.com/2021/08/02/deepmind-xland-deep-reinforcement-learning/

    雷鋒網雷鋒網雷鋒網

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    DeepMind的智能體成精了,還學會“發脾氣”了?

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 日韩精品在线二区三区| 日韩区中文字幕在线观看| 91福利一区福利二区| 狠狠狠狠狠狠狠| 夜色资源站WWW国产在线视频| 风流老熟女一区二区三区| 日韩精品中文字幕一线不卡| 国产情侣激情在线对白| 亚洲熟女av中文字幕| 国产又粗又爽视频| 美女mm131爽爽爽午夜| 五月天婷婷影院| 丰满人妻一区二区三区高清精品 | 激情啪啪精品一区二区| 成年入口无限观看免费完整大片 | 亚洲天堂中文字幕在线观看| 国产av成人精品播放| 久久青青草原精品国产app| 成人九九| 夜夜狠狠躁日日躁成人网| 国产精品护士在线播放| 国产在线精品视频你懂的| 日韩精品 中文字幕 视频在线| 精品国产精品中文字幕| 熟妇无码熟妇毛片| 国产乱码精品一区二三区 | 亚洲欧美在线综合一区二区三区| 亚洲av成人在线一区| 亚洲欧美人成电影在线观看| 免费看黄色亚洲一区久久| 在线精品熟女AV播放| 人人澡超碰碰97碰碰碰| 亚洲精品乱码在线播放| 91九色国产porny| 国产亚欧女人天堂AV在线| 国产稚嫩高中生呻吟激情在线视频| 无码精品黑人| 欧美成人www免费全部网站 | 国模在线视频一区二区三区 | 中文午夜乱理片无码| 国产精品久线在线观看|