玩游戲有助學習？認真臉的人工智能

本文作者：逸炫

2016-04-16 17:49

導語：學會玩游戲，對創造可與真實世界復雜互動的人工智能，是非常重大的一步。

玩游戲有助學習？認真臉的人工智能

基本可以確定，未來某一天你會坐上無人駕駛車。當那一天到來，或許控制你方向盤的人工智能也已經可以愉快地玩起Minecraft了。

聽起來很神，但是要教會學習算法——推動未來高級人工智能的動力——如何理解和在三維空間內導航，類似Minecraft之類的開放世界游戲是一級棒的工具。實現這一步，對創造可以與真實世界進行復雜互動的人工智能，是非常重大的一步。

電子游戲經常被認為是逃避現實的無腦行為，但是因為游戲里帶來如此大量的信息——想想看Minecraft里面玩家創造的擴展性世界——他們尤其適合給AI當做教材，教會他們如何感知世界并與之互動。“找個人來教AI很難，”Xerox的研究員Adrian Gaidon說，因為它們“在真實世界里還不如個嬰兒，你得什么事情都給它們解釋。”

到某一階段后，人類完全沒有這個時間和耐心。而電子游戲則沒有這個問題。你可能對它們不耐煩，但是它們對人絕不會不耐煩。

把AI給騙了

通常，被稱作“深度學習”的算法，作為現代人工智能的基礎，研究員訓練它們的方式是給它們填鴨大量的數據。這些系統把數據吞下，從中找尋模式。如果你想教類似AlphaGo的AI下圍棋，你把所有能找到的圍棋棋譜都喂給它吃。棋類游戲中，這是最簡單的一部分。即便是最難的棋類游戲中的陰謀詭計，在計算機看來也不難，AlphaGo可以從幾百萬大小的樣本庫中學習。

但是對于更復雜的任務，例如說，開汽車，收集足夠的信息在物流和財務上的挑戰都太大了。谷歌進行了不計其數的無人車試驗，用各種原型收集了幾百萬英里路程，完善控制汽車的AI。對于不如谷歌和百度這么土豪的公司，在有限的資源下，這種方法對研究員來說是不可行的。這讓電子游戲越來越有吸引力。在游戲世界，你可以相對劃算且快速地收集到大量信息。

18個月前，Adrien Gaidon看見最新版《刺客教條》的預告片，他忽然靈機一動。“我很震驚，因為我以為這是一個電影的預告片，而這實際上是CGI。我有20秒鐘都被騙了。這是我第一次。”

他思考，如果現代游戲可以輕松騙到我，也許他們也可以去騙騙AI。所以他和Xerox的團隊開始用電子游戲引擎Unity，給深度學習神經網絡輸入類似汽車、馬路和人行道等圖片，讓它學會識別真實世界中的這些物體。

研究員已經有過成功案例。谷歌AI在學會下圍棋前，還學會了Atari游戲。其他AI項目還學會過《超級馬里奧》等級的游戲。不過，使用游戲引擎做三維渲染，以及在這些空間內訓練AI，帶來了只有最近才變得可能的復雜程度。

“游戲引擎的真正好處是，你制造像素的時候也知道這些像素對應的是什么，”Gaidon說，“你不只是制造像素，你也在制造AI所需的指導。”

目前為止，Gaidon說他在Xerox的工作非常成功：“我現在想展示的是，這項技術已經足夠成熟，可以用計算機里的數據來訓練其他計算機軟件。”

嵌入在Minecraft中

微軟同樣也看到了這其中的價值。公司最近宣布，下半年會發布Malmo項目，一個可以“讓計算機科學家用Minecraft設計AI實驗”的開源平臺。在其復雜度和開放度之外，Minecraft提供了AI實驗的新方法，Malmo項目的研究負責人Katja Hoffman說。

“你玩Minecraft的時候，你實際在這個復雜的3D世界里，”Hoffman說，“你從你的感官輸入里感知到世界，你的交互方式包括通過走來走去、放置模塊、建造東西還有跟其他人物互動。這種充滿刺激的性質，與我們和真實世界的交互方式相似。”

Hoffman和團隊希望，他們的工具可以將研究推向比Gaidon團隊更加激進的方向。在類似Malmo項目中學到的技能，她相信可以讓AI不僅學會在Minecraft中走動，并且學會在我們的真實世界中行動。“我們認為這是個非常基礎的AI研究項目，我們希望大致理解，個體如何與周圍環境互動、并理解周圍環境。”她說，“在真實世界和限制更多的游戲之間，Minecraft是一個完美的中間點。”

然而，從模擬到現實的轉變是非常復雜的。游戲中的模擬通常不像真實人類一樣行動，而且游戲世界是為了簡單易懂而造的，并不是為了百分百復制真實世界。另外，任何個體，人類或其他的，如何建造出對空間現實的認知，目前仍然是一個謎。

“如何開發出，對環境能建構出有意義的內在表征的智能個體，我們在這條路上還處于非常早期的階段。”Hoffman說，“對人類來說，我們好像整合了我們所有的各種感官。我想，關聯各種信息來源，是一個非常有趣的研究挑戰。”

“感知機器的幻覺”

當科學家終于搞明白AI如何能建構某個環境的內部表征，它的形式也許會出乎人們的意料。這種形式有可能是前所未見的。“這也許和我們大腦中實際的情況非常不同。”Hoffman說。

這應該沒那么出人意料。人們想飛，但是真的飛起來的方式，與鳥兒飛行的方式完全不同。“我們受到鳥和昆蟲的飛行方式啟發。但真正重要的是，我們理解實際的機制，例如如果創造正確的壓力，或者把物體從地面飛起來的正確速度。”

對于AI也一樣。計算機感知世界的方式已經是與人類完全不同。舉個例子，最近倫敦的ScanLAB項目讓我們知道了，無人車的激光掃描“眼”如何看這個城市。結果非常奇異，幽靈與破碎圖像的“平行景觀”，城市景觀交織在“感知機器的錯覺與幻覺“中。

同樣的，谷歌最近的例子證明，AlphaGo是以人類理解不了的方式去理解古老的圍棋。

那么，下一代“感知機器”眼中的世界又是什么樣的呢？通過虛擬空間算法建造出來的模型、方法和技術——把它們應用到我們的城市、公園和家里，它們會看見什么呢？我們在以更有力的方法教會AI理解世界。電子游戲可以幫助機器實現這種理解。但是，當這種理解實現的時候，到時我們也許就已經看不懂了。

via Wired

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

1人收藏

逸炫

編輯

發私信

當月熱門文章