2

基本可以確定,未來某一天你會坐上無人駕駛車。當那一天到來,或許控制你方向盤的人工智能也已經可以愉快地玩起Minecraft了。
聽起來很神,但是要教會學習算法——推動未來高級人工智能的動力——如何理解和在三維空間內導航,類似Minecraft之類的開放世界游戲是一級棒的工具。實現這一步,對創造可以與真實世界進行復雜互動的人工智能,是非常重大的一步。
電子游戲經常被認為是逃避現實的無腦行為,但是因為游戲里帶來如此大量的信息——想想看Minecraft里面玩家創造的擴展性世界——他們尤其適合給AI當做教材,教會他們如何感知世界并與之互動。“找個人來教AI很難,”Xerox的研究員Adrian Gaidon說,因為它們“在真實世界里還不如個嬰兒,你得什么事情都給它們解釋。”
到某一階段后,人類完全沒有這個時間和耐心。而電子游戲則沒有這個問題。你可能對它們不耐煩,但是它們對人絕不會不耐煩。
通常,被稱作“深度學習”的算法,作為現代人工智能的基礎,研究員訓練它們的方式是給它們填鴨大量的數據。這些系統把數據吞下,從中找尋模式。如果你想教類似AlphaGo的AI下圍棋,你把所有能找到的圍棋棋譜都喂給它吃。棋類游戲中,這是最簡單的一部分。即便是最難的棋類游戲中的陰謀詭計,在計算機看來也不難,AlphaGo可以從幾百萬大小的樣本庫中學習。
但是對于更復雜的任務,例如說,開汽車,收集足夠的信息在物流和財務上的挑戰都太大了。谷歌進行了不計其數的無人車試驗,用各種原型收集了幾百萬英里路程,完善控制汽車的AI。對于不如谷歌和百度這么土豪的公司,在有限的資源下,這種方法對研究員來說是不可行的。這讓電子游戲越來越有吸引力。在游戲世界,你可以相對劃算且快速地收集到大量信息。
18個月前,Adrien Gaidon看見最新版《刺客教條》的預告片,他忽然靈機一動。“我很震驚,因為我以為這是一個電影的預告片,而這實際上是CGI。我有20秒鐘都被騙了。這是我第一次。”
他思考,如果現代游戲可以輕松騙到我,也許他們也可以去騙騙AI。所以他和Xerox的團隊開始用電子游戲引擎Unity,給深度學習神經網絡輸入類似汽車、馬路和人行道等圖片,讓它學會識別真實世界中的這些物體。
研究員已經有過成功案例。谷歌AI在學會下圍棋前,還學會了Atari游戲。其他AI項目還學會過《超級馬里奧》等級的游戲。不過,使用游戲引擎做三維渲染,以及在這些空間內訓練AI,帶來了只有最近才變得可能的復雜程度。
“游戲引擎的真正好處是,你制造像素的時候也知道這些像素對應的是什么,”Gaidon說,“你不只是制造像素,你也在制造AI所需的指導。”
目前為止,Gaidon說他在Xerox的工作非常成功:“我現在想展示的是,這項技術已經足夠成熟,可以用計算機里的數據來訓練其他計算機軟件。”
微軟同樣也看到了這其中的價值。公司最近宣布,下半年會發布Malmo項目,一個可以“讓計算機科學家用Minecraft設計AI實驗”的開源平臺。在其復雜度和開放度之外,Minecraft提供了AI實驗的新方法,Malmo項目的研究負責人Katja Hoffman說。
“你玩Minecraft的時候,你實際在這個復雜的3D世界里,”Hoffman說,“你從你的感官輸入里感知到世界,你的交互方式包括通過走來走去、放置模塊、建造東西還有跟其他人物互動。這種充滿刺激的性質,與我們和真實世界的交互方式相似。”
Hoffman和團隊希望,他們的工具可以將研究推向比Gaidon團隊更加激進的方向。在類似Malmo項目中學到的技能,她相信可以讓AI不僅學會在Minecraft中走動,并且學會在我們的真實世界中行動。“我們認為這是個非常基礎的AI研究項目,我們希望大致理解,個體如何與周圍環境互動、并理解周圍環境。”她說,“在真實世界和限制更多的游戲之間,Minecraft是一個完美的中間點。”
然而,從模擬到現實的轉變是非常復雜的。游戲中的模擬通常不像真實人類一樣行動,而且游戲世界是為了簡單易懂而造的,并不是為了百分百復制真實世界。另外,任何個體,人類或其他的,如何建造出對空間現實的認知,目前仍然是一個謎。
“如何開發出,對環境能建構出有意義的內在表征的智能個體,我們在這條路上還處于非常早期的階段。”Hoffman說,“對人類來說,我們好像整合了我們所有的各種感官。我想,關聯各種信息來源,是一個非常有趣的研究挑戰。”
當科學家終于搞明白AI如何能建構某個環境的內部表征,它的形式也許會出乎人們的意料。這種形式有可能是前所未見的。“這也許和我們大腦中實際的情況非常不同。”Hoffman說。
這應該沒那么出人意料。人們想飛,但是真的飛起來的方式,與鳥兒飛行的方式完全不同。“我們受到鳥和昆蟲的飛行方式啟發。但真正重要的是,我們理解實際的機制,例如如果創造正確的壓力,或者把物體從地面飛起來的正確速度。”
對于AI也一樣。計算機感知世界的方式已經是與人類完全不同。舉個例子,最近倫敦的ScanLAB項目讓我們知道了,無人車的激光掃描“眼”如何看這個城市。結果非常奇異,幽靈與破碎圖像的“平行景觀”,城市景觀交織在“感知機器的錯覺與幻覺“中。
同樣的,谷歌最近的例子證明,AlphaGo是以人類理解不了的方式去理解古老的圍棋。
那么,下一代“感知機器”眼中的世界又是什么樣的呢?通過虛擬空間算法建造出來的模型、方法和技術——把它們應用到我們的城市、公園和家里,它們會看見什么呢?我們在以更有力的方法教會AI理解世界。電子游戲可以幫助機器實現這種理解。但是,當這種理解實現的時候,到時我們也許就已經看不懂了。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。