“讓Minecraft變成AI界的奧林匹克運動會,這個想法非常棒?!?/p>
微軟的Project Malmo項目開始于2015年6月份,其前身為Project AIX,該項目是基于Minecraft的一個成熟的AI實驗平臺,旨在支持人工智能領域的基礎研究工作。Project Malmo平臺由兩個部分組成:Java版的游戲模組和幫助AI智能體感知和行動的代碼。這兩個部分都可以在Windows、Linux或者 Mac OS環(huán)境下運行,研究人員可以使用任何一種語言來對其中的AI智能體進行編程。
具體的場景是,研究人員利用Minecraft訓練AI智能體操控游戲里的角色并執(zhí)行各種任務,比如穿過橋梁或建造復雜的物體,而之前,操控游戲角色往往是由人類玩家來完成的。不僅如此, Project Malmo平臺還提供一些讓人類玩家和人工智能體互相協(xié)作的玩法 :游戲界面會展示一個聊天窗口,人類玩家可以和一個初生的智能體進行對話。
微軟曾在官方博客中表示,由于Minecraft涉及到各種問題的解決、空間的建立、時間上的推演甚至是合作,因此非常適合用于訓練人工智能。
Katja Hoffman是微軟劍橋研究院的一名研究員,也是Project Malmo項目的帶頭人。她說:“從長遠來看,我希望研發(fā)出的人工智能體,可以被任何一個用戶教導,并幫助用戶完成一些目標任務?!?/p>
(圖為Project Malmo團隊,第一排右二金發(fā)女生即為Katja Hoffman),圖自:Microsoft Blog
上周, Hoffman在紐約的一個學術會議上向AI領域的研究人員們演示了這個項目,并表示實現(xiàn)人類與AI的合作是這個項目的一個關鍵目標。另外,Project Malmo如今已經(jīng)在GitHub上開源, 相關工具已經(jīng)免費開放下載,以幫助開發(fā)者能夠更簡單地對人工智能領域進行加強和完善。Hoffman說:“我們在其中已經(jīng)內(nèi)置了足夠多的功能,供研究者來開發(fā)協(xié)作型AI?!?/p>
Project Malmo 目前正專注于測試強化學習算法,這個算法通過模擬的獎勵機制來訓練計算機完成特定任務。例如,用強化算法訓練一個AI智能體控制Minecraft里的角色,穿越一個堆滿了障礙物的房間,如果任務成功就給其一個獎賞。人類玩家可以參與這個過程,為智能體提出一些幫助性建議,智能體之后會逐漸了解并運用這些建議。
如下圖,名為human 1的角色由人類玩家控制,名為malmo 1的角色由算法控制著。
微軟CEO薩提亞·納德拉(Satya Nadella)曾于6月28日親自撰寫《未來的伙伴關系》(The Partnership of the Future)一文,描繪人類與AI合作解決社會問題的未來景象,并強調(diào)越來越聰明的機器學習算法在幫助人類提升工作效率方面具有巨大潛力, 而AI是微軟尤其重要的發(fā)展方向。
Hoffman相信這個項目將最終應用于常規(guī)游戲里。她說:“我可以想象出,未來你讓智能體去處理游戲中比較單調(diào)無聊的部分?!?/p>
AI協(xié)助Minecraft玩家打游戲,這只是實現(xiàn)計算機軟件幫助人類處理日?,嵤碌牡谝徊?。“我們需要開發(fā)出對人類真正有益處,賦予人類更強力量的東西,”Hoffman說。
AI研究人員普遍已經(jīng)開始把計算機游戲轉(zhuǎn)變?yōu)闄z驗成熟機器學習方法的試驗場。去年年初, 谷歌旗下DeepMind公司演示了一個AI系統(tǒng),系統(tǒng)自主學習了Atari 2600游戲機上的49款游戲 ,并隨后在29款游戲中的得分超過游戲行家,一時引發(fā)轟動。這個AI系統(tǒng)中運用的算法糅合了深度學習和強化學習。接著,DeepMind公司向外界展示了該AI系統(tǒng)學習操控更為復雜的3D游戲的零碎畫面,但到目前為止還沒有對此曝露更多的工作進展。
Minecraft本是一款獨立游戲,于2014年被微軟收購,盡管畫面極其簡單并且缺乏明確的游戲目標,但其憑借著能激發(fā)出玩家的驚人創(chuàng)造力而廣受歡迎。游戲迷們用它建造出了一系列無與倫比的復雜建筑和機械裝置,還有玩家利用其中的“紅石”元素制作出了CPU,可謂真正意義上的計算機中的計算機。
雖然Minecraft比較簡單,但是它可以為眾多機器人算法提供一個有用的試驗場。去年7月份,布朗大學的Stefanie Tellex教授帶領的團隊開發(fā)出一款讓機器人快速確定一串動作順序的算法,當時就是使用了Minecraft 這個“試驗場”。她表示 Malmo平臺一個非常大的用處就是可以讓研究人員更加容易地比較他們的研究方法 。她說:“讓Minecraft變成AI界的奧林匹克運動會,這個想法非常棒?!彼€指出,這個平臺還能更有效地搜集大量數(shù)據(jù),比如關于人類和AI互動的數(shù)據(jù),而這些數(shù)據(jù)正是現(xiàn)代機器學習非常需要的。
雖然Malmo平臺主要針對人工智能、機器學習和機器人學領域的專業(yè)人士,但是任何有足夠技術能力的人都可以下載這個平臺,來針對游戲內(nèi)置的AI智能體進行實驗。游戲里包含了幾個機器學習的程序包和AI智能體的例子。而實際上,目前下載了這個游戲的人群里確實包含了一批業(yè)余愛好者和并不專攻AI領域的軟件工程師。
Minecraft這款有點笨拙的粗糙的像素游戲, 可能會成為人類與人工智能(AI)一起學習協(xié)同工作的絕佳平臺。
- QQ:61149512