利用 Deepmind 的這項技術,AI 也會玩《憤怒的小鳥》了
點擊播放
由deepsound提供技術支持
《憤怒的小鳥》,一款主流且經典的游戲,自 2009 年以來已經被下載了 40 億次;大約是地球上總人口的半數。除此之外,它催生了眾多相關圖畫小說和書籍,兩部電影和四個系列動畫劇,更不用說在智能手機及其他平臺上衍生出的無數游戲,甚至是 AR 版本的游戲。
雷鋒網注:上圖為 AR 版《憤怒的小鳥》之《豬島》
現如今,這款風靡全球的游戲也受到了來自 AI 的挑戰——AI 已經達到了該游戲頂級玩家的同等水平。
本周,Arixiv.org 上發表了一篇 論文 ,布拉格查爾斯大學的研究人員詳細介紹了一個叫作 DQ-Birds 的 AI 系統;該系統通過由 Deepmind 率先提出的 Deep Q-learning 算法訓練,從而在之前隨機取樣的環境下完成指定的任務。
雷鋒網 了解到 ,通常,研究人員在利用 Deep Q-learning 算法訓練 AI 系統時,還會采取 Double Q-learning 的算法;這種算法至關重要,因為它不是用來控制機器的下一步動作,而是用來評估決策。
研究人員在論文中寫道:
對于人工智能智能體來說,《憤怒的小鳥》這款游戲十分棘手,因為它需要考慮順序和游戲環境等隨機因素,還需要區分多種類別的小鳥,以及它們相應的能力和最佳點擊時間。如果想要成功地完成任務,人工智能智能體就要具備提前預測或模擬自己行動的后果。
為此,AI 系統會捕捉游戲截圖(為了讓游戲物理效果穩定下來,系統在拍照前會等待 5 秒鐘),然后對其進行裁剪,并隱藏“菜單”和“再玩一次”等 UI 元素。截圖經過裁剪后,系統會調整圖片的大小,讓它們呈相對統一的規范狀態,然后再傳送給 Deep Q-learning 機器學習算法。
雷鋒網 (公眾號:雷鋒網) 獲悉,為了更加深入地了解自己的模型,該團隊還從《憤怒的小鳥》中經典的 Poached Eggs 關卡里收集了 21 個難度級別的數據集,其中包括超過 11.5 萬個截圖。研究人員報告說,他們的 AI 系統已經能夠在某些級別上超過一個由四名人類專業玩家組成的小組的分數,但在 21 個難度級別的分數總和上還是略遜一籌,尤其是在過 18 級難度的關卡時。
除此之外,在 IJCAI(International Joint Conference on Artificial Intelligence,國際人工智能聯合會議)大會舉行期間,這個研究團隊還攜其 AI 模型參加了憤怒的小鳥 AI 競賽;這場競賽中,有幾個參賽選手的 AI 模型成功在三個回合中通過了 8 個此前從未接觸過的關卡,然而,DQ-Birds 系統并沒有獲勝,但它成功通過了其中 3 個關卡,這已經比 2017 年的半決賽水平還要高了。
研究人員在報告中說道:
我們在這項工作中有一個目標沒有達成,那就是 DQ-Birds 系統沒有完全超越人類;這有很大一部分原因在于該系統還缺乏足夠多樣的訓練數據集。但好消息時,DQ-Birds 在某些關卡已經能一次性過關。
。
