AI版“大逃殺”!透過遊戲不斷增強AI的適應性和學習能力

長期以來,遊戲一直是衡量人工智慧技術進步的方式,透過在策略中與頂尖人類玩家進行較量來展示演算法的“智慧”程度。

AI版“大逃殺”!透過遊戲不斷增強AI的適應性和學習能力

紐約大學坦登工程學院副教授朱利安·託格利烏斯說過:“電子遊戲提供了我們所擁有最好的智力測試。電子遊戲是一種優秀的訓練AI演算法的方式,因為它們循序漸進地讓人類的思維經歷越來越難的挑戰。

電子遊戲旨在透過讓玩家專注於克服障礙和跟隨後續故事等元素來挑戰人類的思維。

這使得電子遊戲成為訓練AI的理想環境。遊戲提供的結構框架、重複訓練以及能力強化,這都有助於人工智慧的演算法學習。

其實透過遊戲訓練AI並不是最近才出現的,早在數年之前OpenAI就已經透過遊戲訓練AI了,為此他們還

推出了一個叫做

Neural MMO的大型多人線上遊戲。在這個遊戲中所有的“玩家”都是AI 。

這裡是文章圖片\2。gif

在遊戲設定中,整個地圖上的資源是有限的,也有食物的存在,AI則被分為不同種族,根據種族不同有著近戰、遠端、法術攻擊三種模式。

他們在這個世界中的目標只有一個就是“活到最後”。AI必須合理地選擇適合自己發展的環境,以及與其他AI爭奪有限的食物資源。

這裡是文章圖片\3。gif

值得注意的是,和人類玩家不一樣,在AI的“認知”中他們是不知道一局遊戲結束後是可以“重生”的。而AI認為自己只有一次生命,會根據自己的邏輯堅定地執行“活到最後”的指令。

當進入遊戲的AI變多後,AI們也會做出決策,自發地開拓地圖的角落避免爭端,而每一個AI做出的決策,都會在一定程度上影響到別的AI的決策選擇,情況可以說是瞬息萬變。

簡單來說,這個遊戲就是一個AI的“鬥獸場”,最後活下來的AI適應性和學習能力一定是最強的那個。

OpenAI

就是這樣不斷的進行遊戲來增強AI的適應性和學習能力。

在長久的生物進化過程中,活下來的動物們都各自進化出了各自的特徵,人類是其中的佼佼者,進化出了對自己而言最適合生活在這個世界的特徵以及生活方式。而以“人類”為最終目標的AI,進化的方向自然也是這樣,更多的是“思考方式”上的進化。

將AI置於遊戲世界中進行訓練

,用這種策略研究是一個合乎邏輯的選擇,它看起來也是合適的選擇。無論是人工世界還是自然世界,此類活動都有一個根本點:讓人工智慧做好準備,進入最大的遊戲——現實。