天天看點

阿裡開源強化學習研究平台Gym StarCraft

星際争霸一直是遊戲玩家心目中即時戰略類的經典之作,曆時十多年而不衰。而如今它更成為深度強化學習、人工智能算法研究的一個主要平台和工具。因為其蘊含了多智能體協作、多任務學習、宏觀政策規劃等複雜問題,一旦取得部分突破和進展,對商業和社會發展都會帶來極大影響。如國外的deepmind、facebook等公司相繼投入大量人力基于它進行通用人工智能的研究。

阿裡開源強化學習研究平台Gym StarCraft

在星際争霸的ai研究中,一直以來缺乏完善的工具鍊和開發環境。今年年初facebook公司釋出的torchcraft打通了星際和torch之間的橋梁,但卻不支援主流的python開發語言和tensorflow深度學習架構;早前openai公司釋出的gym算法平台雖然支援衆多遊戲環境下的算法驗證和對比測試,但卻缺少對星際的支援。

阿裡巴巴作為國内領先的大資料、雲計算公司,對以強化學習為代表的人工智能技術密切關注并投入巨大。針對星際ai的這一現狀,率先開發了一套專業易用的研究平台gym starcraft,并且已經開源。

在gym starcraft中,ai和強化學習研究者可以非常友善地使用python語言來進行深度強化學習智能agent的開發,它底層完成了對torchcraft和openai gym的封裝,支援基于tensorflow和keras等主流算法架構進行開發,僅需幾十行代碼即可完成一個基本的智能agent的開發。同時,便于評測智能agent的有效性,gym starcraft被內建在了openai gym這一主流的強化學習ai評測平台中,支援世界各地的星際ai研究者基于它去進行公平、快捷的效果評估,提供了一個人工智能的開放協作研究平台。

<a href="https://mp.weixin.qq.com/s/mpn5vmotzvdj_aaq-zkreg">原文連結</a>