天天看點

人工智能訓練,OpenAI 創造 Universe 虛拟世界

在訓練人工智能的時候,研究人員常常會建構一個虛拟世界,例如加拿大阿爾伯塔大學的研究人員提供了 atari 學習環境,讓人工智能系統玩 atari 的老遊戲,微軟提供了基于 minecraft 的虛拟世界 malmo。如今,舊金山人工智能實驗室 openai 宣布了全新的虛拟世界 universe。

在 universe 的龐大世界裡,人工智能系統能夠使用軟體、玩遊戲、浏覽網頁。universe 是開放的平台,而且多數代碼都是開源的,任何人都能夠使用它。這意味着任何應用都能接到 universe 上面,而人工智能系統可以與之互動。通過這種方式,人工智能系統可以學會使用各種不同的應用。

人工智能訓練,OpenAI 創造 Universe 虛拟世界

(圖檔來自 ibtimes)

openai 希望,universe 能夠推動機器“普通智力”的發展。“一個 ai 系統應該能夠解決你抛給它的任何問題。” openai 的研究員 ilya sutkever 對 wired 網站說。

在 universe 中,人工智能系統通過 vnc(虛拟網絡計算機)與虛拟世界互動。在不斷的試錯中,它将知道如何獲得高分、赢得遊戲,或者擷取其他類型的獎勵。這被稱作是“強化學習”(reinforcement learning)。值得注意的是,由于人工智能系統可以友善地在不同應用間轉移,它們能鍛煉自身的“普通智力”。它們能在某個應用上學到某項技能,然後将其運用到其它應用上。sukever 說,openai 已經開始建構這樣的人工智能系統。

人工智能訓練,OpenAI 創造 Universe 虛拟世界

(圖檔來自 01net)

目前,openai 在 universe 中添加了上千個遊戲,同時,它還與微軟合作,想要把 malmo 連接配接到 universe 中。與此同時,openai 的研究人員也在擴充 universe 的世界。除了遊戲之外,他們還想讓人工智能系統學會使用浏覽器。

問題在于,用浏覽器訓練“普通智力” 是一件更難的事情。在玩遊戲的時候,人工智能有一個明确目标,就是獲得更高分數,但是,網絡服務是沒有分數的。研究人員必須給出其它的獎勵,而且,他們并不确定這些獎勵能否幫助人工智能系統的成長。

在研究人員看來,無論虛拟世界,還是現實世界,處理問題的能力其實是相通的。如果人工智能系統能完成虛拟世界裡的各種任務,那麼,它們就擁有了人類一樣的“普通智力”,可以處理現實世界的各種事情了。

繼續閱讀