人工智能訓練，OpenAI 創造 Universe 虛拟世界

2021-11-08 14:48:29

在訓練人工智能的時候，研究人員常常會建構一個虛拟世界，例如加拿大阿爾伯塔大學的研究人員提供了 atari 學習環境，讓人工智能系統玩 atari 的老遊戲，微軟提供了基于 minecraft 的虛拟世界 malmo。如今，舊金山人工智能實驗室 openai 宣布了全新的虛拟世界 universe。

在 universe 的龐大世界裡，人工智能系統能夠使用軟體、玩遊戲、浏覽網頁。universe 是開放的平台，而且多數代碼都是開源的，任何人都能夠使用它。這意味着任何應用都能接到 universe 上面，而人工智能系統可以與之互動。通過這種方式，人工智能系統可以學會使用各種不同的應用。

(圖檔來自 ibtimes)

openai 希望，universe 能夠推動機器“普通智力”的發展。“一個 ai 系統應該能夠解決你抛給它的任何問題。” openai 的研究員 ilya sutkever 對 wired 網站說。

在 universe 中，人工智能系統通過 vnc（虛拟網絡計算機）與虛拟世界互動。在不斷的試錯中，它将知道如何獲得高分、赢得遊戲，或者擷取其他類型的獎勵。這被稱作是“強化學習”（reinforcement learning）。值得注意的是，由于人工智能系統可以友善地在不同應用間轉移，它們能鍛煉自身的“普通智力”。它們能在某個應用上學到某項技能，然後将其運用到其它應用上。sukever 說，openai 已經開始建構這樣的人工智能系統。

（圖檔來自 01net）

目前，openai 在 universe 中添加了上千個遊戲，同時，它還與微軟合作，想要把 malmo 連接配接到 universe 中。與此同時，openai 的研究人員也在擴充 universe 的世界。除了遊戲之外，他們還想讓人工智能系統學會使用浏覽器。

問題在于，用浏覽器訓練“普通智力” 是一件更難的事情。在玩遊戲的時候，人工智能有一個明确目标，就是獲得更高分數，但是，網絡服務是沒有分數的。研究人員必須給出其它的獎勵，而且，他們并不确定這些獎勵能否幫助人工智能系統的成長。

在研究人員看來，無論虛拟世界，還是現實世界，處理問題的能力其實是相通的。如果人工智能系統能完成虛拟世界裡的各種任務，那麼，它們就擁有了人類一樣的“普通智力”，可以處理現實世界的各種事情了。

人工智能訓練，OpenAI 創造 Universe 虛拟世界

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普