让AI拥有好奇心，它就可以一直看电视了

2018-08-23 23:50:00

对大部分人工智能来说，包括用于翻译的AI，在Facebook上标记照片以及优化最佳导航路线的AI，都依赖于人类向其提供一些信息，比如，我们要向算法展示不同语言中具有相同含义的句子，不同照片下的同一个的不同样貌以及如何为汽车绘制理想的行驶路线等。

但现在，有一些人工智能研究员正在探索如何赋予算法类似人类的好奇心，以便让这些系统可以在美元任何人类指导的情况下进行自主学习。来自OpenAI（一个由埃克隆·马斯克、山姆·阿尔特曼及其他硅谷大佬创建的非营利性AI实验室）、加州大学伯克利分校和爱丁堡大学的研究人员的最新研究显示，当为AI算法提供一个简单定义的好奇心时，该系统就可以在没有任何人为其提供信息的情况下，独自探索超过50个视频游戏，甚至还能打败其中的一些。

不过，好奇心也是有代价的。研究人员表示，AI agent在看到新鲜事物时会得到奖励，所以有时候它会故意在游戏中失败以出现“Game Over”的界面，或者化身为电视遥控器，通过不断更换频道来找新事物。

什么是人工好奇心（artificial curiosity）？

OpenAI团队对人工好奇心的定义相对简单：该算法会试图预测其未来的环境框架。当这个框架会真的发生时，算法会因预测误差而得到奖励。他们的想法是，如果算法可以预测环境中会发生什么，那么之前它就应该已经看过了。

这就是为什么AI agent会如此擅长《超级马里奥兄弟》这类的游戏——这些游戏是基于对未来的探索并不断进入下一个级别的。

那电视视频有什么特别之处呢？

OpenAI的研究员Harri Edwards在接受媒体Quartz的采访时表示，让AI agent不断更换频道的想法源于一个名为“the noisy-TV problem”的思想实验。电视上的画面很少是静止的，所以一个拥有好奇心的AI agent永远无法真正预测接下来会发生什么，反而会被电视节目吸引，一直看下去。在现实世界中，可以把它想象成一种完全随机的东西，就像瀑布中的光线会有不同的闪烁方式一样。

随后，研究人员通过将数字电视置于3D环境中，并允许agent通过点击按钮更改频道来对自己提出的理论进行测试。当agent开始不断更换电视频道时，新图像流的出现使得AI对电视不可抗拒。Edwards表示，有些情况下人工智能可以将自己的注意力从电视上移开，不过这种情况只能是AI所处的环境比电视上的下一个画面更有趣。

游戏之外

这项研究的重点不仅仅是用AI打败视频游戏，更重要的是了解算法如何更好地对周围环境做出解释。由于这些算法被证明在探索视频游戏方面有显著效果，研究人员表示，它们也可以用来简化调试代码或通过不断玩视频游戏以确保不会出现任何故障。

原文发布时间为：2018-08-23

本文作者：Sandy

本文来自云栖社区合作伙伴“

人工智能观察

”，了解相关信息可以关注“

”。

让AI拥有好奇心，它就可以一直看电视了

继续阅读

开源低带宽语音编解码器

新闻 | Mapbox 牵手阿里，飞猪旅行上线六大城市地图功能

241 Different Ways to Add Parentheses（C代码版）

【趋高机器视觉】机器视觉技术原理解析及解决方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制规程及特点4． CSMA/CD协议5． CSMA/CD的优点6．结束语

极大似然法(ML)与最大期望法(EM)

[HTML5]自定义属性 data-* 和 jQuery.data 详解

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

C++ 第十五周报告1--《冒泡法排序》

2021年危险化学品经营单位安全管理人员考试题库及危险化学品经营单位安全管理人员考试技巧

笔试面试题目：滑动窗口(二)

数据结构与算法（27）——排序（二）

无人机--飞控科普

Dijkstra--简易版（最短路径）

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

hdu7108哈希