RSS 2016研讨會随想：質疑者是正确的嗎——深度學習在機器人領域的局限和潛力都在哪裡？

在過去幾年裡，深度學習技術，在計算機視覺等諸多領域，帶來了天翻地覆的變革。在目辨別别和檢測、場景分類、動作識别等分支，深度學習都有着“驚豔”地成功應用。盡管那邊已經“熱火朝天”，但在機器人視覺研究這邊，深度學習的應用，才剛剛拉開舞台的幕布。

目前，深度學習已經開始在機器人領域“牛刀小試”。例如，在視覺引導機器人的抓取和操縱研究上，就有了成功的應用。

RSS 2016研讨會随想：質疑者是正确的嗎——深度學習在機器人領域的局限和潛力都在哪裡？

圖檔來源：谷歌深度思維團隊raia hadsell在rss 2016報告幻燈片

但即便如此，深度學習，仍然沒有發展成為機器人領域的主流方法。這是因為，有許多著名的機器人、人工智能等領域的專家，直言不諱他們的質疑和顧慮，他們不相信深度學習能在不同的機器人應用場景中，得到普及使用，并質疑深度學習驅動下的機器人安全性能。

質疑者在哪裡？

整體來說，研讨會很有意思。在研讨會快結束的時候，主持人pieter abbeel（斯坦福大學副教授）問道，現場有多少的觀衆，對深度學習在機器人領域的應用，秉持懷疑态度，150～200的觀衆席中，僅有5～10名觀衆舉手表示質疑。

即使身處質疑者的陣營，他們的立場也并非堅定如鐵，因為在被問到為啥質疑時，他們表态說，作為機器人研究的一個輔助工具，深度學習還是有用武之地的。

質疑者的疑慮，并非空穴來風，這些疑慮主要來自兩個方面，一是在特定場景下，機器人的行為難以確定。比如說，自動駕駛機器人，在遇到險情時，是保護車上的主人——司機，還是要保護路上的行人？

二是深度學習的可解釋性。深度學習在某些領域的應用效果極佳，可是為什麼極佳，深度學習的應用者們，目前為止，也未能給出合理的解釋。

針對第一點疑慮，著名未來學家kevin kelly（昵稱kk）在《失控》一書中給出了一點解釋。kk預言未來的世界，有兩個特征：（1）自然生命體的機械化；（2）人造生命體的生物化。對于類似與機器人的人造生命體，kk非常樂觀地告訴我們，不必擔心：作為造物者，我們要對人造生命體負責，讓他們遵循機器人三定律就好。（你信kk所言嗎？你不疑慮嗎？）

質疑陣營和擁護陣營之間，并非泾渭分明。時間流逝掉得不僅僅是歲月，還有觀念的淡化或轉化。下面說的就是一個有關質疑者的故事——larry jackel（著名人工智能專家、north c .科技公司主席）曾經參與了一個關于神經網絡未來的著名賭局。

一場有關神經網絡的著名賭局

我們知道，卷積神經網絡是深度學習最重要的分支之一。“卷積”和“深度”是神經網絡互相獨立的兩個性質。“卷積”指的是前端有卷積層；“深度”指的是除了卷積層之外還有很多層。現在看來，深度學習在很多領域都是風生水起，大放異彩。但這僅僅是“看見賊吃肉，沒見賊挨揍”。

雖然大部分人的感覺，深度學習是最近幾年才迅速崛起的，但深度學習的基礎理論——人工神經網絡，早在上個世紀八十年代，就有了一定的發展，後期遭遇瓶頸，進入漫長的“冬眠期”。其中卷積神經網絡在剛面世時，就受到了很多人的質疑，vladinmir vapnik就是衆多質疑者的一個。vapnik是何許人也？此君來頭不小。他不僅是一名出色的數學家，而且還是目前應用最廣的人工智能模式之一——支援向量機（svm）之父。

那時（1995年），jackel認為，到2000年，人們能夠明确了解人工神經網絡能夠發揮多大作用。

vapnik并不認可這個觀點。他認為，别說1995了，就算到2005年，也就是十年後，任何思維正常的人，都不會知道神經網絡有啥用，怎麼用。

1995年3月，在誰也不能說服誰的情況下，二人決定打賭定輸赢。賭注是一頓奢華晚餐。

雙方在證人面前簽字畫押，yann lecun是第三方簽名人（yann lecun ，目前炙手可熱的人工智能專家，facebook人工智能實驗室主任，紐約大學資料科學中心創始人，當年由 jackel招進貝爾實驗室）。

一開始，vapnik赢了，因為到了2000年，神經網絡的内部工作原理，基本上仍然被神秘所籠罩，研究人員無法明确地判斷出，如何讓神經網絡更好地應用在現實生活之中。

但vapnik猜到了前頭，卻沒有猜到後頭。

在2005年左右（更确切地說是2006年），加拿大多倫多大學教授、機器學習領域的泰鬥hinton教授和他的學生salakhutdinov在頂尖學術刊物《科學》上發表了一篇文章，開啟了深度學習在學術界和工業界的“拓疆擴土”的浪潮。這篇文章提供了兩個核心資訊：（1）很多隐層的人工神經網絡具有優異的特征學習能力，學習得到的特征對資料有更本質的刻劃，進而有利于可視化或分類；（２）深度神經網絡在訓練上的難度，可以通過“逐層初始化”（layer-wise pre-training）來有效克服，可在海量資料上展開并行神經網絡的參數訓練。

現在的局面，大家看到了。在很多領域中，深度學習（卷積神經網絡）得到非常廣泛而深入的應用。如果jackel已經兌現了自己的賭注，那麼現在的vapnik，似乎應該回請jackel兩頓奢華晚餐，作為補償。在現實面前，如果vapnik不固執己見，那麼這名先前的質疑者，是時候轉變自己的觀點了。

雖然深度學習有了比較廣泛的應用，但質疑并沒有結束。

比如說，深度學習這項技術雖然很強大，但為啥這麼強大？即使是深度學習的領域專家，也不能給出令人信服的理由。也就是說，深度學習的内部工作原理，仍然是雲罩霧繞，仍然是個有待破解的謎。

是以，也有人說，深度學習壓根就不是什麼科學嘛，僅僅是一個工程而已。如同那句人工智能的調侃：“有多少人工，就有多少智能”。深度學習的調參，何嘗不是一個體力活？

圖檔來源：oliver brock在rss 2016報告幻燈片（oliver brock為德國柏林大學機器人與生物實驗室研究員）

如果深度學習内部的機理都弄不清楚，就把這套理論應用在更貼近人們生活中的機器人上，這靠譜嗎？安全性又如何保證？人們不能不疑慮重重啊！

沉默的大多數

在這次研讨會上，表面上看來，現場表示質疑的人，比例較小（5/150左右），但實際上，這個比例可能要大得多，因為有些觀衆即使身處“質疑者”陣營，也不會輕易公開發聲。是以，不論是問卷調查也好，還是舉手表決也罷，不要認為，在這類場景下，就一定能夠把大多數人的真實意思表達出來。

之是以這麼說，是有其理論依據的。早在1974年，德國社會學家伊麗莎白•諾爾-諾依曼（elisabeth noelle-neumann）就在其名著《沉默的螺旋》（the spiral of silence）中，就表達了類似的觀點：大多數個人會力圖避免由于單獨持有某些态度和信念而産生的孤立。因為害怕孤立，他便不太願意把自己的觀點說出來。是以，當發覺自己的某一觀點無人或很少有人理會（有時會有群起而攻之的遭遇），即使自己贊同它，也會保持沉默。意見一方的沉默，造成另一方意見的增勢，如此循環往複，便形成了一方的聲音越來越強大，進而形成“沉默的大多數”，而另一方越來越沉默下去的螺旋發展過程。

質疑還在繼續，他們是正确的嗎？讓時間給出答案吧。

RSS 2016研讨會随想：質疑者是正确的嗎——深度學習在機器人領域的局限和潛力都在哪裡？

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普