天天看點

RSS 2016研讨會随想:質疑者是正确的嗎——深度學習在機器人領域的局限和潛力都在哪裡?

在過去幾年裡,深度學習技術,在計算機視覺等諸多領域,帶來了天翻地覆的變革。在目辨別别和檢測、場景分類、動作識别等分支,深度學習都有着“驚豔”地成功應用。盡管那邊已經“熱火朝天”,但在機器人視覺研究這邊,深度學習的應用,才剛剛拉開舞台的幕布。

目前,深度學習已經開始在機器人領域“牛刀小試”。例如,在視覺引導機器人的抓取和操縱研究上,就有了成功的應用。

RSS 2016研讨會随想:質疑者是正确的嗎——深度學習在機器人領域的局限和潛力都在哪裡?

圖檔來源:谷歌深度思維團隊raia hadsell在rss 2016報告幻燈片

但即便如此,深度學習,仍然沒有發展成為機器人領域的主流方法。這是因為,有許多著名的機器人、人工智能等領域的專家,直言不諱他們的質疑和顧慮,他們不相信深度學習能在不同的機器人應用場景中,得到普及使用,并質疑深度學習驅動下的機器人安全性能。

質疑者在哪裡?

整體來說, 研讨會很有意思。在研讨會快結束的時候,主持人pieter abbeel(斯坦福大學副教授)問道,現場有多少的觀衆,對深度學習在機器人領域的應用,秉持懷疑态度,150~200的觀衆席中,僅有5~10名觀衆舉手表示質疑。

即使身處質疑者的陣營,他們的立場也并非堅定如鐵,因為在被問到為啥質疑時,他們表态說,作為機器人研究的一個輔助工具,深度學習還是有用武之地的。

質疑者的疑慮,并非空穴來風,這些疑慮主要來自兩個方面,一是在特定場景下,機器人的行為難以確定。比如說,自動駕駛機器人,在遇到險情時,是保護車上的主人——司機,還是要保護路上的行人?

二是深度學習的可解釋性。深度學習在某些領域的應用效果極佳,可是為什麼極佳,深度學習的應用者們,目前為止,也未能給出合理的解釋。

針對第一點疑慮,著名未來學家kevin kelly(昵稱kk)在《失控》一書中給出了一點解釋。kk預言未來的世界,有兩個特征:(1) 自然生命體的機械化;(2) 人造生命體的生物化。對于類似與機器人的人造生命體,kk非常樂觀地告訴我們,不必擔心:作為造物者,我們要對人造生命體負責,讓他們遵循機器人三定律就好。(你信kk所言嗎?你不疑慮嗎?)

質疑陣營和擁護陣營之間,并非泾渭分明。時間流逝掉得不僅僅是歲月,還有觀念的淡化或轉化。下面說的就是一個有關質疑者的故事——larry jackel(著名人工智能專家、north c .科技公司主席)曾經參與了一個關于神經網絡未來的著名賭局。

一場有關神經網絡的著名賭局

我們知道,卷積神經網絡是深度學習最重要的分支之一。“卷積”和“深度”是神經網絡互相獨立的兩個性質。“卷積”指的是前端有卷積層;“深度”指的是除了卷積層之外還有很多層。現在看來,深度學習在很多領域都是風生水起,大放異彩。但這僅僅是“看見賊吃肉,沒見賊挨揍”。

雖然大部分人的感覺,深度學習是最近幾年才迅速崛起的,但深度學習的基礎理論——人工神經網絡,早在上個世紀八十年代,就有了一定的發展,後期遭遇瓶頸,進入漫長的“冬眠期”。其中卷積神經網絡在剛面世時,就受到了很多人的質疑,vladinmir vapnik就是衆多質疑者的一個。vapnik是何許人也?此君來頭不小。他不僅是一名出色的數學家,而且還是目前應用最廣的人工智能模式之一——支援向量機(svm)之父。

那時(1995年),jackel認為,到2000年,人們能夠明确了解人工神經網絡能夠發揮多大作用。

vapnik并不認可這個觀點。他認為,别說1995了,就算到2005年,也就是十年後,任何思維正常的人,都不會知道神經網絡有啥用,怎麼用。

1995年3月,在誰也不能說服誰的情況下,二人決定打賭定輸赢。賭注是一頓奢華晚餐。

雙方在證人面前簽字畫押,yann  lecun是第三方簽名人(yann lecun ,目前炙手可熱的人工智能專家,facebook人工智能實驗室主任,紐約大學資料科學中心創始人,當年由 jackel招進貝爾實驗室)。

一開始,vapnik赢了,因為到了2000年,神經網絡的内部工作原理,基本上仍然被神秘所籠罩,研究人員無法明确地判斷出,如何讓神經網絡更好地應用在現實生活之中。

但vapnik猜到了前頭,卻沒有猜到後頭。

在2005年左右(更确切地說是2006年),加拿大多倫多大學教授、機器學習領域的泰鬥hinton教授和他的學生salakhutdinov在頂尖學術刊物《科學》上發表了一篇文章,開啟了深度學習在學術界和工業界的“拓疆擴土”的浪潮。這篇文章提供了兩個核心資訊:(1)很多隐層的人工神經網絡具有優異的特征學習能力,學習得到的特征對資料有更本質的刻劃,進而有利于可視化或分類;(2)深度神經網絡在訓練上的難度,可以通過“逐層初始化”(layer-wise pre-training)來有效克服,可在海量資料上展開并行神經網絡的參數訓練。

現在的局面,大家看到了。在很多領域中,深度學習(卷積神經網絡)得到非常廣泛而深入的應用。如果jackel已經兌現了自己的賭注,那麼現在的vapnik,似乎應該回請jackel兩頓奢華晚餐,作為補償。在現實面前,如果vapnik不固執己見,那麼這名先前的質疑者,是時候轉變自己的觀點了。

雖然深度學習有了比較廣泛的應用,但質疑并沒有結束。

比如說,深度學習這項技術雖然很強大,但為啥這麼強大?即使是深度學習的領域專家,也不能給出令人信服的理由。也就是說,深度學習的内部工作原理,仍然是雲罩霧繞,仍然是個有待破解的謎。

是以,也有人說,深度學習壓根就不是什麼科學嘛,僅僅是一個工程而已。如同那句人工智能的調侃:“有多少人工,就有多少智能”。深度學習的調參,何嘗不是一個體力活?

RSS 2016研讨會随想:質疑者是正确的嗎——深度學習在機器人領域的局限和潛力都在哪裡?

圖檔來源:oliver brock在rss 2016報告幻燈片(oliver brock為德國柏林大學 機器人與生物實驗室研究員)

如果深度學習内部的機理都弄不清楚,就把這套理論應用在更貼近人們生活中的機器人上,這靠譜嗎?安全性又如何保證?人們不能不疑慮重重啊!

沉默的大多數

在這次研讨會上,表面上看來,現場表示質疑的人,比例較小(5/150左右),但實際上,這個比例可能要大得多,因為有些觀衆即使身處“質疑者”陣營,也不會輕易公開發聲。是以,不論是問卷調查也好,還是舉手表決也罷,不要認為,在這類場景下,就一定能夠把大多數人的真實意思表達出來。

之是以這麼說,是有其理論依據的。早在1974年,德國社會學家伊麗莎白•諾爾-諾依曼(elisabeth noelle-neumann)就在其名著《沉默的螺旋》(the spiral of silence)中 ,就表達了類似的觀點:大多數個人會力圖避免由于單獨持有某些态度和信念而産生的孤立。因為害怕孤立,他便不太願意把自己的觀點說出來。是以,當發覺自己的某一觀點無人或很少有人理會(有時會有群起而攻之的遭遇),即使自己贊同它,也會保持沉默。意見一方的沉默,造成另一方意見的增勢,如此循環往複,便形成了一方的聲音越來越強大,進而形成“沉默的大多數”,而另一方越來越沉默下去的螺旋發展過程。

質疑還在繼續,他們是正确的嗎?讓時間給出答案吧。

繼續閱讀