1956年夏天,一群數學家和計算機科學家占領了達特茅斯學院數學系大樓的頂層。在大約八周的時間裡,他們想象着未來新研究領域的可能性。達特茅斯學院(Dartmouth College)的年輕教授約翰·麥卡錫(John McCarthy)在為研讨會撰寫提案時創造了"人工智能"一詞。他說,這将探索會議的核心假設,即"人類學習過程的所有方面,或者人類智能的所有特征,原則上都可以被準确地描述,是以可以建造一台機器來模拟它。"
在那次傳奇的學術會議上,研究人員勾勒出了我們今天對人工智能的了解。它催生了研究人員的兩種傾向,一種是"象征主義者",他們開發了一種"專家系統",在1980年代達到頂峰。在會議之後的幾年裡,也有一些"連接配接主義者",他們幾十年來一直緻力于開發人工神經網絡智能,直到最近才開始取得重大成果。
長期以來,這兩種趨勢一直被視為互相排斥,不同取向的研究人員之間的投資競争造成了敵意。雙方都認為自己的立場是通用通用人工智能的積極解決方案。
回顧1956年大會以來的過去,人工智能研究人員的希望往往破滅,但這些挫折對他們影響不大。現在,即使人工智能正在徹底改變這個行業,并可能擾亂全球勞動力市場,許多專家也想知道今天的人工智能是否已經達到了其功能潛力的極限。
正如另一位作者在一篇題為"人工智能失敗的七種可能性"的文章中所概述的那樣,當今深度學習系統中的缺陷正變得越來越明顯。但是,開發人員幾乎沒有危機感。
是的,在不久的将來,這個行業可能會有另一個人工智能的冬天。但也可能是勵志工程師最終讓行業知道對機器的真正想法的時候。
"象征主義者"首先以簡單明了的方式向計算機灌輸知識。他們最初的想法是,知識可以用一組規則來表示,計算機程式可以使用規則邏輯來操縱這些知識。"象征主義者"的上司者聲稱,如果一個符号系統有足夠的結構化事實和預設的規則,這些知識的聚合最終将導緻一個共同的人工智能。
另一方面,連接配接主義者受到仿生學的啟發,發明了"人工神經網絡",可以接收資訊并了解其含義。
"連通性"最典型的開創性先例是"感覺",這是一台由康奈爾大學心理學家弗蘭克·羅森布拉特(Frank Rosenblatt)在美國海軍資助下建造的實驗機器。它有400個光傳感器組成視網膜,為大約1000個"神經元"提供資料,這些神經元處理并産生單個輸出。
1958年,《紐約時報》的一篇文章援引羅森布拉特的話說:"這台機器将是第一台像人腦一樣思考的裝置。
過于樂觀的估計導緻美國和英國政府機構盲目地将資金投入到投機性研究中。1967年,麻省理工學院教授馬文·明斯基(Marvin Minsky)寫道:"在一代人的時間裡......創造"人工智能"的挑戰将得到實質性解決。"
然而,此後不久,政府資金開始枯竭,因為官員們發現人工智能研究未能兌現他們暴跌的承諾。20世紀70年代見證了人工智能的第一個冬天。
然而,真正的AI信徒并沒有放棄。到20世紀80年代初,"象征主義"人工智能研究人員為人工智能研究帶來了新的鼎盛時期,因為"專家系統"有可能完全編碼來自特定學科的資訊。投資者希望這些"專家系統"很快能在法律或醫療行業找到商業應用。
最著名的"象征主義"人工智能項目始于1984年,當時研究人員道格拉斯·林内特(Douglas Lynette)開始了一個名為CYC的項目,該項目旨在将常識編碼到機器中。直到今天,Lynette和他的團隊仍在繼續向CYC的程式字典中添加事件和概念的資料,并通過程式規則解釋它們之間的關系。到2017年,CYC的字典有150萬個事件條目和2450萬個正常條目。然而,CYC遠未實作普遍智能。
20世紀80年代末,商業世界的寒風帶來了人工智能的第二個冬天。"專家系統"市場已經崩潰,因為它們需要昂貴的特殊硬體,無法與日益普遍的廉價台式計算機競争。到20世紀90年代,人工智能研究,無論是"象征性的"還是"連通性的",在學術界都不再流行,因為這兩種政策似乎都失敗了。
但是,取代"專家系統"的廉價計算機對連接配接主義者來說是一個福音,他們突然獲得了足夠的計算能力來運作具有多層人工神經元的人工神經網絡。這樣的系統被稱為"深度神經網絡",它們的工作方式被稱為"深度學習"。多倫多大學的Joffrey Hinton引入了一種稱為"反向傳播"的原理,允許神經網絡從過去的錯誤中學習。
Hinton的一名博士後學生于1988年進入AT&T的貝爾實驗室,在那裡他開創了使用神經網絡進行光學字元識别的技術,美國銀行迅速采用該技術來處理支票。Hinton等人最終獲得了2019年圖靈獎,他們經常被稱為"深度學習的教父"。
但神經網絡的倡導者仍然面臨着一個大問題:他們有一個更好的理論架構,計算機的能力正在增長,但世界上沒有足夠的資料來訓練他們的系統,至少對于大多數人工智能程式來說不是這樣。人工智能的春天還沒有到來。
在過去的二十年裡,一切都變了。随着網際網路的蓬勃發展,資料無處不在。數位相機和智能手機在網際網路上充斥着圖像,維基百科和Reddit等網站充斥着免費通路的文本,YouTube上有很多視訊。最後,需要足夠的資料來訓練神經網絡。
另一個主要發展來自遊戲行業。Ingweeda等公司已經開發出功能強大的顯示卡來處理遊戲中的圖像,執行複雜的着色和幾何變換。需要強大計算能力的計算機科學家意識到,他們可以使用圖形卡執行其他任務,例如訓練神經網絡。
Ivega注意到了這一趨勢,并建立了CUDA,這是一個允許研究人員使用顯示卡進行通用處理的平台。研究人員中有Hinton Labs的一位博士,他使用CUDA單獨編寫神經網絡代碼,這在2012年讓所有人感到驚訝。
他為"圖形網絡"競賽撰寫了這篇文章,該競賽旨在挑戰人工智能研究人員設計前瞻性的計算機系統,将100多萬張圖像分為1000個類别。雖然這個神經網絡不是第一個用于圖像識别的神經網絡,但它在2012年比賽中的表現引起了全世界的關注。AlexNet的錯誤率為15%,而第二名的錯誤率為26%。
神經網絡的成功歸功于顯示卡的計算能力和650,000個神經元的多層"深度"結構。在接下來的一年的"圖譜網絡"競賽中,幾乎所有人都使用了神經網絡。到2017年,大多數參賽者的錯誤率已降至5%,組織者将不得不結束比賽。
深度學習正在起飛。憑借顯示卡的計算能力和用于訓練深度學習系統的大量資料,自動駕駛汽車可以在路上行駛,語音助手可以識别使用者的聲音,Web浏覽器可以在幾十種語言之間進行翻譯。人工智能在以前被認為被機器不敗的遊戲中擊敗了人類冠軍,例如舊的棋盤遊戲圍棋和視訊遊戲《星際争霸II》。目前人工智能的蓬勃發展已經觸及了每個行業,為做出複雜決策提供了新的方法。
但深度學習不斷擴大的成功取決于神經網絡層數的不斷增加以及用于訓練它們的晶片的工作時間。人工智能研究公司OpenAI的一項分析發現,到2012年,訓練世界上最大的人工智能系統所需的計算能力每兩年翻一番,然後每3.4個月翻一番。許多研究人員擔心,對人工智能的需求正走在不可持續的軌道上。為了避免超過可用功率的限制,研究人員需要打破建構這些系統的既定方法。
雖然看起來"連通性"神經網絡陣營已經徹底打敗了"象征主義",但實際上這場鬥争的結果并沒有那麼簡單。例如,OpenAI的機器人因其拼寫自己的魔方的能力而成為頭條新聞。機器人的AI使用神經網絡和"符号"程式規則。它是許多新的AI系統之一,該系統使用神經網絡進行感覺和"符号"AI進行推理,這是一種混合方法,可同時提高AI效率和解釋性。
然而,神經網絡系統通常是不可信的不透明黑匣子程式。你現在能有一個道路清潔機器人給你做一杯咖啡嗎?這在今天是一個荒謬的命題,因為深度學習系統是為單一目的而建構的,不能将其功能從一個任務擴充到另一個任務。
更重要的是,學習一項新任務通常需要人工智能清除它所知道的關于如何解決以前任務的一切,這個難題被稱為"災難性遺忘"。在谷歌位于倫敦的人工智能實驗室DeepMind,機器人專家正在使用各種複雜的技術來解決這個問題。其他研究人員正在研究新型深度學習系統,這些系統将教會人工智能如何學習,然後将技能應用于任何領域或任務。
所有這些技術都可以幫助研究人員實作他們的最高目标:用孩子們成長過程中的流體智能來建構人工智能。年幼的孩子不需要很多資料來得出結論。他們隻是觀察世界,建立一個如何運作的心智模型,采取行動,并使用他們行動的結果來調整心智模型。疊代,直到孩子了解現實世界。這個過程非常高效和有效,甚至超出了當今最先進的人工智能的能力。
目前社會對AI的熱情,對于AI産業來說,又一次赢得了黃金時代,AI的資金處于曆史最高水準,幾乎沒有證據表明未來的投資會下降。世界各地的公司都在采用人工智能系統,因為他們看到他們的短闆可以立即改進,是以他們永遠不會停止使用人工智能。
但是,研究人員能否最終解決65年來一直沒有解決的終極人工智能難題:"讓機器更像我們",讓深度學習算法更具适應性,還有待觀察。