天天看點

盤點丨DeepMind 2017年工作回顧:從AlphaGo Zero到Parallel WaveNet

<b>引言</b>

今年7月,世界排名第一的圍棋選手柯潔在連勝20場比賽後發表講話。這距離上次他在中國烏鎮未來圍棋峰會上與AlphaGo對弈已有兩個月。他表示:“ 在與AlphaGo比賽之後,我徹底反思并重新思考了這次比賽,現在我可以看到這樣的反思對我有很大的幫助。我也希望所有的棋手能夠去思考AlphaGo下棋的思想和技法,這些都是很有意義的。雖然是輸了,但我發現圍棋的變化确實太大了,它還在不停的進步,我也希望自己能不斷的進步,在自己的頂峰時期多待幾年。”

盤點丨DeepMind 2017年工作回顧:從AlphaGo Zero到Parallel WaveNet

圖1,未來圍棋峰會是一個為期5天的盛會,它有各式各樣的比賽形式,包括兩人對弈,團隊對弈以及與柯潔1對1對弈。

柯潔可以說是圍棋領域大師級的人物,聽到他的上述發言使我們倍感榮幸。其實我們也受到柯潔的啟發,他的這些感想暗示未來社會可以使用AI作為發現探索的工具,發現新知識,增加人們對世界的了解。特别是在機器輔助科學方面,我們希望人工智能系統能夠幫助人們在應對氣候變化和藥物發現方面取得進展,或者能夠尋找到複雜的新型材料以及幫助緩解醫療系統的壓力。這種潛在的社會效益便是我們建立DeepMind的初衷,我們很高興在應對基礎科學挑戰以及AI安全和倫理方面取得了持續的進展。

我們在DeepMind上所采用的方法受到神經科學的啟發,旨在幫助人們在一些關鍵領域(如想象力,推理,記憶和學習)取得進展。以想象力為例:這種人類獨有的能力在我們的日常生活中起着至關重要的作用,它使我們能夠規劃和推理未來,但這種能力對計算機來說卻是極具挑戰性的。我們以後将繼續努力解決這個難題,今年引入了imagination-augmented agents(想象增強代理),它可以從環境中提取相關資訊來幫助規劃未來的工作

我們訓練了一個神經網絡來示範如何自動地控制模拟環境中的各種簡化身體,這種方法受神經科學啟發,也是我們工作中最受歡迎的示範之一。這種複雜的運動控制是人體智能的标志,也是我們研究計劃的重要組成部分。雖然由此産生的動作有時候是狂野的,有時是笨拙的,但也取得了驚人的成功,而且還可以用于娛樂觀賞。

盤點丨DeepMind 2017年工作回顧:從AlphaGo Zero到Parallel WaveNet

圖2,DeepMind運動控制示意圖,連結:https://www.youtube.com/watch?v=gn4nRCC9TwQ

<b>“我們知道技術不是價值中立的。我們不能在基礎研究方面取得進展的同時,而不對我們技術的倫理和社會影響負責。”</b>

此外,我們在生成模型領域也取得了進展。就在一年前,我們提出了WaveNet,這是一個産生原始音頻波深度神經網絡,它能夠産生比現有的技術更好的且更逼真的模拟語音。那個時候,這個模型還是一個研究原型,而且直接用在消費産品中計算複雜度又太高。在過去的12個月裡,我們的團隊創造了一個新模型,将WaveNet的訓練速度提高了1000倍。在10月份,我們釋出了這個新的并行WaveNet(Parallel WaveNet)。現在我們已經将它部署在實際應用中,在谷歌助手(Google Assistant)中生成英語和日語的聲音。

WaveNet的改進隻是我們竭力使AI系統的建構、訓練和優化變得更容易的其中一例。今年我們釋出的其他技術,如分布式強化學習、基于總體的神經網絡訓練、新的神經結構搜尋方法,同樣使系統更容易建構、更精确和更快地優化。我們同時花了大量的時間創造新的、具有挑戰性的環境來測試我們的算法,這其中就包括我們與暴雪合作開發“星際争霸2”。

我們知道技術不是價值中立的。我們不能在基礎研究方面取得進展的同時,而不對我們技術的倫理和社會影響負責。這推動了我們在一些關鍵領域的研究,比如在深度學習的可解釋性方面,我們一直在探索新的方法來了解和解釋我們的系統。我們的團隊也緻力于開發切實可行的方法,來確定我們在享受未來科技帶來的便利同時保持這些系統始終在人類有效地控制範圍之内,這就是為什麼我們有一個成熟的技術安全團隊的原因。

盤點丨DeepMind 2017年工作回顧:從AlphaGo Zero到Parallel WaveNet

圖3,我們現在已經與四家NHS信托基金合作。

在十月份,我們又推出了DeepMind Ethics&Society這個研究項目,用以幫助我們探索和了解AI的實際影響,進而實作更大的社會效益。我們的研究受到了來自多個領域著名專家的指導,如哲學家Nick Bostrom、氣候變化專家Christiana Figueres、研究員James Manyika以及經濟學家Diane Coyle和Jeffrey Sachs。

人工智能發展必須切合社會的需求和關注點,這就是為什麼我們要與許多合作夥伴開展關于如何設計和部署人工智能的合作。例如,上司算法正義聯盟(Algorithmic Justice League)的Joy Buolamwini以及來自人權組織Article 36的專家和英國武裝部隊的專家,參加了Wired Live的會議,并讨論算法的偏見和限制緻命自動化武器使用的問題。正如我們經常說的那樣,這些問題太重要了,而且影響極為深遠。

這也是為什麼我們也需要和更多的領域開展合作來讨論如何預測和指導技術的發展方向,這些合作領域可以來自AI公司内部也可以是非AI公司。其中一個例子是我們今年共同主持的人工智能夥伴關系(Partnership on AI),它召集行業競争對手、學術界和民間團體共同讨論AI的倫理問題。在過去的一年裡,PAI已經迎來了43個新的非營利和已營利組織,以及一個新的執行董事Terah Lyons。在接下來的幾個月裡,我們期待與這個小組合作,研究廣泛的主題,包括算法中的偏見和歧視、機器學習對自動化和勞動力的影響等。

<b>“我們對我們在2017年的所有成果感到自豪,但我們深知DeepMind還有很長的路要走。”</b>

我們深信利用技術來實作社會效益的重要性,并且技術在影響現實生活中健康和能源方面等方面仍然有着巨大的潛力。今年,我們同意與NHS醫院信托建立新的合作關系,以部署我們的Streams應用程式,該應用程式支援NHS臨床醫生使用數字技術,去确定機器學習技術是否有助于提高乳腺癌的檢測,這也是我們參與的研究機構聯盟發起了一項開創性研究。

同時,我們也一直緻力于監管在健康方面工作。資訊專員在研究我們與Royal Free最初的合作中,取得了一些成果。DeepMind Health的獨立評論人發表了第一份關于我們工作的公開年度報告,我們也從這些報告裡總結了一些經驗教訓。他們的審查使我們以後的工作做的更好。我們已經在我們與患者和公衆的交流上做了重大的改進,包括與病人和照顧者的研讨會,并且我們也在探索在我們的系統中建立可信度的技術方法,例如可驗證的資料審計技術,我們計劃将其作為一個開源工具釋出。

我們對我們2017年的所有進展感到自豪,但知道還有很長的路要走。

在烏鎮AlphaGo與柯潔對戰并從競賽中退役了AlphaGo 的五個月後,發表了我們的第四篇Nature論文,論文關于名為AlphaGo Zero的新版本系統,這個版本不需要任何先驗知識。在數百萬遊戲的過程中,系統逐漸從頭開始學習“圍棋”遊戲,短短幾天就積累了數千年的關于圍棋對戰的知識。這樣做也揭示了非正常政策,并且揭示了我們從圍棋這個古老遊戲中的獲得的啟發。

我們的信念是:人工智能作為一項科學工具和人類智慧的增效器可以在為其他更為複雜問題領域發揮更大的作用。AlphaGo團隊已經在準備迎接下一個重大的挑戰,同時我們希望AlphaGo團隊借助圍棋獲得的算法上啟發僅僅隻是開始。

原文釋出時間為:2017-12-26

繼續閱讀