第四範式首席科學家楊強教授：人工智能的下一個技術風口與商業風口

作為華人界首個國際人工智能協會aaai fellow、至今為止唯一的aaai 華人執委，以及ieee fellow、aaas fellow、iapr fellow，楊強教授在專注學術研究的同時，也更關注如何讓人工智能技術落地轉化為生産力的問題。

作為第四範式首席科學家、範式大學的導師，楊強教授近日在第四範式公司内部進行了一場主題為“人工智能的下一個三年”的教育訓練，深入淺出地分享了自己在人工智能産業推廣上的經驗，并預判了人工智能即将爆發的技術風口與商業風口。此前，楊強教授與第四範式曾提出人工智能的五個必要條件，為人工智能行業提供了權威的準入标準。

以下内容根據楊強教授主題演講編寫，略微有所删減。

一、alphago為我們帶來了什麼

大家記得在2016年3月，alphago橫空出世對戰李世乭，這對于人工智能的社會影響非常大。這裡，我們問一下：alphago到底為我們帶來了什麼？

在alphago的搜尋中，deepmind團隊引入了一個新概念——即用深度學習和強化學習的結合來做兩種任務的判别，即來判别現在所在的棋盤是好是壞，同時來預測未來有利的走向。講到這裡大家應該能看出alphago的算法和未來商業模式的關聯，即：通過對大資料的分析，讓我們對“現在狀态”有了一個靠譜的了解；這個狀态可以是棋盤、可以是足球運動中兩隊交鋒的狀态，也可以是目前營銷的一個狀态。同時，下圍棋中的一步，可以了解成對未來走向的預判，在商業活動中，這可以是營銷活動中的下一步。這裡很重要的一點，是區分我們商業行為中的兩個任務，即對現實的判斷和對商業未來走向的預估。這兩個任務同樣重要，也同樣都需要大資料的支援。

因為圍棋是一個封閉式的遊戲（即沒有外界因素的幹擾），為了得到更多的資料，alphago也引入了自我博弈。所謂自我博弈就是自己玩遊戲，你會得到不斷的回報，然後來更新自己的政策，經過無數次這樣的比賽，最後會得到一個好的政策，你的最終輸出是一個行為的政策。是以alphago 也告訴我們，在一個封閉場景中，可以用自我博弈的模拟方法得到更多的資料。

從alphago到人工智能的應用流程

我們如果沿着下圍棋的步驟走，就要面對這些問題：你的人工智能算法的目标是什麼？有沒有資料？資料在哪裡？問題的邊界是否清晰？什麼叫合理的走法、什麼叫犯規的走法？你的特征在哪裡？又如何得到這些特征？是否可以得到一個持續的回報？這樣的一個流程是alphago設計團隊所走過的路。不妨把這些步驟記下來，變成一個workflow，看看其他的領域是不是可以重複alphago的成功。

比如，如果用alphago治療癌症，如何治療呢？治療癌症一般是用放射性來殺掉癌細胞，而每一個癌症患者需要的劑量、角度、頻次可能都不一樣，如果能把所有的這些資訊都記錄下來，再記錄治療結果，因為結果不是馬上就知道的，而是經過一段時間才知道，這樣就有了資料、有了特征、有了問題持續的回報，并且有了非常清楚的目标，即在副作用最小的情況下殺死癌細胞。并且這個workflow是可以重複的。

ai的發展曆史還有前30年，這些年的積累也很有用

剛剛我們說了alphago的一路曆程，但我們對人工智能的了解不應該片面地認為人工智能就是機器學習。人工智能的發展曆史還有前30年，前30年是從50年代中一直發展到80年代中。這30年ai是在幹什麼呢？是在做人工輸入的規則型的知識表達研究，以及基于這些規則的符号空間的推理和搜尋。我認為，這個人工規則型的知識表達在ai的應用當中也是必不可少的，因為在衆多領域當中還會碰到冷啟動的問題，以及如何規範一個領域的邊界的問題。這就是說，邏輯推理，邏輯知識表達，以及在符号空間的搜尋的人工智能這個分支，在今後幾年會和統計學習相結合，會大有發展。

這種發展會也涉及技術和商業兩個層面。

二、ai的技術風口在哪？

我們大家會關心的一個問題，是人工智能的技術在哪些方向可能會有大的突破。

深度學習

首先，是深度學習會繼續發展。這裡的發展不僅是在層次的增加，還包括深度學習的可解釋性、以及對深度學習所獲的的結論的自我因果表達。例如，如何把非結構化的資料作為原始資料，訓練出一個統計模型，再把這個模型變成某種知識的表達——這是一種表示學習。這種技術對于非結構化資料，尤其對于自然語言裡面的知識學習，是很有幫助的。另外，深度學習模型的結構設計是深度學習的一個難點。這些結構在今天都是非常需要由人來設計的。還有一個研究問題是如何讓邏輯推理和深度學習一起工作，這樣也可以增加深度學習的可解釋性。比如，建立一個貝葉斯模型需要有很多的設計者的經驗，到現在為止，基本上是由人來設定的。如果我們能從深度學習的學習過程中衍生出一個貝葉斯模型，那麼，學習、解釋和推理就可以統一起來了。

遷移學習

遷移學習也是我和戴文淵（第四範式創始人、首席執行官）一直在做的工作。給定一個深度學習的網絡，比如一個encoder網絡和一個decoder網絡，我們可以看它學習和遷移的過程，作為新的資料來訓練另外一個可解釋的模型，也可以作為一個新的遷移學習算法的輸出。即一個學生a在觀察另外一個學生b學習，a的目的是學習b的學習方法，b就不斷地在學新的領域，每換一個領域就為a提供一個新的資料樣本，a利用這些新的樣本就能學會在領域之間做遷移。是以這種過程叫做觀察網絡。有了這種一邊學習、一邊學習學習方法的算法，就可以在機器學習的過程中，學會遷移的方法。

自然語言的表示學習與機器閱讀

表示學習是當資料和任務沒有直接相關時也可以學，一個重要的例子叫做self-taught

learning，即我們通過很多supervise的資料、圖像，可以學出一種最好的表達。用這個表達加上任務，就可以很快地學會這種知識表示。這時非結構化的資料就相當有用了。比如，給出一段話讓機器去閱讀，機器學習可以自動地發現一些值得關注的點。比如，給定一個文章中的實體和一個未知變量有這樣的關系，然後使用者可以問你這個未知變量是什麼。能夠達到這樣的效果是因為深度模型已經具有了一種關注，這種關注是可以通過觀衆的學習（attention）來表達。其結果就好像我們一目了然地看了一本書，我們會把關鍵詞和它們的關系抓取出來。這實際上是利用類似人的一種直覺來進行學習。

人機對話系統

應該說有一個領域已經發展到了臨界點，就是人機對話系統領域。現在在這個領域，某些相對垂直的方面已經收取了足夠多的資料，一個是客服，一個是汽車（車内的人車對話）；還有一種是特定場景的特定任務，像amazon

echo，你可以跟它講話，可以說“你給我放個歌吧”或者“你播一下新聞”，amazon

echo裡面是圍了一圈的8個麥克風，這個陣列可以探測到人是否在和它說話，比如我和别人說話的時候，臉轉過去，它就不會有反應。這種喚醒功能是非常準确的。它的另外一個功能是當你的雙手沒辦法去控制手機的時候，可以用語音來控制，案例場景是客廳和廚房，在美國amazon

echo特别受家庭主婦的歡迎，是以像這種特定的場景，如果收集了足夠的資料，是可以訓練出這樣強大的對話系統來的。

強化遷移學習

我們可以想象，未來深度學習、強化學習和遷移學習的結合，可以實作以下幾個突破——回報可以延遲、可以個性化，把一個通用模型施加到任何個體上面，這樣一個複合模型可以叫做強化遷移學習模型。

人工智能的可靠性模型

as reliable services是aaai 前主席thomas dietterich在aaai

2016上給出的一個主題，人工智能隻能作為一些例證證明能夠做哪些事情，比如下棋，無人駕駛，但很多時候它還是不可靠的。它不像現在的一個商用軟體一樣，能讓你放心地去使用，以保證它的錯誤率肯定不會超過很小的比例。相反，ai

在犯錯的時候可能錯得非常厲害，是以用平均值來代表一個準确率是不恰當的，相反，應該更多地要考慮它的置信區間。換言之，小白使用者拿一些人工智能的子產品來搭一個系統，這個系統就應該能被搭出來，而且它的效果應該是在一個固定的範圍以内的，是以人工智能應該像軟體工程一樣做出來。

第四範式核心産品“先知平台”一直就在往這個方向發展，先知把人工智能的子產品工程化、并在一定程度上保證了可靠性，進而讓普通使用者用來搭建自己的人工智能系統。

三、ai的商業風口在哪？

上面我們考慮了人工智能的技術發展。下面我們看看商業領域。我們剛才列舉了ai

成功的5大必要條件：高品質的大資料、清晰的問題定義和領域邊界、懂人工智能且擅長應用和算法的跨界人才、足夠的計算資源、持續的外部回報。滿足這五個條件的領域，才有可能在未來出現人工智能的爆發。

智能客服

人機互動的智能客服，産生了很多外界公開的資料以及内部的資料、知識庫等，都可以用來制造機器人。尤其是可以用客服過去的資料來做訓練，這個資料量現在在垂直領域是逐漸在增加的。現在的對話系統也已經逐漸成為深度學習和強化學習的焦點。

新聞領域

另外一個比較看好的領域是新聞領域，新聞的分發和自動寫作。有很多編輯、解說、自動校對、作家等，其實是資料量足夠多的，有這麼多的文本，而且外界回報也越來越多了。給一篇文章，可以用機器學習來做自動摘要。

這樣一個工作的外部回報來自哪裡呢？實際上我們寫的那些paper就是一個外部回報，因為每篇paper都有摘要，如果一篇paper被收了，就說明摘要寫的還不錯，是以外部回報還是可以實作的。

這裡分享一個有趣的實驗，是香港科大同學做的“自動寫小說”項目。主要有兩個步驟，一步是讓它讀很多書，一步是這樣訓練出一個模型，這個模型再讓它變成一個生成式的模型，這樣就能用來寫小說了。舉個例子，我們提供《射雕英雄傳》和《笑傲江湖》，把這兩個結合起來，就可以寫一部新的小說了。

特定任務的智能機器人

例如amazon

的kiva機器人，大家可能知道amazon一個很大的優勢就是所有的倉儲都是由機器人來完成的，但是它也有勞工，被雇來用手做抓取，因為現在機器人的抓取是非常難的，那麼人和機器的優點就結合起來了。此外，醫療機器人也是非常專業的一個領域，它可以給人開刀縫線，但它不是自動的，而是通過遠端控制的，但控制的精密度非常高，如果它收集到足夠量的資料，是可以達到自動的效果的，以後我們可能開刀就由機器人來代勞了。

在醫護領域，無障礙輔助的應用領域痛點特别強烈，現在資料量可能還不是特别多，因為畢竟這一群體還是少數人，但是痛點很強，是以未來也許會有資料。

ai+有機食品

我們在香港曾去通路過一個有機食品工廠，這個實驗室裡的每一株菜，周邊的所有環境全都記錄起來，比如濕度、溫度、光照，然後就可以收集這樣的資料訓練一個機器學習的模型，最後用這個模型來做蔬菜。是以得來的蔬菜滋味可以控制，要脆感還是要甜的，都可以通過模型學習出來。

fintech智能投顧

最後來說一說金融，其實金融是一個非常好的領域，第四範式在金融領域也積累了很多成功案例。金融領域裡的任務都是非常清楚的，而且每個任務的資料都有痕迹、有資料足迹，資料的次元也是多元度的資料，有外界的、也有内界的，非結構資料比較多，例如文本和報告。資料也是形成了孤島，鍊條也非常長，并且鍊條裡面都有銜接。

在金融領域現在美國比較時髦的一個概念叫投研、投顧和投資。投研是說研究整個市場的基本面，就好像我們研究輿情分析一樣，但輿情隻是其中的一部分；投顧是說在美國的銀行給很多客戶做理财分析，然後做理财的配置，這些工作可以由機器人來做；投資是說機器人自己就是一個客戶，它可以去投資。

四、多年後的ai社會

最後說一下我認為多年後的ai社會是怎麼樣的。我覺得未來應該是幾個人在運作一個公司，每一個人都能率領成千上萬個機器人，這些機器人在做不同的事情，也是它被訓練得很擅長的事情。我們現在在一個傳統行業裡，往往是20%的人在做80%的工作，那麼這20%的人就是未來的營運公司的人，剩下80%的人所做的工作将交由機器來完成。一個公司的自動化，智能化程度，也代表了這個公司在商業上的反應速度和競争力。

人工智能給人類帶來的變革是非常深遠的，人工智能不僅僅是一場比賽、一個應用，而是整個社會真正地徹底地在改變。機器和人将成為一個共同的“軍隊”不斷地攻克堡壘，推動人類程序向更好的方向發展。]

本文作者：知情人士

第四範式首席科學家楊強教授：人工智能的下一個技術風口與商業風口

繼續閱讀

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希