天天看點

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

鄢志傑在大會做主題發言

IoT:阿裡巴巴新的主賽道

今天很高興有這個機會能夠來介紹一下我們自己的一些工作。為什麼在一個人工智能的場合講IoT,第一深圳是IoT産業非常活躍的城市;第二,同樣是在深圳,阿裡雲在深圳的雲栖大會上釋出了新的戰略,阿裡巴巴将會全面進軍IoT,IoT将成為阿裡繼電商、金融、物流、雲計算之後一條全新的主賽道。前面的像天貓淘寶這樣的電商,像螞蟻這樣的金融,還有像菜鳥的物流和阿裡雲的雲計算對阿裡集團是什麼地位,那麼今天把IoT提到這麼高的地位上來講,顯然是表達了阿裡對IoT的高度重視。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

阿裡希望做IoT的基礎設施,在五年内,通過雲上的基礎設施連接配接100億的裝置。我們的了解有三點:計算是心髒,AI是大腦,IoT是神經。為什麼這麼說呢?其實這也很符合阿裡,尤其阿裡雲一路以來發展的脈絡。阿裡雲從做計算、做存儲開始,做傳統的雲計算,一直到近些年不斷的去深入做AI技術,不管是我們計算機視覺的技術,語音互動的技術,NLP的技術,還有基礎的機器學習、運籌決策等基礎技術,如何使AI技術通過IoT神經觸達更多的使用者,産生資料及更大的價值,這就是一路以來非常清晰的發展脈絡。

語音是人最自然的與IoT互動的方式

既然講要連接配接萬物,萬物互聯,那首先要解決人跟裝置怎麼去連接配接的問題。我作為一個做語音互動的實踐者,我覺得,非常自信地就可以講說語音就是人最自然的與IoT互動的方式。原因是什麼呢?因為人與人之間互動也一樣,也是用語音作為最自然的方式。人和機器,我們也希望能做到這麼自然流暢的互動。語音互動是,即使是你在開着車,手不友善的時候,不看螢幕,不用觸摸螢幕上的任何東西,也能夠跟你的車互動。而且随着這麼多年技術的發展,确确實實這種互動的體驗已經從一個科幻電影——就像《星球大戰》第一集拍出來的時候,人能跟機器人做語音交換完全是科幻電影——但是拍最新的續集的時候,到今天,這個東西已經完全成為了一個大衆科技,跟一個機器做語音互動,今天已經是完全很容易實作的一件事情了。

做到這一點背後是技術的進步,得益于我們AI的技術在近幾年長足的發展,不管在感覺的層面還是在認知的層面。回到這個當中的語音互動,今天已經完全的是跨過了“能用”的這麼一個基礎的門檻,正在向着“好用”的方向來發展,使得這樣的技術能夠架起一個人機互動到個性化服務的橋梁。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

再具體地說,請大家看這張圖,右邊的部分就是我們所有的在網際網路上沉澱的内容和服務,就像我剛剛加入阿裡之初覺得也是很贊歎,我們的集團這麼多年來一直在深耕這方面,就像在音樂裡面我們有蝦米音樂,在視訊裡面我們有我們的優酷洋芋,導航有高德的地圖和導航,出行上我們有飛豬,購物自然不必講有天貓淘寶,支付有支付寶,更不用說了。

豐富的IoT端:觸達千千萬萬消費者

當我們有了這麼多的網際網路的内容和服務以後,接下來一個重要的問題就是怎麼能夠更多地使得好的内容,好的服務能夠觸達千千萬萬的消費者。它的觸角就是最左邊的IoT的端,無論是最傳統的手機還是像現在的IoT裝置,像智能音箱還有我們的智能電視,智聯網汽車,以及機器人等等,我們希望是通過這些端,把我們在網際網路上的内容和服務帶給我們的消費者。中間的橋梁和媒介就是自然的人機互動界面,不管是語音的互動,然後計算機視覺的互動,以及這些東西結合起來的多模态互動等等。我們始終就是在拼這張大圖,研發中間的技術,然後做這麼一個橋梁。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

在這張大圖下,天貓精靈的智能音箱,非常漂亮的這麼一款音箱,前不久剛釋出了黑色的小音箱。這個就是阿裡集團的人工智能實驗室的作品。去年雙11的時候,也是一天之内賣了一百萬台,到今天一共賣了累計200萬台的銷量,通過這個端觸達到我們的使用者。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

智聯網汽車,阿裡跟國内的汽車制造領域的龍頭上汽集團,一起去投資成立了斑馬網絡,做汽車裡面的智聯網。其中除了地圖以外,很重要的是讓你在開車手握方向盤不友善的時候,還能跟你的車做直接的語音互動。現在走進4S店,同樣的SUV,同樣的價位,它的發動機和變速箱各種參數都是差不多的,但是當你今天走進榮威的4S店,4S店的銷售一定會請你坐上這台車,然後展示斑馬系統,然後對它用語音說我要看星星,突然之間所有的天窗都會打開,展現出這樣的智能。

除了這些以外,導航、點歌、聽歌,甚至我們發現真正的使用者,很喜歡在車裡邊開車的時候邊玩語音的遊戲,其中成語接龍的遊戲就是一個例子,有些司機和旁邊的副駕一路上就在玩這個東西。我們給一個曾經非常同質化的、一個最大的IoT——汽車,帶來了智能的好玩的這些體驗。同樣的在上汽這個汽車推出以後,越來越多的汽車産業裡面的大企業們相繼加入了這張大圖,包括現在已經公布的标緻、雪鐵龍跟福特這樣的汽車制造商。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

在這張大圖底下,阿裡自己推出了自己的OTT電視盒子,這個叫天貓魔盒,像剛才講的,既然講網際網路内容和服務,天貓大文娛有優酷這麼好的内容,是以需要一個端能夠觸達消費者,其中一個端就是魔盒。魔盒它是一個可以用語音跟盒子進行互動的IoT終端。因為現在大家知道在家裡看電視的老人小孩很多,怎麼能夠在這種場景下幫助他們來尋找他們想看的東西,這個語音當然是很自然的、很便捷的手段。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

除了自己做魔盒以外,阿裡也跟行業裡做電視的龍頭一起成立合資公司,一起把我們的内容、服務,我們的語音技術打包,把剛才的盒子裝到電視機裡面去。就像我們看到的海爾的人工智能電視。從前一代的搖控器的方式到剛剛在上海家博會釋出的下一代的海爾-阿裡的第五代人工智能電視,通過遠距離的遠場語音互動,免喚醒的方式,還融合識别聲紋,來識别年齡,過濾對小孩子的不良内容等等這些技術,我們逐漸地在家庭娛樂的環境裡應用智能語音互動。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

不僅限于此,語音互動智能還逐漸地也在向公共服務領域在發展。在去年底的時候,馬老師和上海地鐵的董事長一起參觀了語音售票的概念機。通常在地鐵站裡面用售票機的就是外地的遊客、出差的人士,他們對上海不熟,隻知道自己要去哪,不知道要坐哪一條線、在哪一站換乘、在哪一站下。通常在原來就得通過高德,比如說把路線先查好,再去買票。有了這個語音售票機以後,後面對接的就是網際網路的資料,高德的資料,你隻要對着售票機說出你想要去的地方,所有的路徑規劃、怎麼換乘、哪站下、需要多長時間、需要多少錢買到這張票,一目了然,然後通過支付寶的方式,就可以實作整個的購票的過程。

但說起來這個體驗好像很簡單,本來就應該是這樣的,但是在技術上同樣需要解決在地鐵站那麼嘈雜的公共場合下怎麼能夠解決一個遠距離的語音互動,而且要保持高精度的問題。我們做了像大屏上面綠色的條狀的東西,就是一個很大的麥克風陣列。中間這個黑色的東西就是一個光學的攝像頭。其實是做了一個多模态的語音互動的這麼一個技術,使得在特别嘈雜的環境下,還能夠在一定距離以外跟機器做一個遠距離的隔空的語音的互動。相信不久的将來這種公共場所的服務機器,尤其做這樣的互動的一個服務機器會越來越多的出現在我們的生活當中。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

技術創造商業

阿裡雲很嚴肅地在布局技術問題,雖然阿裡是一家在商業上非常成功的公司,但同時我們希望在技術上去自主掌握在互動這個鍊條上的核心技術,并且能夠随着産品的創新持續地去疊代、去進步。其中一個例子就是說,我們從這個麥克風本身的硬體,這種傳感器的硬體技術出發,到麥克風組合起來設計為一個麥克風陣列,到陣列的信号處理,全鍊路地從最源頭開始就找世界頂尖的專家來做這樣的技術。

例如說在聲學設計方面,大家可能看到過報道,我們就是從做電話通訊的企業去尋找了這樣的專家,來和我們做語音技術的人坐到一起,去打造全鍊路的最好的互動的體驗。同時在大家更熟知的語音識别、語音合成、聲紋這類技術更不用說了。我們還在阿裡雲上打造雲+端的、工業級的語音的互動系統,跟它相應的定制平台,使得我們可以以這套平台性的東西去很快地适配到一個具體的應用的領域。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

但我們不是做那種完全高高在上的研究,怎麼能把這些好的研究作為一個可以落地的産品,真正産生它的價值,也是我們特别努力去思考的。在阿裡,一個團隊中常常會出現說既有偏向于研究的人,又有偏向于落地的人,又有偏向于工程人。當這些人放到一個團隊一起做這件事情的時候,它産生的這個化學反應跟它的産品的厚度就會不一樣的。

剛才能感受到就是我們從傳感器,一直到人工智能晶片方面都開始做自有的研發,無論是通過自研或并購的方式,而且阿裡是很嚴肅的在做一個端上的作業系統叫AliOS,我一直把它評價為是中國最嚴肅的移動作業系統。還有像剛才上汽跟海爾的例子,就是說怎麼能跟行業裡的那些龍頭的合作夥伴一起去開拓IoT。就像剛才講的,我們已經有比較強的雲端的布局了,怎麼能通過這些基礎設施能夠打通,能夠最後成為商業上成功的一個産品,這些方面的市場上面的商業上的布局,想的會比較多。最後當你做一個具體的産品的時候,你仍然要考慮一些非技術之外的因素,像市場的容量,本身的成本,一直到它的定價等等,當你有全鍊路的能力之後,有這種機會去打磨這些東西,使得達到一個效益最大化。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

IoT時代的争論思考

目前IoT的融入生活也總是遇到這樣那樣的一些争論。例如說我舉個例子,在家居環境下,很多争論說我們到底應該有一個中心化的智能裝置還是一個去中心化的、分布式的智能終端?或者說我們應該在現階段就特别明确地強調它是網際網路的新入口,還是先從滿足大家的指令控制、任務完成型的這種體驗入手。或者說做一家商業公司,我們是應該自己做硬體還是采取這種平台型的方式,去跟硬體的龍頭企業一起合作做這件事情等。

阿裡全面進軍IoT,語音将是人與IoT最自然的互動方式

有一些事情阿裡是一定會着力去做的,其實就像是技術本身,剛才講到的所有這些技術的子產品,我們都希望把它做精做深,然後通過某種方式把技術共享出來,讓全社會可以使用。在IoT的領域,阿裡去做低成本、易複制的IoT的智能化的整體的方案。包括硬體模組和軟體。然後當你用上這個子產品,接入你的裝置以後,很容易就能享有剛才我們講到的網際網路上的那麼多的服務的内容,然後統統通過自然互動的模式作為橋梁和紐帶。

我們會去打造一些自己标杆的硬體,但是這個是手段,真正目的還是為社會建造基礎開放的平台,使各種各樣的裝置能夠很容易接入這個平台,達到五年100億端的目标和願景。

好的,今天我的分享就到這裡,謝謝大家!

關于新一代人工智能聯盟:

新一代人工智能産業技術創新戰略聯盟(AITISA,簡稱聯盟),聯盟在中國科技部指導下,聯同科技巨頭、知名學府及創業公司發起成立。聯盟由潘雲鶴院士擔任名譽理事長和專家委員會主任,高文院士任聯盟理事長,北京大學計算機科學技術系主任黃鐵軍教授擔任秘書長。

中國科學院李未院士、中國工程院柴天佑院士、金東寒院士、李伯虎院士、劉玠院士、吳澄院士、鄭南甯院士為聯盟專家委員會副主任。

阿裡巴巴是該聯盟的副理事機關,阿裡達摩院機器智能實驗室副主任華先勝為組織副理事。

原文釋出時間為:2018-04-2

本文作者:鄢志傑

繼續閱讀