從 2008 年到 2012 年,周劍用了第一個五年時間,研發出滿意的舵機。這成為周劍在 2012 年創立優必選科技(下簡稱優必選)的底氣,也成就了優必選的第一個五年————舵機是優必選的核心技術,覆寫 Alpha1、Alpha2、Jimu 和 Cruzr 等重要産品,由于市場對其産品的看好,公司也在 2016 年完成 B 輪 1 億美元融資,估值超 10 億美元,入選 CB Insights 釋出的全球獨角獸榜單。
在舵機技術上站穩腳跟之後,周劍為優必選下一個五年定調。今年 2 月,優必選創始人兼 CEO 周劍宣布,「2017 年優必選将重點布局人工智能領域,通過産品創新和商業創新實作 15 億元的銷售目标。」
今年的兩會将人工智能寫進政府報告,人工智能在國内的發展達到了前所未有的熱度。無論是 BAT 這樣的巨頭,還是衆多創業公司,都試圖在人工智能上找到能落地的應用場景。周劍認為,「在人工智能這件事上,優必選有天然的優勢。因為從某種意義上來說,機器人是人工智能落地最好的平台。」
尋找人形機器人商業化突破口
「機器人的最終形态應該是能适應人類生活環境的雙足人形機器人,比如它能像人類一樣,在多種環境中行走,比如上下樓梯,這其中的核心問題就是驅動,隻有解決這個問題,機器人才能真正意義上進入家庭環境。」周劍說。目前國際上名氣較大的人形機器人産品并不多,比如軟銀收購的 Aldebaran Robotics 公司研發的人形機器人 NAO、以及本田的 ASIMO 機器人和波士頓動力的輪式、腿式機器人等。
在周劍看來,目前市面上很多機器人産品都是過渡型産物,比如現在的一些音箱産品。「如果實作商業化,是沒有人願意跟一個音箱對話的。」因為智能家居最終無法滿足人類的情感需求,「它代替不了類似于《太空旅客》真正的人形機器人。」
然而,目前人形機器人在驅動,包括關節驅動、運動技術、控制運動算法上面,還沒有實作真正突破,尤其是可商業化的驅動技術。據周劍介紹,在驅動方面,波士頓動力用的是液壓技術,本田的阿西莫(ASIMO)機器人用的是電機伺服的控制方式,這兩種技術都能實作不錯的驅動,但是問題在于成本太高,阿西莫(ASIMO)一台機器人搭出來需要 200 多萬美金。
除了高昂的成本外,使用中繁瑣的技術方式也讓一些機器人很難真正走進市場,比如 ASIMO 機器人的傳動中用了 20 多根皮帶,在使用過程中,每隔一段時間都需要重新打開機器人内部來調整皮帶的松緊度。這種技術方式導緻 ASIMO 很難實作商業化量産,而且本田在這條技術道路上耕耘了幾十年,某種程度上有些積重難返,即便他們的核心算法和機器人軀幹部分都搭建的很好。
是以,用高成本效益的技術方式,讓人形機器人價格降下來,被一般家庭所接受,是優必選的目标。周劍說,「優必選一直在朝着一個能夠真正讓驅動關節子產品化、商業化的方向去努力,是以我們現在做的伺服舵機,包括在腿部的一些舵機,某種意義上就是在朝着商業化目标努力。」
人形機器人的市場才剛剛開始,優必選需要做一些比較前沿性、引導性的工作。「未來我們希望在某種意義上建立一套全球化的機器人标準,比如人形機器人的标準是什麼、規格是什麼、它的曲軸運動,包括人工智能的一些基本的需求。」
不過,雖然輪式機器人不是人形機器人的最終形式,但周劍也坦言,「目前技術平台下面,輪式機器人還有一些優勢,包括在 2B 的一些場所。」是以,優必選在今年年初的 CES 上推出了首款商用服務機器人 Cruzr。Cruzr 是首款提供企業級商用服務的機器人,可為客戶提供定制的人工智能商務服務。
全面布局人工智能戰略
優必選的機器人研發從舵機開始,經過近 10 年的研發,舵機已經成為優必選的核心技術,并由此開拓了多個産品線。在舵機這條技術産品線上,優必選一直專注于核心零部件的供應,硬體開發逐漸成為優必選的優勢。
而機器人商業化所需要的語音識别、機器視覺以及算法平台等軟體技術能力,則是優必選明顯存在的劣勢。周劍也坦言,「優必選是硬體起家,舵機一直是其引以為豪的核心技術,而軟體是最薄弱的地方」,這也是優必選決定大力布局人工智能的原因。
據周劍介紹,優必選在北京、矽谷分别設有研發中心,研發方向側重在機器視覺、語音識别、語義了解、算法平台等人工智能領域,博士背景的核心研發人員達到數十人,公司在人工智能方面投入的資金比重也大大提升,占總營收的 45%。
除了大型的伺服舵機關鍵驅動技術外,算法平台和人工智能,将成為優必選最為重要的發展陣地。
周劍希望能夠自助搭建出一個類似于比波士頓動力更好的平台的一個算法。在此之前,優必選對谷歌、波士頓動力、本田等全球所有大型人形機器人公司的技術都進行了長期研究。在周劍看來,與優必選在驅動産品上下功夫不同,「這些機構不算純商業化的公司,也根本沒有打算很快推出商業化的産品。」他接着補充道:「我們現正在研發中的伺服舵機,跟波士頓他們的完全不一樣。此外優必選把能耗看的很重,在運動算法上投入了很大力量。」
在人工智能方面,優必選主要力量放在機器視覺和資料上。周劍解釋稱:「因為資訊來源大部分還是來自機器視覺,另外由于機器視覺技術需要更大量的資料,資料是其要推動的技術。」比如光線的細微變化都能影響到機器對物體的判斷。這一點周劍印象頗深,他舉了一個例子,在家庭廚房場景中,炒菜時的油煙會導緻機器人的視覺判斷模糊,針對這個問題就需要做霧化、去白、去油煙的技術。
事實上,優必選去年年底就開始為人工智能布局招攬人才,前 IEEE 主席霍華德博士、清華大學趙明國教授、歐洲科學院院士陶大程博士,先後加入并分别擔任其教育 CTO、「人形機器人首席科學家」。
去年科大訊飛入股優必選,也給了後者在語音識别上得到了強有力的支撐,周劍稱,訊飛的技術「能用的我們都會拿來用」。
在視覺和語音之外,另一個無法回避的問題是語義了解。「這是一個全球性難題」,周劍說,「單純的自然語言了解(NLU)解決不了所有的機器人問題,未來的識别了解是多模态的,是基于視覺、語音、語意的多模态的了解。包括識别人體的姿态,人類的動作有很多,機器人會做很多動作,到底這個動作的目的、意義是什麼?」比如,當兩人第一次見面時,舉手就意味着是握手打招呼,在離别的時候,舉手的含義就是道别,這些都需要機器人能夠準确的識别。
但優必選并不打算全面開展這些技術的自主研發,周劍表示,「不可能所有的東西都由優必選自己來做,可以通過融資來收購、并購一些技術公司。」據了解,優必選已經有了比較中意的合作對象,可能會對其進行戰略投資、入股,甚至是更加深入的合作,與此同時,其新一輪融資也在進行中。