天天看點

Untouch推移動端3D手勢互動 稱視覺AI是下一個風口

雷鋒網按:2017年7月5日,專注于智能視覺互動技術提供商未動科技(untouch)正式釋出4款3d視覺互動産品:3d手勢識别産品——黎曼平台,3d人臉識别産品——歐拉平台,slam産品——笛卡爾平台,及場景重建産品——高斯平台。

Untouch推移動端3D手勢互動 稱視覺AI是下一個風口

在釋出會開始,untouch

ceo孫铮調侃道,“今天是7月5号,都快被命名為是中國或者世界ai日了,今天一天好幾個釋出會了,上午是百度(2017百度ai開發者大會),下午是阿裡(智能音響天貓精靈x1的釋出會),晚上又是我們。”作為低頭研發剛剛露面的科技公司,趕在同一天與大佬們一起釋出産品,可以說是趕上了ai浪潮,他們卻也擔心自己的産品能不能分得聚焦于大佬産品的目光。

今天的釋出會是untouch在媒體上的首次亮相,而其實公司成立已經有3年。未動科技有限公司成立于2014年,2015年完成數百萬人民币天使輪融資,由英諾資本及大河資本領投,2016年底完成數百萬美元pre-a輪融資,漢能創投獨家投資。在這3年時間裡他們一直緻力于技術的研發,少有在媒體露面。未動科技專注于計算機3d視覺智能互動軟硬體方案,基于自主研發的智能3d視覺互動算法,例如3d手勢識别、3d人臉識别、運動追蹤(slam)、場景重構等,賦予新型消費級智能裝置與人、與場景的視覺互動能力。

Untouch推移動端3D手勢互動 稱視覺AI是下一個風口

黎曼平台基于深度圖,實作3d手勢互動功能,可以為智能手機、機器人/無人機、ar/vr等提供手部26自由度追蹤與識别。據介紹,傳統的手勢識别對每一幀的手勢圖像進行獨立分析,而untouch采用曾成功應用于機器翻譯的深度學習算法lstm(long

short-term memory),把手勢動作當做一個時間序列來處理,提高了識别精度與運算效率。

另外,黎曼平台考慮到移動端的功耗與運算性能等限制性因素,經過深度算法裁剪與大量工程優化,使得3d手勢識别可以流暢精準地運作在手機等移動裝置上。傳統手勢識别産品基于pc,黎曼平台是一款基于深度攝像頭并可運作在手機等移動裝置上的手勢識别産品。

小型化、嵌入式的3d手勢識别産品使手勢互動植入移動裝置,這是目前顯而易見的一個大的趨勢。雷鋒網(公衆号:雷鋒網)了解到,蘋果正在測試iphone8的手勢識别功能和3d人臉識别功能,這将引爆移動端的互動方式。

Untouch推移動端3D手勢互動 稱視覺AI是下一個風口

未動科技的3d視覺智能互動軟硬體方案不僅使得手勢互動從pc端轉移到了移動端,帶來移動裝置互動的更多可能,視覺智能還有更多可以發展和應用的方面。釋出會還推出了另外三個3d視覺平台,能實作3d人臉識别的歐拉平台,其基于深度圖,實作人臉的實時模組化與3d特征識别,實作人臉3d表情的實時追蹤、識别與分析。除了身份識别驗證與表情分析,笛卡爾平台還可以讓使用者建立自己的頭像,體驗更有趣、好玩的社交體驗。運動跟蹤(slam)的笛卡爾平台實作空間計算與位置追蹤功能,可以為智能手機、機器人/無人機、ar/vr等提供6

dof

inside-out位置追蹤、路徑規劃軟硬體解決方案,厘米級别精度、低延遲、低功耗,為智能裝置創造更多應用場景。場景重構的高斯平台基于深度攝像頭與rgb攝像頭,實作實時的空間計算,重建與渲染出真實的實體場景結構,進而實作障礙物躲避、ar追蹤、三維重建等功能,為計算裝置的判斷與決策提供三維場景資訊。

這些都是依靠視覺ai來實作的。亞馬遜的echo和阿裡的天貓精靈x1智能音響做的都是語音ai,而未動科技的出發點是視覺互動。孫铮介紹道,“我們做這些3d視覺軟硬體産品都是想為裝置提供視覺感覺,現在的智能産品越來越像人,人的特點就是感覺。ai一定要有感覺,要跟sensor結合。ai要麼是基于聽覺的,要麼是基于視覺的,是因為人有這些感覺。這是為什麼我們這次和pmd合作,他是一個sensor的晶片廠商。隻有抓住了sensor,才能去生産大腦。”

聯合專注3d傳感器廠商pmd

pmd是一家無晶圓廠ic公司,公司位于德國西格根與美國聖何塞,是全球領先的基于cmos的3d飛行時間數字圖像技術供應商。創立與2002年,公司擁有涉及tof的應用程式、測量原理與實作方法的全球150個專利,pmd的3d傳感器的應用主要包括工業自動化、自動駕駛、以及廣闊的消費電子領域例如ar/vr。全球第一款tango手機聯想phab2上的深度傳感子產品就是pmd所提供。華碩最近推出的tango&daydream手機zenfone的深度傳感技術也來自于pmd。

專注tof深度傳感器廠商pmd宣布,選擇untouch的黎曼平台作為中間件為客戶提供非接觸式的互動方案,雙方深度合作,推出了完整的手勢識别軟硬體一體方案。pmd總裁

bernd

buxbaum表示:“我們非常激動能夠與untouch緊密合作,有了untouch提供的先進3d手勢識别技術,我們可以為移動終端裝置提供直覺的、非接觸式的互動體驗。我們堅信,通過兩個公司的緊密合作,能夠加速手勢互動的大規模普及。”

新的互動方式帶來新的互動體驗。在《數字化生存》一書中,尼葛洛龐帝指了我們的數字化生活的發展趨勢,并不是更豐富的資料,更清晰的圖像,而是更自然的人機互動。例如,他認為,電視所要追求的并不是更高的清晰度,數字化電視引起的電視生産和消費的模式的變化才是更值得追求的。在“虛拟現實”這一章,他認為圖像的更新速度比圖像的分辨率更為重要,我們對于圖像的感覺不僅僅是視覺的,還與其他感官緊密相連,我們的運動神經會影響圖像的感覺。目前,“計算機對人的存在的感覺真是遲鈍……很可能在不久的将來,計算機就能看到你“。他認為,未來的個性化界面能識别人的聲音,表情,手勢,還能追蹤人的眼球。對于各類消費電子來說,智能視覺互動技術會帶來更加自然友好的體驗。

數學家團隊

雷鋒網注意到,untouch的核心團隊裡不少數學家。他們釋出的幾個3d視覺平台的名字:歐拉、笛卡爾、高斯這些都是著名數學家的名字。ceo孫铮有跨國高科技企業17年工作經驗,曆任微軟中國移動事業部總經理,中興芬蘭分公司總經理,中興西歐區副總經理,愛立信瑞典進階系統工程師,瑞典計算機研究所研究員,曾帶領中興西歐銷售團隊在4年間實作從0到10億歐元銷售額的突破。他也是全國數學奧林匹克競賽獲獎者,發現的數學定理被國際數學權威著作命名為“孫氏定理”。團隊其他成員由世界頂尖的計算機視覺、深度學習、嵌入式系統領域的專家組成,來自于微軟、中科院、清華、北大等公司或研究機構。

本文作者:李詩

繼續閱讀