昨天,剛剛上任的AI收銀員就讓阿裡雲官抖收獲了第一條10萬+,嗯就是下面這個視訊。
人類在點餐速度上輸給了AI,面對每秒速5個字的點單需求:“五個巧克力、兩個香草拿鐵,巧克力加奶油……”咖啡師總共花費2分37秒點完30多杯咖啡。而AI,僅僅用了49秒。
其實AI收銀員的能力就來自于阿裡雲的AI産品和技術,除了可以做收銀員之外,阿裡雲的智能語音技術還在上海地鐵賣起了票,全程語音控制,購票時長僅需要10秒。
曾經的AI隻會下棋,今天Alibaba Intelligence 已⼤規模應⽤在各個領域:ET城市大腦、淘寶小蜜、無人超市、工業大腦……
自2015年起,阿裡雲陸續推出了多款AI産品,除了語音識别,還有圖像識别、視覺識别……等130多款細分産品,适用于300多個場景,這些能力都經過實踐檢驗,在産業場景下發揮價值,更具生命力。
5月23日,2018雲栖大會·武漢峰會上,阿裡雲首次曝光了人工智能産品家族,全方位公開AI産品體系(詳見ai.aliyun.com)不妨一起了解一下。
AI·圖像識别
圖像識别服務基于大資料和深度學習實作,可精準識别圖像中的視覺内容,包括上千種物體标簽、數十種常見場景等,包含圖像打标、場景分類、鑒黃等線上API服務子產品,應用于智能相冊管理、圖檔分類和檢索、圖檔安全監控等場景。
圖像打标廣泛應用于智能圖像管理、視訊打标等場景,可自動識别圖像中的數十種常見的場景,如天空、草地、人物等等,實作圖檔的自動管理、分組和搜尋功能,可對大型圖像庫進行智能管理。還能精準識别圖像中的色情内容,預防涉黃風險,節省人力成本。
阿裡雲多模态語音互動
具有對語音、視覺、場景感覺等多模态感覺智能,以及流利對話、多輪多意圖口語了解、業務知識圖譜自适應等認知智能。
上面提到的AI收銀員和地鐵語音售票機就應用了這套産品。
印刷文字識别
典型應用場景包括證件資訊的自動識别和提取,自然場景中的文字識别,文檔或宣傳資料中的文字檢測識别等。
阿裡雲OCR全新功能上線,對于身份證,營業執照識别等全新更新,新增文檔圖檔識别、電商圖檔識别、視訊文字識别、行業解決方案。
AI設計師鹿班
基于圖像智能生成技術,鹿班可以改變傳統的設計模式,使其在短時間内完成大量banner圖、海報圖和會場圖的設計,提高工作效率。使用者隻需任意輸入想達成的風格、尺寸,鹿班就能代替人工完成素材分析、摳圖、配色等耗時耗力的設計項目,實時生成多套符合要求的設計解決方案。
智能語音互動
包括語音識别、語音合成、語音對話了解平台、語音模型自學習平台、聲紋識别、語音關鍵字檢測等多個子産品,子産品可以單獨輸出,也可以通過子産品之間的組合,應用于多種實際業務場景下,賦予機器“能聽、會說、懂你“式的語音互動體驗。
主要的方案包括:車載語音互動方案、電視遠場語音互動方案、強噪聲公衆環境下的多模态免喚醒語音互動方案、法庭庭審語音識别解決方案、智能客服解決方案、聲紋核身方案、多人會議場景下的語音方案等。
自然語言處理
為各類企業及開發者提供的用于文本分析及挖掘的核心工具,已經廣泛應用在電商、文化娛樂、金融、物流等行業客戶的多項業務中。
自然語言處理API可幫助使用者搭建内容搜尋、内容推薦、輿情識别及分析、文本結構化、對話機器人等智能産品,也能夠通過合作,定制個性化的解決方案。
“見遠”行業視覺智能診斷方案
通過深度學習和圖像處理算法,進行全自動生産流程管理,自動識别圖像中的瑕疵或故障,以達到大幅節省人力,提高産品生産效率及精度穩定性的效果。見遠在工業、環保、養殖業等都有很好的前景。
機器學習平台PAI
基于阿裡雲分布式計算引擎的一款機器學習算法平台,以極低的代價幫助業務從BI時代跨入AI時代,真正實作人工智能觸手可及,目前已正式商業化。
阿裡雲機器學習算法平台的背後是阿裡巴巴的算法科學家和阿裡雲的技術保障團隊。産品具有多方面優勢,比如,良好的互動設計,優質、豐富的機器學習算法,與阿裡産品完美配合,一站式的機器學習體驗,支援主流深度學習架構,優質的技術保障。
AI·視網膜
基于阿裡雲海量視訊的分布式計算和流媒體處理能力,利用機器學習、模式識别、計算機視覺對視訊畫面中出現的名人、明星等人物進行人臉識别。
此外,視網膜還擁有視訊分類、多模态分析、标簽預測,視訊内容稽核等多項能力,可以有效提升視訊的分發、管理效率。依托于視網膜,視訊的内容已經完全被結構化處理。當我們分析視訊的時候,不再依靠人力,而是依靠人工智能技術。
“天機”
天機系統是一款可以預見城市未來趨勢的AI系統,其核心是基于視覺的高精度預測算法。它可以預測未來一段時間内商場客流、軌交人流、路口車流、商場停車場停車位、商場停車場閘機過車數等等,準确率在90%以上。
基于高精度的預測資訊,“天機”系統就可以提前實施智能幹預,例如控制停車場閘機和車流引導系統,進而提高交通通行效率。