日前,前Facebook(臉書)應用機器學習部AI翻譯團隊主管黃非博士入職阿裡巴巴達摩院。
入職後,他将在達摩院機器智能技術實驗室,和同僚推動AI翻譯在新零售、跨境電商、視訊等領域的實時翻譯應用。
“語言”是跨境交易頭号攔路虎。在阿裡巴巴國際站,7成買家以英語溝通,還有30%為小語種。而賣家端的調研資料顯示,大約96%的賣家對小語種無能為力。 阿裡目前需要翻譯的商品總量超過4億。
5月18日,阿裡巴巴在跨境電商中正式上線對話實時翻譯功能,破解買賣家語言不通難題。據悉,這是全球首個電商領域的實時翻譯AI(人工智能)産品。
目前,阿裡AI實時翻譯日均翻譯次數達7.5億,每年翻譯次數超3000億。公開資料顯示,這是全球電商領域AI翻譯之最。伴随電商全球化的步伐,阿裡AI翻譯發展壯大,其AI實時翻譯工具目前提供21種熱門語言,包括43個語言方向翻譯服務,滿足全球使用者浏覽不同國家商品的翻譯需求。
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnLjdzYiJWY0UWMjdTYjRjN1UmZ0UWYzIDZjFzNmhDNxkDO4QmMjlzY48CXt92Yu4GZjlGbh5SZslmZxl3Lc9CX6MHc0RHaiojIsJye.png)
實時翻譯
是以,阿裡AI實時翻譯俨然成了阿裡全球化戰略的“技術生命線”。
黃非說,“選擇從Facebook來到阿裡,主要是因為這裡有着豐富的應用場景,能給AI翻譯學科帶來更廣闊的研發和想象空間。”
他介紹,主流商業AI翻譯引擎都基于文本,進行海量比較、學習。這種單一次元的資料分析方法,面臨模型的學習效率低下等瓶頸。而基于阿裡豐富的應用場景,他和同僚可以嘗試建立包括圖檔、圖像、聲音等多模态資料次元的翻譯架構,使得AI翻譯的學習過程,更接近人的學習語言過程。
“人學習語言,不是簡單背字典,而是掌握圖像、聲音等字詞延伸内容後,了解字詞使用的環境以及背後含義。而目前的AI翻譯引擎,可以說是海量學習、比對網上的‘雙國文本資料字典’,這樣的學習效率其實并不高。而基于多模态的翻譯架構,将綜合學習字詞語義以及相關的圖像、語境等含義, 力求更接近人類學習語言,了解世界的方式。”黃非表示。
在黃非博士加入達摩院之前,陳博興、劉曉鐘兩位博士也加入了達摩院機器智能實驗室NLP團隊。陳博興博士曾在加拿大國家研究委員會從事機器翻譯研究,劉曉鐘博士曾在美國雅虎從事資訊檢索工作。
阿裡達摩院機器智能技術NLP團隊負責人司羅介紹,NLP團隊現有近百人分布在中國、美國、新加坡等實驗室,30%以上人員有博士學曆,團隊還在招賢納士。
日前,有消息稱,阿裡巴巴将于下半年正式推出語音實時翻譯和直播視訊自動生成雙語字幕功能,屆時,跨境商家可直接通過視訊交流。各位科學家的陸續加入,無疑将加速這一程序。
原文釋出時間為:2018-05-21
本文作者:孫茜茜
本文來自雲栖社群合作夥伴“
天下網商”,了解相關資訊可以關注“
”。