在本屆 IJCAI 上,阿裡巴巴不僅有多篇論文入選,還以研讨會、交流、展覽等形式全面展示了自己的 AI 實力。其中不僅有面向文娛的 AI 技術,也有近期廣受好評的智能打假應用。
8 月 13 日晚,阿裡大文娛與阿裡安全還在 IJCAI 大會期間共同舉辦了一場「阿裡之夜」,邀請來自阿裡巴巴的技術專家以及學界著名教授朱軍等人,一同進行了技術交流與分享。而阿裡文娛摩酷實驗室的負責人王曉博則向我們首次介紹了阿裡旗下兩大 AI 實驗室的研究與近況。
發展面向文娛的 AI 技術:阿裡文娛摩酷實驗室
在位于威尼斯人酒店的 IJCAI 2019 阿裡巴巴展台中,我們可以看到由阿裡文娛摩酷實驗室研發的北鬥星智庫。北鬥星是泛内容的 AI 平台,依托 AI+大資料能力,對泛内容進行全維解構分析,在内容的投資、制作、營運、營銷的全生命周期中,給予 AI+大資料的輔助決策參考。在本次 IJCAI 的 Demo 中,觀衆可以體驗北鬥星是如何從創作、營運、宣推各個階段輸出決策建議,并提供相關的資料分析。
現場 Demo 展示了人工智能對熱播電視劇《長安十二時辰》中演員鏡頭與觀看熱度的分析。
除此之外,阿裡文娛摩酷實驗室這次還展示了智能對話式視訊搜尋 DEMO,這是阿裡在智能終端上部署的基于多輪對話的視訊搜尋服務。它通過語音識别(ASR)、語義了解(NLU)和多輪對話管理(DM)等技術,在與使用者互動的過程中,可根據檢索結果自動生成使用者友好的互動内容,并利用語音合成子產品(TTS)朗讀給使用者,實作舒暢的互動體驗。
阿裡智能對話式視訊搜尋系統。
智能對話式視訊搜尋的重要特點,是将視訊知識圖譜和多模态的視訊内容了解技術與智能對話系統結合起來,阿裡的視訊知識圖譜實作了劇情/場景,角色/主演等關系的推理學習,以及對視訊中人物/動作/場景的多層級對象的識别,滿足使用者對視訊内容多元度的檢索需求。如『我想看黃曉明老婆主演的都市電影』以及『我想看易烊千玺跳地闆舞的視訊』等。
據阿裡文娛摩酷實驗室負責人王曉博介紹,摩酷實驗室是阿裡巴巴從事文娛智能研發的頂級團隊,其研究範圍包括:計算機視覺、機器學習、搜尋與推薦等,團隊擁有多位業内資深專家,并已在 IJCAI/KDD/CVPR/ICML/CIKM 等多個人工智能頂級會議上發表了數十篇論文。
「視訊生産的整個周期,從 IP 評估、劇本創作,再到拍攝和視訊内容分發過程都應用了大量人工智能算法技術,」王曉博介紹道。「摩酷實驗室将打造視訊内容一站式解決方案,以技術賦能視訊行業上下遊,同時積極探索行業新賽道,實作科技與藝術的深度結合。」
阿裡文娛摩酷實驗室背靠阿裡巴巴,聯合達摩院,面向阿裡希望大力開拓的文娛場景,緻力于探索「AI 如何給使用者帶去更多的快樂」這一重要命題。在國内外衆多基礎 AI 研究機構面臨轉型的當下,摩酷實驗室代表着阿裡思維的轉化:今天的阿裡達摩院不僅在思考前沿科技,也在更多地思考如何讓新技術落地這個問題了。
「現在,工業界和學術界的結合非常緊密,近年來淘寶 APP 的全面個性化就是其中的典範案例,而這一過程要依賴面向資料化驅動的産品設計理念,這會面臨來自商家、使用者、平台多方的挑戰。」王曉博表示。「企業有更好業務場景的時候,海量使用者的資料量會給我們帶來很多的機遇和挑戰。此前,學術界往往比較關注于新方法、新模型及新問題,而面對線上真實的使用者回報将會是完全不同的情況。」
阿裡安全圖靈實驗室:直面 AI 最大挑戰
在文娛之外,安全也是阿裡極為重視的研究領域,其風險管理事業群早在 2009 年就已成立。在 IJCAI 2019 上,阿裡展示了旗下機器學習研發團隊「阿裡安全圖靈實驗室」的最新技術。
阿裡安全圖靈實驗室負責人薛晖曾表示,安全會成為人工智能發展最大的挑戰,而阿裡提出的安全 AI 在模型韌性、多模态、小樣本學習等方面具有更強的攻防屬性以及進化能力,會成為網絡安全問題的核心解法。在 IJCAI 現場,這一觀點也成為多位高校學者、研究人員和企業代表的共識。
阿裡安全圖靈實驗室專門從事安全與風險方面的 AI 系統研發。其研究的核心技術包括計算機視覺、自然語言處理、生物特征識别、圖計算以及異常檢測和分析等。所研發的 AI 産品包括:
- 每天掃描數十億文字圖檔,識别有害資訊的「綠網」
- 對假貨和侵權商品識别率超過 96% 的「知識産權大腦」
- 服務經濟體内 100 餘個場景的人臉識别技術
- 利用視覺技術建立的新零售安防系統「天眼」
其中最近被人們廣泛關注「知識産權大腦」大放異彩——最近,由網信辦、工信部和公安部聯合主辦的中國人工智能峰會在廈門開幕,曾被商務部發言人點贊的阿裡巴巴「知産保護科技大腦」獲評「人工智能創新之星」稱号。
「知産保護科技大腦」是由阿裡近 20 年來積累的海量線上線下假貨特征庫、打假經驗聚合而成的算法技術系統。薛晖表示,這套系統的樣本資料總量相當于 186 個中國國家圖書館藏量,僅累積的打假圖檔樣本就超過 137 億張。
據介紹,僅在過去 3 年中,阿裡已使用這套技術協助全國 31 個省份、227 個區縣的警方抓獲制假售假嫌疑人 4439 人,搗毀制假售假窩點 4289 個。
阿裡表示,知産科技大腦已經廣泛應用于電商領域,96% 的疑似侵權連結會在釋出瞬間即被攔截。目前阿裡旗下每萬筆訂單中疑似假貨數量僅為 1.11 筆。
在 IJCAI 大會上,阿裡安全舉辦的研讨會吸引了來自哈佛大學、西交利物浦大學、香港中文大學等全球學者的投稿和分享,内容包括遊戲模拟攻擊者竊取企業敏感資訊、移動支付非法賬戶識别等各類問題。
為了抵禦未來 AI 面臨的安全風險,近日阿裡安全還宣布與清華大學合作,以對抗樣本為核心發起安全 AI 挑戰者計劃。通過結合内容安全等場景,阿裡安全從文字、圖像、視訊、聲音等多個領域針對對抗樣本賞金召集「挑戰者」,打磨安全的機器學習模型,共同建立安全研究社群。
目前,阿裡旗下共設有八大安全實驗室。這家公司希望面向其整個經濟體建立全面的網絡安全、業務安全、資料安全與平台治理的管理機制,并利用大資料建構強大的實時風險防禦能力。今天,阿裡安全産品涵蓋的業務範圍既包括最底層的裝置層、網關層以及流量層的網絡威脅防禦,也包括了業務層的安全治理,例如賬号安全、假貨與欺詐識别、内容合規、資料及資訊保護、營商環境治理等等。
這些安全中台能力不僅已經應用在阿裡的所有電商場景中,還全面輸出給了阿裡生态中的跨境公司以及其他合作夥伴。
人工智能技術的發展為安全技術帶來了機遇,也帶來了挑戰。「從這次大會的見聞來看,我們不僅在讨論 AI 解決的問題,也在研究 AI 帶來的問題。我們在讨論 AI 帶來的偏見,在讨論 AI 對隐私保護的問題。」薛晖表示。「新技術會帶來新的問題,我們要正視這些問題。有很多新技術在研發時是出于好意,但其用途會被人們歪曲。除了技術視角之外,我們還要有社會責任的視角。」
阿裡的 IJCAI 2019
今年的 IJCAI 2019 大會共收到 4752 篇論文,其中收錄 850 篇,接收率為 17.9%。據機器之心了解,阿裡在本屆會議中共有 11 篇論文入選,其中摩酷實驗室就有 5 篇論文被接收,其中包含情感分析、推薦系統等方面的工作:
- Multi-View Multi-Label Learning with View-Specific Information Extraction
- Multi-View Active Learning for Video Recommendation
- Hybrid Item-Item Recommendation via Semi-Parametric Embedding
- Multi-Objective Generalized Linear Bandits
- Knowledge Amalgamation from Heterogeneous Networks by Common Feature Learning
随着人工智能技術不斷進入落地階段,我們正在看到學界開始擁抱業界的前沿研究——最近 KDD2019 大會将論文評選分成了「研究方向」與「應用方向」兩個平行賽道就是最好的例子。在阿裡舉辦的 IJCAI 酒會活動中,摩酷實驗室負責人王曉博、圖靈實驗室負責人薛晖也與知名學者們共同對人工智能發展趨勢,以及學界和業界的交流與合作進行了一番探讨。
「人工智能領域在近十五年來經曆了很大的變化。過去,機器學習研究使用的資料集很小,人們更關注的是算法的精妙。而在今天,資料量的提升正讓研究趨勢發生改變,」清華大學計算機科學與技術系教授朱軍表示。「在業界人們經常會問:新的算法雖然很有前瞻性,但是否真的實用?今天,阿裡這樣的公司對新方法有了更高的追求。科研機構與公司之間的合作也在增多。公司的資源、需求,也在為研究提出新的課題。人工智能領域的變化是全方位的。」
目前,阿裡摩酷實驗室和圖靈實驗室都在招募資深算法工程師,招收範圍包括機器學習、自然語言處理、計算機視覺等研究方向的人才。
阿裡與清華還聯合推出了「安全 AI 挑戰者計劃」,希望能形成對抗樣本社群,點選「閱讀原文」了解更多内容。