天天看點

阿裡媽媽圖像識别重新整理世界最好成績,識别虛假推廣資訊準确率超95%

日前,阿裡媽媽圖像團隊的ocr(圖中文字識别)技術重新整理了icdar robust reading競賽資料集的全球最好成績,并大幅超越第二名。robust reading競賽是目前ocr技術領域全球最具影響力的比賽。這也是繼阿裡巴巴圖像搜尋領軍人物華先勝獲得acm(美國計算機協會)“傑出科學家”稱号之後,阿裡的圖像識别技術再一次登上國際頂尖舞台。

阿裡媽媽圖像識别重新整理世界最好成績,識别虛假推廣資訊準确率超95%

圖. icdar robust reading

challenge 1 end-to-end官方成績

借助這一領先的ocr技術,阿裡媽媽圖像團隊能夠以95%的超高準确率識别圖中違規文字資訊,有效過濾商家惡意推廣,維護消費者權益。2015年,阿裡媽媽累計屏蔽了4600萬條惡意推廣。

ocr是計算機視覺領域的經典問題,長久以來,一直受到學術界和工業界的持續關注。在工業界,google、microsoft、amazon等大型網際網路公司,以及商湯科技、曠視科技(擁有face++、image++)等計算機視覺技術創業公司,都在ocr技術上耕耘多年。随着技術不斷成熟,ocr也開始在網際網路及其他行業逐漸上線使用。

據阿裡媽媽定向算法技術負責人蓋坤介紹,在阿裡巴巴平台上營銷創意、商品等均是以圖檔形式展示,圖像技術是了解這些資訊的重要手段。同時,也有不良商家在圖檔中内嵌一些違規的資訊達到其惡意推廣的目的,圖檔内文字違規是比例相當大的一類,而傳統監控手段多以人工肉眼來稽核,費時費力,尤其是随着圖檔數量越來越大,這幾乎已成為不可完成的任務。針對這一強烈需求,從2014年開始,阿裡媽媽圖像團隊開始重點攻堅ocr技術,通過機器視覺的方式從圖檔中識别出文字,進而鑒别出違規的文案資訊。

對惡意推廣的定義,蓋坤表示,一方面依據國家相關法律法規,對于違禁品、色情資訊、封建迷信、假冒僞劣、減肥豐胸、誇大虛假等違規類型進行不同程度的處罰和管理,另一方面在法規之外平台有着更高要求,對損害消費者利益或進行不正當競争的推廣類型積極嘗試進行管控。其中,與消費者關系最為密切的假冒僞劣單項違規類型,被阿裡媽媽作為重點審查對象。

相對其他限定場景ocr應用相比,阿裡媽媽要處理的創意圖檔和商品圖檔上的文字字型、色彩更加多樣,文字布局更加靈活,背景包括各種商品、布景或自然場景,蘊含各種複雜紋理,給識别問題帶來了更大的挑戰。蓋坤介紹,在技術路線上,相比于傳統方法,抛棄了圖像預處理、字元分割等流程,采用了多個深度神經網絡和語言模型相結合的方法來組成完整的ocr系統。針對複雜的場景資訊,将lstm(長短時記憶)技術成功應用到模組化中去,大大提高識别的準确率。

據悉,現在基于ocr文字識别實時稽核已覆寫整個阿裡媽媽業務,每天處理圖檔近千萬張,自動回報疑似違規圖檔準确率達95%以上;同時将圖文稽核風險發現時間從“天”降低到“秒”級。資料顯示,2015年阿裡媽媽累計屏蔽了4600萬條惡意推廣,有效淨化了網際網路營銷環境。

除ocr過濾惡意推廣以外,計算機視覺技術在阿裡巴巴集團内部已經獲得廣泛使用,比如手淘的“拍立淘”産品,通過手機拍照即可搜尋相似商品,2015年雙11當天,千萬消費者使用了“拍立淘”功能,創造了超過數千萬元的銷售額。另外,在商品圖檔版權保護、鑒黃等場景也都引入了計算機視覺技術。

關注了解更多技術幹貨:

阿裡媽媽圖像識别重新整理世界最好成績,識别虛假推廣資訊準确率超95%

繼續閱讀