近幾年來,正是多虧了深度學習技術的蓬勃發展,人類在“識圖”領域獲得了可喜進展。例如google的“以圖搜圖”和facebook的“人臉識别”功能,給網民們帶來了極大的便利。如今一家名為clarifai公司正打算再次突破,這次他們借助于深度學習技術,實作了視訊檔案的識别。
公司表示,目前它們的軟體能夠快速分析視訊檔案,并且識别出1萬種以上的物體或者場景。在上周,某個深度學習研讨會上,clarifai的聯合創始人兼ceo matthew zeiler上傳了一個包括含有阿爾卑斯山風景的視訊檔案,接下來便是見證奇迹的時刻:該軟體繪制出了一條縱向時間線,在不同的位置處标志出了不同物體和場景出現的時間,例如它識别出了“雪”和“山”分别出現和共同出現的時間點。另外該軟體的視訊識别時間也是短于正常人類的觀看時間的,在這次的示範中,這段三分半鐘的視訊的識别過程隻用了10秒鐘。
clarifai公司計劃将這項技術打造成一整套服務,比如說幫助使用者将廣告與線上視訊向配對,或者是成為組織、編輯視訊素材的工具。
深度學習的實作得益于類似“神經元”搭建的網絡分析資料的過程,并且系統處理的執行個體資料越多,深度學習的能力便會愈加強大。值得一提的是,紐約大學的相關研究團隊對clarifai公司的技術實作做出了極大的貢獻,并且clarifai在2013年的一次高規格圖檔識别軟體競賽中,獲得了前五名的好成績。
就像文章開頭所說的,現在深度學習領域的大多數研究仍然是着眼于圖檔識别,而并非視訊。其實在去年clarifai公司便已經推出了靜止圖像識别服務,另一家創業公司dextro在去年12月底釋出了視訊處理服務。
對于廣大熱心網友們而言,現在的一個好消息就是任何人都可以進入到clarifai官網,免費上傳10mb以内的視訊檔案進行資料分析。現在軟體可以識别出汽車、樹木甚至是人,而且還能夠識别出感官性的場景氛圍,例如“快樂”或者是“團聚”。
zeiler額外補充道,這款軟體其實有額外的妙用,“它能夠識别并推論出,究竟在視訊檔案的哪個節點上适合投放廣告。”簡單的解釋說,軟體能夠幫助視訊廣告更加精準的投放,而不會與本身的視訊内容産生較大的“違和感”。他相信,在特定的時段投放廣告對廣告主來說,無疑有着極大的吸引力。舉個例子來說,借助于clarifai的軟體,星巴克的廣告會在線上偶像劇中男女主角于咖啡廳約會之時,神不知鬼不覺的出現在頁面中。
另外,zeiler表示公司也正在嘗試與一些有意使用該技術的公司展開合作。該軟體的功能仍然在不斷完善中,主要的兩個方向是:自動總結視訊内容以及識别出在視訊中的特定時間點發生了什麼特殊活動。
原文釋出時間為:2015-02-05
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号