美國國防部進階研究計劃局(darpa)正在開發能夠更好了解人類語言的深度學習技術,可以自動向情報分析人員彙報有用資訊。
提到人工智能和自然語言處理,人們會想到谷歌、微軟和雅虎等公司,卻忽略了另外一條技術鲶魚——darpa。後者目前正在開發的一個“文本深度發掘與過濾”項目(deft),能夠分析人類自身難以勝任的超大規模文本處理工作。
從darpa的官網我們了解到這個項目啟動與2012年中,至今已經開展了四年半時間,以下是darpa官網對deft項目的介紹:
自動化的深度自然語言處理(nlp)技術是高效處理文本資訊并了解文本之間隐含關聯的有效解決途徑。darpa啟動deft項目的目的是為了駕馭 nlp的威力。類似nlp的複雜人工智能技術,可以大幅提高國防分析師調查和處理文檔的效率,進而發現一些隐秘的,可以指導行動的有用資訊。
換而言之,deft自然語言深度處理技術可以幫助情報分析師們快速處理大量文本和語音資訊,了解“人物、時間、地點、事由”等關鍵資訊,并解讀一些模糊的說法或者暗示。
顯然,自然語言深度處理技術對于政府網際網路監控、執法部門的犯罪預防以及大資料反恐應用來說都具有重要意義。
目前darpa尋求通過其資助的多所大學(包括斯坦福大學、卡内基梅隆大學和哥倫比亞大學)推動deft項目。
作為奧巴馬政府2012年啟動的2億美元的政府大資料研究計劃的一部分,美國國防部同時也宣布在大資料領域每年将投入2500萬美元,其中600萬美元用于支援新的研究項目。而darpa當時開展xdata項目,計劃在四年内投入1億美元開發能夠過濾海量結構化和非結構化資料的計算機軟硬體技術。除了deft項目外,darpa還正在積極開展其他機器學習領域的技術研發,例如圖譜分析、時間線關聯等進階大資料可視化分析項目。