機器閱讀了解是自然語言處理的一個子任務,回答這一類的問題需要對文本的深層次含義進行了解模組化。該任務屬于進階别抽象的認知任務,傳統方法還是依靠一些特征工程的手段去對文本語義的一部分做出歸納。深度學習技術在這個領域雖然也有一些工作提出,但是由于受到訓練集大小的限制,現階段取得的成果并不具備優勢。就目前的研究成果來看,機器閱讀了解的研究未來有三方面值得關注。
第一,首先從統計的角度分析,現有針對問答系統的深度學習技術(如記憶網絡、神經圖靈機、關注模型)都是需要大量資料才能很好的訓練的,如果把閱讀了解過程當成一個非常複雜的函數,這個函數實作從文本(函數自變量)到知識(函數因變量)的映射,由于映射過程複雜,值域定義域非常之大,是以想通過資料對這個函數進行拟合(深度神經網絡的訓練過程),則需要大量資料才能完成。而由于閱讀了解包含高度抽象的推理過程,相對于低抽象(語言模型等)過程資料自動擷取難度較大,因而人工構造一些龐大的資料集,又非常困難。但是,現有的其他自然語言處理資源很多(如知識庫、情感分析資料集、關系分類資料集等),每一部分都包括了不同的語言學現象,如何利用現有的含有不同語義特征的語言學資源來幫助完成閱讀了解任務,使現有的神經網絡方法能夠很好的展現其能力,是未來閱讀了解研究的一個重要方向。
第二,從邏輯的角度來看,對過程進行模組化如果從統計的角度則需要大資料,而通過邏輯的角度則是一條條規則。現有基于 Lamada 表達式和一階謂詞邏輯的 semantic parsing 方法展現出了很強的推理能力。但是這些規則的構造非常困難,而且領域适應性太差。如何依靠資料對規則進行模組化是一個非常期待的研究方向。現在的馬爾可夫邏輯網,機率軟邏輯在這一方面展現了很好的性能,但是由于這些工作的基本單元還是符号規則,因而應用性還是不高。如何将最基本的規則單元從符号轉換到連續數值空間,使之有更強的魯棒性和資料驅動性則是一個亟待解決的問題。雖然現有一些方法能夠将邏輯規則單元轉化成張量表達,但是由于對張量的不同操作(内積、外積)等和實際的邏輯操作(析取、合取、并)等有所差别,是以在這一方面推進還很有挑戰。
第三,現有的深度學習方法往往着重于句子整體的語義(因而叫做黑盒模型),實行端對端的訓練,這樣的方式雖然簡單,但是可解釋性太差,内部機制(除去統計角度)還難以了解。那麼,我們是不是可以把閱讀了解“推理”任務拆分開來,把整個文本了解過程當作很多更為細粒度的語義分析過程的集合,然後對每一個子部分進行模組化。最後将這些子過程有機(同步、異步、時間先後)結合在一起,組成最後的了解過程,是不是會有更好的效果和更好的解釋性。并且依靠深度學習技術,模組化過程會相對簡單,這一問題還有待研究。
本文對于機器閱讀了解任務,以及目前的一些代表性的方法進行了簡要綜述。随着近些年來人工智能的發展,人們不僅僅滿足于計算機能夠幫助我們實作計算、統計,還希望計算機能夠幫助我們實作推理;不僅僅希望計算機能夠“聽”我們,更希望它們能夠“懂”我們。近一段時間,大型網際網路公司都着重在人工智能上加大力度投入研究,Facebook 成立了人工智能實驗室,谷歌研制的阿爾法狗也戰勝了人類圍棋冠軍。機器閱讀了解雖然現階段屬于自然語言處理的一個子任務,但是它卻是機器人工智能的一個很好的展現。回答選擇題是表象,了解文本是内在。相信随着越來越多研究人員投入到自然語言了解領域,機器閱讀了解也将迎來更大的發展。