天天看點

MIT黑科技:“不開卷也有益”,計算機不翻書就能讀完一本書

編者按:第一眼看到文章的标題,大家肯定會不約而同地想到:“isn’t it amzing that computers can read through a book page by page without opening it”?講真,我們文章的作者,來自mit media lab的a. r. sanchez, b. heshmat, a. aghasi等研究員們,将為大家詳細講述如何運用太赫茲時栅光譜成像技術從層狀結構中,如一本閉合着的富有文化價值的古籍,提取文本内容。不同于x射線或超音波,該成像技術能夠區分頁與頁之間、空白頁與有文字的頁之間的差異,透讀9頁紙張上的内容。目前,研究員們正在繼續努力,以期實作技術上的突破,提升該項技術在工業、文化遺産研究等領域的實際應用。

 在傳統意義上,飛行時間成像技術一般應用于快速成像(飛秒攝影femto photography)和複雜的幾何圖形成像(如在拐角處或漫射器内成像)。由于光速将時間與空間緊密聯系在一起,時間分辨率越高,空間分辨率也将随之增加。在我們的最新研究中,我們将從100千兆赫茲到3太赫茲範圍内甄選出一個能夠穿透紙張或其他材料的頻段。我們也将對具有很高時間分辨率(每秒10兆幀)的光脈沖進行取樣,取樣所得的光脈沖是我們之前的研究中所用光脈沖的20多倍。如此高的時間分辨率将空間分辨率提升到30微米左右,使将一本合着的書的頁與頁之間分開來成為可能。我們提出了一種擴充算法使這種成像方式(可以稱之為太赫茲時間域光譜技術)既能夠成像,也能夠透讀密集的層狀結構。這種成像技術當然在工業檢測中能夠得到應用,不過,也能夠用于透讀閉合着的古老檔案或者檢查富有文化價值的書籍樣本。

對一些複雜樣本,如閉合的書籍,進行非侵入性檢查目前所面臨的三大成像技術瓶頸為:空間分辨率,光譜對比度和遮擋。我們運用傳統太赫茲時間域光譜學技術的飛行時間能力,并結合其光譜能力,力圖在算法上克服這些技術瓶頸。據我們的研究報道,能夠成功地無監督式提取一個類似于一本閉合的書籍的密集層狀結構所包含的内容。

基于反射所得的太赫茲電場的統計結果,我們的技術使用類似飛行時間的測量方法來定位書中的每一頁。層定位結束後,我們運用一種新型時栅光譜分析方法,這種分析方法能夠調整每一頁的頻率,使之對應光譜域中對比度最高的幀。随着頁碼的增加,我們采用的研究方法能夠産生一種等級凸顯效果,為每一頁排序。當使用一種最近才提出的能夠識别出每一頁被遮擋的字母的方法後,整個成像過程便宣告結束。實驗結果表明,我們已經能夠成功地從一紮至少9頁帶有文字的紙張中提取出字母。

由于工業界有不計其數的層狀結構,每層的厚度大約有亞毫米,和數不清的富有文化價值的文本(如檔案,書籍和藝術作品),運用thz tds(太赫茲時間域光譜技術)從層狀結構中提取内容具有廣闊的應用前景。是以,我們的研究将有助于改進thz和其他用于從層狀結構中提取内容的時間分辨率成像技術。

我們的研究證明了太赫茲時栅成像技術在提取深度内容方面的實際應用,并且為成像與傳感領域的研究指明了新的研究方向。我們的研究結果報告如下:

MIT黑科技:“不開卷也有益”,計算機不翻書就能讀完一本書

1. 與傳統的去卷積技術相比,thz tds的電場統計結果能夠提高較深層層定位的精确度。此外,這種技術在提取脈沖方面的應用并不依賴一種參考測量标準。

2. 太赫茲時間域光譜技術具備的飛行時間能力或時間分辨率主要能夠用于在空間内分辨3d光譜特征(而并非用于對整個樣本作純粹的變換諧波量分析)。這将有助于我們調整文本内部和空白頁之間微小的光譜差異,以達到凸顯文本的目的。

3. 目前提出的計算方法,如基本凸形狀分解,能夠通過精确恢複被遮擋的内容,進而得到全新的應用。

MIT黑科技:“不開卷也有益”,計算機不翻書就能讀完一本書

此外,我們的技術對以下三個領域産生了重大影響——超快成像,計算成像和太赫茲光譜成像。我們期望,我們的研究結果将激發廣大讀者對于太赫茲時栅成像技術的濃厚興趣,同時為其檢查層狀結構和層狀結構成像搭建一個新的平台。本研究将對工業成像、地震成像領域的研究和文化遺産研究産生深遠的影響。此外,由于這種成像方式是以映像的形式為依托的,它的應用将拓展到運用其他類型飛行時間傳感器的遠距離成像研究中。

讀者可能對與本文相關的一些問題感興趣,我們在這裡簡要提及四個:

1. 我們的研究與camera future的“每秒兆幀成像”研究項目有什麼聯系?

我們運用相似的超快成像方法定位每一頁。基于測量所得的太赫茲脈沖達到的時間,我們計算出每一頁的位置,然後觀察脈沖的光譜,以确定該頁的某個位置是否有墨迹。camera future 的“每秒兆幀成像”項目是首個将實體學中常用的超快設定方法運用到成像系統與應用的項目。

2. 難道x射線或超音波不能實作從層狀結構中快速提取内容嗎?

似乎,x射線或超音波也能夠實作讀通書本,成像;但是,與我們的thz技術相比,這類技術在亞微型鋼筆墨水或鉛筆層與空白頁之間不能形成對比對。這類方法也有其他的缺點,如花費高和電離輻射。如果運用ct的話,将很難檢測出一本閉合的書籍中頁與頁之間的差異,因而不能看到文本内容。然而,我們的遠紅外時間分辨系統是基于紙張吸收光譜的,這種成像技術将成為唯一一種用于逐張提取文本内容的技術。

3.  該thz tds成像技術的創新之處展現在哪裡?

該技術的核心貢獻在于:

      1、運用thz信号統計結果提取一層文本内容。與傳統的方法相比較,這種新技術能夠運用于更多也輸得内容提取。

      2、運用kurtosis的光譜對比度來調整空白紙與有墨迹的紙張頻率域之間的細微差異。

      3、凸基本形狀比對,能夠檢測出被遮擋的字母。

      4、我們應用上述提到的所有技術,以便采用計算方法并利用thz時間域光譜系統的光譜分辨率與時間分辨率實作新的應用。

4. 該技術的局限性展現在哪裡?

snr與光譜對比是目前的主要技術瓶頸;一個具備更高性能的系統将有助于我們“更深地”讀書。另一局限性在于薄紙張的變形,紙張變形将導緻信号的扭曲,近來我們的研究有志于解決這一難題。

<a href="http://www.nature.com/articles/srep20217" target="_blank">原文連結</a>

via a. r. sanchez et al.

本文由雷鋒網(公衆号:雷鋒網)獨家編譯,未經允許拒絕轉載!

本文作者:高婓

繼續閱讀