天天看點

Lucene-全文索引

          近期接觸了lucene,我想也有非常多人以前聽過,于是帶着好奇心,我開始對lucene進行了解,給我影響最深的是它非常多的應用了索引表,這個工具之是以快是就是由于大量引用到了索引表。今天僅僅說下我剛開始做的校曆樣例,建立索引。

以下對lucene從概念上做個介紹,Lucene是一個資訊檢索的函數庫(Library),利用它你能夠為你的應用加上索引和搜尋的功能.Lucene的使用者不須要深入了解有關全文檢索的知識,隻學會使用庫中的一個類,你就為你的應用實作全文檢索的功能.不過千萬别以為Lucene是一個象google那樣的搜尋引擎,Lucene甚至不是一個應用程式,它不過一個工具,一個Library.你也能夠把它了解為一個将索引,搜尋功能封裝的非常好的一套簡單易用的API.利用這套API你能夠做非常多有關搜尋的事情,并且非常友善.

          那麼lucene能夠做什麼呢?Lucene能夠對不論什麼的資料做索引和搜尋. Lucene無論資料源是什麼格式,僅僅要它能被轉化為文字的形式,就能夠被Lucene所分析利用.也就是說無論是MS word,

Html ,pdf還是其它什麼形式的檔案僅僅要你能夠從中抽取出文字形式的内容就能夠被Lucene所用.你就能夠用Lucene對它們進行索引以及搜尋. 以下是我做的一個小樣例,就是一個查詢生成索引的樣例:

        結果會生成一系列的有關索引的檔案。例如以下圖:

Lucene-全文索引

         從上面的樣例我們能夠看出建立索引須要的三個要素各自是:

          1、indexWriter

          2、Directory

          3、Anayzer

          4、Document

         5、Field

      對于lucene的分享還要繼續。希望有越來越多的人能夠共同努力!