文章目錄
- IK Analyzer簡介
- IK Analyzer配置
- 網盤位址
IK Analyzer簡介
IK Analyzer 是一個開源的,基亍 java 語言開發的輕量級的中文分詞工具包。從 2006年 12 月推出 1.0 版開始, IKAnalyzer 已經推出了 4 個大版本。最初,它是以開源項目Luence 為應用主體的,結合詞典分詞和文法分析算法的中文分詞元件。從 3.0 版本開始,IK 發展為面向 Java 的公用分詞元件,獨立亍 Lucene 項目,同時提供了對 Lucene 的預設優化實作。在 2012 版本中,IK 實作了簡單的分詞歧義排除算法,标志着 IK 分詞器從單純的詞典分詞向模拟語義分詞衍化.
IK Analyzer配置
步驟:
- 1、把IKAnalyzer2012FF_u1.jar 添加到 solr 工程的 lib 目錄下
- 2、建立
檔案夾 把擴充詞典、停用詞詞典、配置檔案放到 solr 工程的 WEB-INF/classes 目錄下。WEB-INF/classes
- 3、修改
的Solrhome
檔案,配置一個schema.xml
,使用 IKAnalyzerFieldType
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>