天天看點

solr--中文分詞器使用solr–中文分詞器使用

solr–中文分詞器使用

文章目錄

  • solr--中文分詞器使用
      • 一、簡介
      • 二、solr7中文分詞器使用步驟

一、簡介

solr7以前的版本對于中文分詞支援不好,通常會用IK分詞器。對于solr7,可以直接使用提供的分詞器。

二、solr7中文分詞器使用步驟

1、複制lucene-analyzers-smartcn-7.2.0.jar(在contrib/analysis-extras/lucene-libs目錄下)到server/solr-webapp/webapp/WEB-INF/lib目錄下

2、在managed-schema(在server/solr/stu/conf目錄下,這裡選的自定義core即stu)檔案中添加新分詞器

<fieldType name="text_hmm_chinese" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>
           

3、字段重新添加新增的字段類型

4、在頁面Core Admin重新加載自定義的core即stu

繼續閱讀