Solr7.x学习（3）-创建core并使用分词器

时间：2019-09-28 20:34:40 阅读：117 评论：0 收藏：0 [点我收藏+]

标签：hmm analyzer target fir inf webapp ase nbsp cas

1、创建core文件夹

ck /usr/local/solr-7.7.2/server/solr
mkdir first-core
cp -r configsets/_default/* first_core/

2、添加core

技术图片

3、配置中文IK分词器

参考：https://github.com/magese/ik-analyzer-solr

1）将ik-analyzer-7.7.1.jar复制到solr-7.7.2/server/solr-webapp/webapp/WEB-INF/lib目录下

2）将https://github.com/magese/ik-analyzer-solr/tree/v7.7.1/src/main/resources目录下的dynamicdic.txt、ext.dic、ik.conf、IKAnalyzer.cfg.xml、stopword.dic文件复制到solr-7.7.2/server/solr-webapp/webapp/WEB-INF/classes目录下。

3）修改managed-schema，添加配置：

<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

4）重启solr服务，测试IK分词器

技术图片

4、使用solr自带的smart中文分词器

1）复制solr-7.7.2\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.7.2.jar到solr-7.7.2/server/solr-webapp/webapp/WEB-INF/lib目录下

2）修改managed-schema文件，增加配置

<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
  </analyzer>
</fieldType>

3）重启solr，测试smart分词器

技术图片

Solr7.x学习（3）-创建core并使用分词器

标签：hmm analyzer target fir inf webapp ase nbsp cas

原文地址：https://www.cnblogs.com/zhi-leaf/p/11604289.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行