码迷,mamicode.com
首页 > 其他好文 > 详细

Solr4+IKAnalyzer的安装配置

时间:2016-01-09 18:31:17      阅读:156      评论:0      收藏:0      [点我收藏+]

标签:

solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。

1.版本信息

  solr版本:4.7.0

  需要ik-analyzer版本:IK Analyzer 2012FF_hf1

2.配置步骤

下载压缩解压后得到如下目录结构的文件夹:

技术分享

我们把IKAnalyzer2012FF_u1.jar拷贝到solr服务的solr\WEB-INF\lib下面。

我们把IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf下面,和core的schema.xml文件一个目录。

技术分享

修改core的schema.xml,在<types></types>配置项间加一段如下配置:

  <fieldType name="text_ik" class="solr.TextField">
         <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
         <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
或

  <fieldType name="text_ik" class="solr.TextField">   
      <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
  </fieldType>  

我们就多了一种text_ik的field类型了,该类型使用的分词器就是ik-analyzer

我们在这个core的schema.xml里面配置field类型的时候就可以使用text_ik了。

<field name="name"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />  

3.中文分词测试

技术分享

 

Solr4+IKAnalyzer的安装配置

标签:

原文地址:http://www.cnblogs.com/Crow0/p/5116827.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!