Solr4+IKAnalyzer的安装配置

时间：2016-01-09 18:31:17 阅读：156 评论：0 收藏：0 [点我收藏+]

标签：

solr本身对中文分词的处理不是太好，所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理，ik-analyzer就是其中一个不错的中文分词器。

1.版本信息

　　solr版本：4.7.0

　　需要ik-analyzer版本：IK Analyzer 2012FF_hf1

2.配置步骤

下载压缩解压后得到如下目录结构的文件夹：

技术分享

我们把IKAnalyzer2012FF_u1.jar拷贝到solr服务的solr\WEB-INF\lib下面。

我们把IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf下面，和core的schema.xml文件一个目录。

技术分享

修改core的schema.xml，在<types></types>配置项间加一段如下配置：

　　<fieldType name="text_ik" class="solr.TextField">
         <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
         <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
或

　　<fieldType name="text_ik" class="solr.TextField">   
    　　<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
　　</fieldType>

我们就多了一种text_ik的field类型了，该类型使用的分词器就是ik-analyzer。

我们在这个core的schema.xml里面配置field类型的时候就可以使用text_ik了。

<field name="name"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

3.中文分词测试

技术分享

Solr4+IKAnalyzer的安装配置

标签：

原文地址：http://www.cnblogs.com/Crow0/p/5116827.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行