码迷,mamicode.com
首页 > 其他好文 > 详细

搜索技术:solr+IK分词器配置

时间:2016-04-07 18:25:50      阅读:146      评论:0      收藏:0      [点我收藏+]

标签:

一、搭建solr服务器
1、Apache官网下载solr,本次使用4.9.1版本
2、解压solr,找到example,将webapps中的war包复制到tomcat的webapps下
3、运行tomcat,关闭tomcat,得到解压后的solr文件夹,删除war包
4、将example\lib\ext\*.jar复制到解压后的solr\WEB-INF\lib中
5、将example文件下solr文件夹的地址放到步骤6的/put/your/solr/home/here位置
6、修改web.xml
 <env-entry>
         <env-entry-name>solr/home</env-entry-name>
         <env-entry-value>/put/your/solr/home/here</env-entry-value>
         <env-entry-type>java.lang.String</env-entry-type>
     </env-entry>
7、启动tomcat,访问  solr服务器所在主机IP:端口号/solr(默认collection1)
 比如:http://127.0.0.1:8080/solr
出现管理员界面,说明配置成功。

二、配置IK分词器
 1、下载文件
 2、解压缩,将dist文件夹下的,IKAnalyzer.cfg.xml,stopword.dic复制到tomcat\webapps\solr\WEB-INF\classes\
 3、修改上面(一)第5步的solr文件夹下的collection1\conf\schema.xml文件
 添加如下内容
 <!--自定义字段类型-->
  <fieldType name="text_ik" class="solr.TextField">
  <!--索引时候的分词器-->
  <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  <!--查询时候的分词器-->
  <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldType>
 <!--自定义字段-->
 <field name="aaa" type="text_ik" indexed="true" stored="true" />
 4、重启tomcat
三、自定义分词扩展词库
 1、创建扩展词库文件  ext.dic,并在里面写上词语,以换行结束 比如  瀚铂  泉频道 。。。
 2、修改tomcat\webapps\solr\WEB-INF\classes\
  在此处注册,多个文件以;隔开
  <entry key="ext_dict">ext.dic;</entry>

搜索技术:solr+IK分词器配置

标签:

原文地址:http://www.cnblogs.com/neolithic/p/5362326.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!