码迷,mamicode.com
首页 > 其他好文 > 详细

在Solr4.10配置IKAnalyzer 同义词、扩展词库、停顿词详解

时间:2015-02-10 11:16:03      阅读:373      评论:0      收藏:0      [点我收藏+]

标签:solr   ikanalyzer   分词器   同义词   扩展词库   

在配置IKAnalyzer 同义词时,遇到一些麻烦,配置了半天终于成功,在此做个记录,方便以后参考

其实配置也简单,主要是jar包,IKAnalyzer貌似已经没人更新了……本人也是从别人那下载的才可用,我也将jar包上传至本人资源,

下载路径为:http://download.csdn.net/download/tjcyjd/8430613

在solr的配置文件schema.xml中添加:

<!--IKAnalyzer-->
   <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">  
     <analyzer type="index">  
       <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="false"/>  
       <filter class="solr.LowerCaseFilterFactory"/>  
     </analyzer>  
     <analyzer type="query">  
       <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="true"/>       
       <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>  
       <filter class="solr.LowerCaseFilterFactory"/>  
     </analyzer>  
   </fieldType>

其中的org.wltea.analyzer.lucene.IKAnalyzerSolrFactory类是自己扩展的,synonyms.txt在solr_home/core/conf文件下。


配置扩展词跟扩展停顿词配置入下:

技术分享


IKAnalyzer.cfg.xml内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
  
<comment>IK Analyzer 扩展配置</comment>
  
<!--用户可以在这里配置自己的扩展字典
  
<entry key="ext_dict">ext.dic;</entry>
-->
 
  
<entry key="ext_dict">mydict.dic;</entry>
 
<!--用户可以在这里配置自己的扩展停止词字典-->
  
<entry key="ext_stopwords">stopword.dic;</entry>  
</properties>

到此配置完成,如现在需要配置“beijing”和"北京"这两个同义词,只要在synonyms.txt文件中添加:  beijing,北京 重启solr服务即可,如果不生效,把文件保存为UTF-8+BOM。


jar包下载地址:http://download.csdn.net/download/tjcyjd/8430613

在Solr4.10配置IKAnalyzer 同义词、扩展词库、停顿词详解

标签:solr   ikanalyzer   分词器   同义词   扩展词库   

原文地址:http://blog.csdn.net/tjcyjd/article/details/43699525

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!