solr5.0集成mmseg4j分词器

时间：2015-06-17 16:45:34 阅读：168 评论：0 收藏：0 [点我收藏+]

毕竟IK跟不上搜索引擎的步骤啊，以前用习惯了ik突然solr5.0却没有对应的版本（可能是我没找到吧）。这里先用mmesg4j代替下，感觉还不错，集成流程超级简单，几步就搞定：

1、进入/tomcat/webapps/solr/WEB-INF/lib目录，将mmseg4j-solr-2.3.0.jar和mmseg4j-core-1.10.0.jar放进去

2、进入solr/home目录，建立自己的词库，我这里是建立my_dic文件夹，里面放一个wordsXXX.dic的文件就行（注意，自己的词库优先级没有默认的高）。

附：可以将mmseg4j-core-1.10.0.jar里面默认的词库自己修改下也行，再不行修改源码咯String defPath = System.getProperty("mmseg.dic.path")）mmseg.dic.path决定加载词库优先级的，很简单，不多介绍了。

3、进入schema.xml，增加如下配置：

4、重启solr，搞定了。

5、至于配置文件的三中分词效果自己去尝试一下就明白了，max用的应该会多点

原文地址：http://blog.csdn.net/u013035314/article/details/46534379

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行