码迷,mamicode.com
首页 > 其他好文 > 详细

IK分词器使用自定义词库

时间:2015-09-06 13:13:34      阅读:352      评论:0      收藏:0      [点我收藏+]

标签:

1、拷贝IKAnalyzer.cfg.xml到WEB-INF/classes下,IKAnalyzer.cfg.xml内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
    <comment>IK Analyzer 扩展配置</comment>
    <!--用户可以在这里配置自己的扩展字典 -->
    <entry key="ext_dict">myExt.dic;</entry>
    
    <!--用户可以在这里配置自己的扩展停止词字典-->
    <entry key="ext_stopwords">stopword.dic;</entry>
    
</properties>

2、修改加入自定义词库:
<entry key="ext_dict">myExt.dic;myExt2.dic</entry>

3、myExt.dic格式如下,注意myExt.dic需要是UTF-8 无BOM格式编码
深南
东路
深南东路
地王大厦
红村社区
桂园街道
桂园

4、设置UTF-8 无BOM格式编码:
下载notepad++编辑器,打开文件,选择格式 - 以UTF-8 无BOM格式编码



IK分词器使用自定义词库

标签:

原文地址:http://my.oschina.net/sniperLi/blog/501600

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!