码迷,mamicode.com
首页 > 编程语言 > 详细

IK 用java 代码实现分词

时间:2015-09-17 19:05:21      阅读:175      评论:0      收藏:0      [点我收藏+]

标签:

需要导入IK 对应的jar 包


IKAnalyzer2012.jar

lucene-core-4.10.jar

public static void main(String[] args) throws IOException {
       //  String text="基于java语言开发的轻量级的中文分词工具包";  
         String text="宋祖英语培训班、周渝民政服务中心、容祖儿童医院、吴奇隆胸医院、苏永康复中心、梁朝伟哥专卖、陈冠希望小学、吴彦祖传中医坊、林书豪华酒店";  
      //创建分词对象  

            Analyzer anal=new IKAnalyzer(true);       
            StringReader reader=new StringReader(text);  
            //分词  
            TokenStream ts=anal.tokenStream("", reader);  
            CharTermAttribute term=ts.getAttribute(CharTermAttribute.class);  
            //遍历分词数据  
            ts.reset();
            while(ts.incrementToken()){  
                System.out.print(term.toString()+"|");  
            }      
            ts.close();
            reader.close();  
            System.out.println();  

        
    }

分词结果:

宋祖英|语|培训班|周渝民|政|服务中心|容祖儿|童|医院|吴奇隆|胸|医院|苏永康|复|中心|梁朝伟|哥|专卖|陈冠希|望|小学|吴彦祖|传|中医|坊|林|书|豪华酒店|

IK 用java 代码实现分词

标签:

原文地址:http://www.cnblogs.com/zhanggl/p/4817145.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!