标签:
需要导入IK 对应的jar 包
IKAnalyzer2012.jar
lucene-core-4.10.jar
public static void main(String[] args) throws IOException { // String text="基于java语言开发的轻量级的中文分词工具包"; String text="宋祖英语培训班、周渝民政服务中心、容祖儿童医院、吴奇隆胸医院、苏永康复中心、梁朝伟哥专卖、陈冠希望小学、吴彦祖传中医坊、林书豪华酒店"; //创建分词对象 Analyzer anal=new IKAnalyzer(true); StringReader reader=new StringReader(text); //分词 TokenStream ts=anal.tokenStream("", reader); CharTermAttribute term=ts.getAttribute(CharTermAttribute.class); //遍历分词数据 ts.reset(); while(ts.incrementToken()){ System.out.print(term.toString()+"|"); } ts.close(); reader.close(); System.out.println(); }
分词结果:
宋祖英|语|培训班|周渝民|政|服务中心|容祖儿|童|医院|吴奇隆|胸|医院|苏永康|复|中心|梁朝伟|哥|专卖|陈冠希|望|小学|吴彦祖|传|中医|坊|林|书|豪华酒店|
标签:
原文地址:http://www.cnblogs.com/zhanggl/p/4817145.html