码迷,mamicode.com
首页 > 其他好文 > 详细

给LUKE增加word分词器

时间:2015-04-07 21:54:58      阅读:157      评论:0      收藏:0      [点我收藏+]

标签:

word分词是一个Java实现的分布式中文分词组件


1、下载http://luke.googlecode.com/files/lukeall-4.0.0-ALPHA.jar(国内不能访问)


2、下载并解压Java中文分词组件word-1.0-bin.zip


3、 将解压后的 Java中文分词组件word-1.0-bin/word-1.0 文件夹里面的4个jar包解压

到当前文件夹,用压缩解压工具如winrar打开lukeall-4.0.0-ALPHA.jar,将当前文件夹

里面除了.jar、.bat、.html文件外的其他所有文件拖到lukeall-4.0.0-ALPHA.jar里面


4、执行命令 java -jar lukeall-4.0.0-ALPHA.jar 启动luke,在Search选项卡的Analysis

里面就可以选择 org.apdplat.word.lucene.ChineseWordAnalyzer 分词器了

 

5、在Plugins选项卡的Available analyzers found on the current classpath里面也可以

选择 org.apdplat.word.lucene.ChineseWordAnalyzer 分词器


下载已经制作好的:lukeall-4.0.0-ALPHA-with-word-1.0.jar 


如下图所示:

技术分享


技术分享

给LUKE增加word分词器

标签:

原文地址:http://my.oschina.net/apdplat/blog/397069

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!