码迷,mamicode.com
首页 >  
搜索关键字:mmseg4j    ( 34个结果
mmseg4j 1.9.1 + Solr 4.7.2报错
mmseg4j 1.9.1 + Solr 4.7.2报错TokenStream contract violation: reset()/close() call missing, reset() called multiple times, or subclass does not call sup...
分类:其他好文   时间:2014-09-25 18:29:37    阅读次数:172
solr 4.8+mysql数据库数据导入 + mmseg4j中文全文索引 配置笔记
1.如何将solr部署,请参考之前的文章2.按上述配置好后,在solr_home文件夹中,将包含collection1文件夹,这就是solr的一个实例。下面我们来看看collection1中的文件内容。collection1中包含conf和data两个子文件夹。data中包含tlog和index(如...
分类:数据库   时间:2014-06-05 16:46:54    阅读次数:395
当前几个主要的Lucene中文分词器的比较
1.基本介绍:paoding:Lucene中文分词“庖丁解牛” PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j: 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理...
分类:其他好文   时间:2014-05-24 11:47:16    阅读次数:358
中文分词器性能比较
本篇是本人在Solr的基础上,配置了中文分词器,并对其进行的性能测试总结,具体包括使用mmseg4j、IKAnalyzer、Ansj,分别从创建索引效果、创建索引性能、数据搜索效率等方面进行衡量。具体的Solr使用方法假设读者已有了基础,关于Solr的性能指标见前期的Solr博文。
分类:其他好文   时间:2014-05-24 09:33:03    阅读次数:371
34条   上一页 1 2 3 4
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!