mmseg4j 1.9.1 + Solr 4.7.2报错TokenStream contract violation: reset()/close() call missing, reset() called multiple times, or subclass does not call sup...
分类:
其他好文 时间:
2014-09-25 18:29:37
阅读次数:
172
1.如何将solr部署,请参考之前的文章2.按上述配置好后,在solr_home文件夹中,将包含collection1文件夹,这就是solr的一个实例。下面我们来看看collection1中的文件内容。collection1中包含conf和data两个子文件夹。data中包含tlog和index(如...
分类:
数据库 时间:
2014-06-05 16:46:54
阅读次数:
395
1.基本介绍:paoding:Lucene中文分词“庖丁解牛”
PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j: 用 Chih-Hao Tsai 的 MMSeg 算法
实现的中文分词器ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理...
分类:
其他好文 时间:
2014-05-24 11:47:16
阅读次数:
358
本篇是本人在Solr的基础上,配置了中文分词器,并对其进行的性能测试总结,具体包括使用mmseg4j、IKAnalyzer、Ansj,分别从创建索引效果、创建索引性能、数据搜索效率等方面进行衡量。具体的Solr使用方法假设读者已有了基础,关于Solr的性能指标见前期的Solr博文。
分类:
其他好文 时间:
2014-05-24 09:33:03
阅读次数:
371