zookeepersnapshot&txnlogclient&server watcherquorumclient detailsleaderfollowerobserverserver failoverleveldbmemtable/disktableversion/redo logfilter/...
分类:
其他好文 时间:
2014-06-28 18:58:39
阅读次数:
139
Setting up Nutch 2.1 with MySQL to handle UTF-8
分类:
数据库 时间:
2014-06-28 16:00:45
阅读次数:
363
下载:http://lucene.apache.orglucene项目的Java子项目:http://lucene.apache.org/javaLucene学习笔记查询者输入查询条件,条件之间可以通过特定运算符进行运算,比如查询希望查询到与“中国”和“北京”相关的记录,但不希望结果中包括“海淀区中...
分类:
其他好文 时间:
2014-06-28 14:04:17
阅读次数:
252
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-06-26 00:11:42
阅读次数:
259
原来使用中的sql2005的全文检索的速度总是不如意,尤其是带rank的。今天搜了一下,原来在freetexttable中还有一个参数top_n_by_rank,是第4个参数。注意还要设置:EXEC sp_configure 'precompute rank', '1'EXEC sp_configu...
分类:
数据库 时间:
2014-06-25 23:42:54
阅读次数:
305
原文地址:http://www.cnblogs.com/dennisit/p/3184225.html.北京圣思Java培训教学视频(资源共享网)2.Lucene/WebService/SVN/Ant/SpringMVC视频(学习资料库网)3.JUnit和Ant视频教程(VeryCD社区)4.《张孝...
分类:
编程语言 时间:
2014-06-25 22:13:12
阅读次数:
518
1、关键类
Lucene的搜索过程中涉及的主要类有以下几个:
(1)IndexSearcher:执行search()方法的类
(2)IndexReader:对索引文件进行读操作,并为IndexSearcher提供搜索接口
(3)Query及其子类:查询对象,search()方法的重要参数
(4)QueryParser:根据用户输入的搜索词汇生成Query对象。
(5)TopDocs:s...
分类:
其他好文 时间:
2014-06-22 16:56:47
阅读次数:
187
目前全量索引17G,不到1300万document花费大约25分钟的时间(Lucene 4.0),吞吐量远远低于lucene nightly build宣称的170G/h的量。换用StandardAnalyzer,有34%的提高,比较下使用的KAnalyzer,mmseg4j1.9.2-snapshot,standardanalyzer,性能分别在1.7M/s,10M/s,20M/s这样量级。所以...
分类:
其他好文 时间:
2014-06-22 08:37:18
阅读次数:
201
3,排序 默认是相关度排序。 也可以按指定的字段排序。 1 package cn.itcast.g_sort; 2 3 import java.util.ArrayList; 4 import java.util.List; 5 6 import org.apache.lucene....
分类:
其他好文 时间:
2014-06-20 15:39:27
阅读次数:
203
高亮 作用: 截取一段摘要 高亮显示其中的关键字 配置: 摘要大小(字数) 关键字的高亮效果(前缀、后缀,示例:关键字) 代码: 1 package cn.itcast.f_highlight; 2 3 import java.util.ArrayList; 4 import java.u...
分类:
其他好文 时间:
2014-06-20 14:19:27
阅读次数:
201