异常介绍SetOnceA convenient class which offers asemi-immutable objectwrapper implementation which allows one to set the value of an object exactly once, a...
分类:
其他好文 时间:
2014-08-31 14:27:51
阅读次数:
172
我们来看最复杂的部分,就是Term Dictionary和Term Index文件,Term Dictionary文件的后缀名为tim,Term Index文件的后缀名是tip,格式如图所示。Term Dictionary文件首先是一个Header,接下来是PostingsHeader,这两个的格式...
分类:
其他好文 时间:
2014-08-29 22:31:38
阅读次数:
378
1. 定长编码最容易想到的方式就是常用的普通二进制编码,每个数值占用的长度相同,都占用最大的数值所占用的位数,如图所示。这里有一个文档ID列表,254,507,756,1007,如果按照二进制定长编码,需要按照最大值1007所占用的位数10位进行编码,每个数字都占用10位。和词典的格式设计中顺序列表...
分类:
其他好文 时间:
2014-08-29 12:51:27
阅读次数:
298
Solr里面的core就像数据库里面的一个表,用来管理索引和相关配置。一、使用示例core下载的solr完整包里面solr-4.7.0\example\multicore这个文件夹下面有2个示例core;分别是core0和core1;如下图:随便拷贝个到$SOLR_HOME$,$SOLR_HOME$...
分类:
其他好文 时间:
2014-08-29 10:53:17
阅读次数:
233
solr简介Solr是一个开源的,企业级搜索服务器。Solr可以理解为Lucene的服务器化产品。它使用java编写,遵循http协议和xml协议,使用多种数据格式(如json,xml)传递数据。但她不是对Lucene的一次简单封装,Solr的大多数特征都与Lucene不同。Solr和Lucene的界限经常是模糊的。以..
分类:
其他好文 时间:
2014-08-29 03:04:48
阅读次数:
413
接到一个优化算法任务数据库储存着银行卡号用上下限表示的区间,互不交叉重叠,现有9万多记录。给一个卡号,如何找到该条记录。现有方法是使用前三位数做索引字段,起到一定效果,但是数据一大了还是效率低。我推测了一下其应用情景是银行每个网点所具有的发卡权不一样,某个区间属于某个网点所发。阶段一、IP反查城市既...
分类:
其他好文 时间:
2014-08-28 22:33:36
阅读次数:
240
介绍solr3.6.2和solr4.9.0在tomcat7.0.55下的基本配置。包括IK分词器、主从配置。可以满足工作中的最基本需求。...
分类:
其他好文 时间:
2014-08-28 18:11:25
阅读次数:
295
页面引入三个JS: <script?type="text/javascript"?src="js/jquery-1.7.2.js"></script>??
????????<script?type="text/javascript"?src="js/jquery-ui.js"></script>??
??????????...
分类:
Web程序 时间:
2014-08-28 13:26:50
阅读次数:
399
fl: 是逗号分隔的列表,用来指定文档结果中应返回的 Field 集。默认为 “*”,指所有的字段。defType: 指定query parser,常用defType=lucene, defType=dismax, defType=edismaxq: query。q.alt: 当q字段为空时,用于设...
分类:
其他好文 时间:
2014-08-28 13:04:49
阅读次数:
272
二、SolrJ的使用 SolrJ覆盖了solr的全部功能,下面将自己在实际开发中所使用的程序粘贴出来并适当加以解释,由于本人比较菜,代码书写不是那么的精练,还请见谅。1、 创建solrserver对象:try { solr = new CommonsHttpSolrServer("http://lo...
分类:
其他好文 时间:
2014-08-28 12:49:59
阅读次数:
260