1. Sphin x简介
1.1. 什么是全文检索
全文检索是指以文档的全部文本信息作为检索对象的一种信息检索技术 。检索的对象有可能是文章的标题,也有可能是文章的作者,也有可能是文章摘要或内容。
1.2. 介绍
Sphin x是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能 ,使得应用程序更...
分类:
其他好文 时间:
2014-05-23 07:36:05
阅读次数:
227
问题如下:
假设这样一种情况,首先说明,信息是存放在mysql数据库中的。情况如下,A表信息堆是百万级信息堆(每条信息长度不长,基本在20字符以内,属于简短词语),B则是一条普通信息(长度大概在500字符左右),问,有哪种最有效的方式可以来判断B信息中是否包含有A堆中的信息并返回包含的信息?
在此提供一种解法,如果大家有更好的解法欢迎大家留言交流!
由于A信...
分类:
其他好文 时间:
2014-05-22 13:34:44
阅读次数:
196
摘要:为了探索JAVA1.7源码中HashMap类数据的组织方法与目录扩展方法,通过对JAVA1.7源码中HashMap类源码的阅读与分析,得出结论:hashmap中存储数据的数据结构采用的是链表数组,目录是个数组,数组的成员是链表。冲突解决方法:典型的链地址法,冲突后,在链表头部插入数据。目录扩展方法:已二倍的方式扩展,一直到目录的最大上限。目录扩展的触发条件:装载因子的方式触发。从java中hashmap的实现可以看出,桶数据的组织方式并不是一种非常高效的方式。对检索效率不利。同时,数据扩展简单的采用二...
分类:
编程语言 时间:
2014-05-22 11:19:47
阅读次数:
301
讲解了Java中数组的使用以及和数组相关的操作。...
分类:
编程语言 时间:
2014-05-22 11:05:01
阅读次数:
391
用QT也已经三四年了,今天从QT的tools中看到qtclucene,原来这个就是从clucene移植过来的一个全文检索工具,用在QTHelp中。
下面是clucene的说明:
CLucene是Lucene的一个C++移植,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。[1]
Lucene不是一个完整的全文索...
分类:
其他好文 时间:
2014-05-20 17:17:03
阅读次数:
300
在上一个章节,我们了解来向index插入和检索数据的所有的方法。但是对于数据是怎么样分布和检索的很多细节都没有进行详细的解释。这种分开讲解(没有详细的解释)是故意的,你不用知道ES中数据是怎么分布,怎么工作的,但是就知道他能工作就行了。在本章节,我们将会深入的讲解内部的细节,帮助你数据是怎么存储在一...
分类:
其他好文 时间:
2014-05-19 17:06:04
阅读次数:
229
一个文档可以从primary shard和任意一个相对应的replica
shard中检索:就像上面图形中表示的,下面列出从primary shard或这replica
shard检索document的步骤:1:客户端发送请求到node12:这个node使用document的_id判定documen...
分类:
其他好文 时间:
2014-05-19 15:30:30
阅读次数:
251
updateAPI是以前说过的read和write操作的联合:操作步骤:1:客户端向node1发起请求。2:node1想node3转发请求,node3是要查找的document的primary
shard被分配的地方3:node3从primary shard检索要查找的document,把_sour...
分类:
其他好文 时间:
2014-05-19 14:36:01
阅读次数:
341
上篇博文我重点介绍了八大内部排序,这篇博文(数据结构与算法的最后一课)重点介绍查找,我们依旧沿用上篇博文的风格,先简单介绍,再以例子重点讲解。
下面我们开始今天的旅行,首先祝你旅行愉快,呵呵。
静态查找
若查找目的是为了查询某个特定的数据是否在表中或检索某个特定数据的各种属性...
分类:
其他好文 时间:
2014-05-18 13:26:40
阅读次数:
299
mget允许我们一次检索多个document,而bulk
API则允许我们在一个请求中做create,index,update
或者delete。如果你要index一个数据流如日志数据,bulk是很实用的,bulk可以能排队数百或数千的批次处理。bulk的请求体有点不同寻常,如下:{
action:...
分类:
其他好文 时间:
2014-05-17 19:24:37
阅读次数:
313