1. Sphin x简介
1.1. 什么是全文检索
全文检索是指以文档的全部文本信息作为检索对象的一种信息检索技术 。检索的对象有可能是文章的标题,也有可能是文章的作者,也有可能是文章摘要或内容。
1.2. 介绍
Sphin x是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能 ,使得应用程序更...
分类:
其他好文 时间:
2014-05-23 07:36:05
阅读次数:
227
问题如下:
假设这样一种情况,首先说明,信息是存放在mysql数据库中的。情况如下,A表信息堆是百万级信息堆(每条信息长度不长,基本在20字符以内,属于简短词语),B则是一条普通信息(长度大概在500字符左右),问,有哪种最有效的方式可以来判断B信息中是否包含有A堆中的信息并返回包含的信息?
在此提供一种解法,如果大家有更好的解法欢迎大家留言交流!
由于A信...
分类:
其他好文 时间:
2014-05-22 13:34:44
阅读次数:
196
讲解了Java中数组的使用以及和数组相关的操作。...
分类:
编程语言 时间:
2014-05-22 11:05:01
阅读次数:
391
用QT也已经三四年了,今天从QT的tools中看到qtclucene,原来这个就是从clucene移植过来的一个全文检索工具,用在QTHelp中。
下面是clucene的说明:
CLucene是Lucene的一个C++移植,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。[1]
Lucene不是一个完整的全文索...
分类:
其他好文 时间:
2014-05-20 17:17:03
阅读次数:
300
这篇MongoDB基本管理命令比较全面,转载保留,原文MongoDB是一个NoSQL数据库系统:一个数据库可以包含多个集合(Collection),每个集合对应于关系数据库中的表;而每个集合中可以存储一组由列标识的记录,列是可以自由定义的,非常灵活,由一组列标识的实体的集合对应于关系数据库表中的行。...
分类:
数据库 时间:
2014-05-15 17:31:32
阅读次数:
590
这几天测试确认系统的订单大库查询,发现查询很慢,但是都增加了相应的索引,但是依然很慢,查询经常请求超时,涉及的数据库是order-store的order-index表(目前是直接通过和数据库交互的方式去查询的,没有用到搜索引擎)。经过排查,发现是数据迁移,迁移进来了300多万的数据,拖慢了查询的速度...
分类:
数据库 时间:
2014-05-14 10:41:07
阅读次数:
362
我喜欢看武侠电影,尤其的70-80年代的邵氏电影,在这个期间,邵氏公司将金庸和古老很多小说都改拍成了电影,可以说,看这些电影是一种享受,真的!对于现实中的IT世界,也像是一个江湖,当你掌握了一些技能后,就可以驰骋江湖了,你当然可以成功小李飞刀,也可以成功楚香帅,当然,在成为他们之前,你必须要掌握相关...
分类:
其他好文 时间:
2014-05-14 07:39:27
阅读次数:
306
Apache Avro? 1.7.6
SpecificationIntroductionSchema DeclarationPrimitive TypesComplex
TypesRecordsEnumsArraysMapsUnionsFixedNamesAliasesData Serializat...
分类:
其他好文 时间:
2014-05-14 07:18:56
阅读次数:
345
想ES中存储数据,需要index——存储数据的地方,实际上,index就是一个指向若干物理shard的逻辑命名空间。shard就是更底层的工作单元,每个shard是一个Lucene的实例,每个shard在其控制范围内都是一个完整的搜索引擎。我们的文档被存储,并且被index到shard,但是应用程序...
分类:
其他好文 时间:
2014-05-13 19:13:16
阅读次数:
289
作者:ASP精品屋 探索者
事件起因:
好几个月前,我制作的某个网站觉得有必要采用全文索引擎,简单地自己的电脑上测试了一下全文索引,搜索一些英文字符没有问题,但搜索中文时就出现“查询子句只包含被忽略的词”的错误,任何中文都是如此。由于此网站不是很急,也就过去了。近几天,我原来制作好的一个网站需要转移,它使用了全文索引。突然发现新的专业服务器不能搜索中文,由于事情很急,我必须是几天内解决此问...
分类:
其他好文 时间:
2014-05-13 05:49:37
阅读次数:
238