文章转自:http://blog.csdn.net/hguisu/article/details/7949844通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件...
分类:
其他好文 时间:
2014-09-30 14:57:29
阅读次数:
302
文章转自:http://blog.csdn.net/hguisu/article/details/7978451我们从用户的角度来看,用户不关心什么索引结构是倒排还是签名文件,也不需要知道相关排序算法。用户提交了查询,就需要获取满意的搜索结果。这个搜索结果就是搜索引擎是否提供有效的服务。1.查询流程...
分类:
其他好文 时间:
2014-09-30 14:26:59
阅读次数:
151
文章转自:http://blog.csdn.net/hguisu/article/details/7962350搜索引擎的索引1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系...
分类:
其他好文 时间:
2014-09-30 13:23:19
阅读次数:
203
文章转自:http://blog.csdn.net/hguisu/article/details/79559851. 搜索引擎的分类搜索引擎按其工作方式主要可分为三种:分别是全文搜索引擎(Full Text Search Engine)目录索引类搜索引擎(Search Index/Directory...
分类:
其他好文 时间:
2014-09-30 13:06:09
阅读次数:
242
文章转自:http://blog.csdn.net/hguisu/article/details/79697571.概述 在关系数据库系统里,索引是检索数据最有效率的方式,。但对于搜索引起,他它并不能满足其特殊要求:1)海量数据:搜索引擎面对的是海量数据,像Google,百度这样大型的商业搜索引擎索...
分类:
其他好文 时间:
2014-09-30 13:05:49
阅读次数:
254
下班前,老大给了道题目,是最近的一个LBS需求。
要获取你当前位置最近的一些餐厅。
已有的一些:数据库里大概存着一百万个餐厅的详细记录,包括id,name和经纬度等。
移动端给你返回他当前的经纬度,让你找出附近的餐厅。
大概试了下,如果直接查数据库,其实也不慢,在经纬度都加索引的情况下,模糊查询(比如客户端返回的经纬度是38.1024和62.2048),既然是附近你就按38.102...
分类:
其他好文 时间:
2014-09-30 03:12:52
阅读次数:
231
为什么要创建索引呢?这是由于,创建索引能够大大提高系统的性能。 第一,通过创建唯一性索引,能够保证数据库表中每一行数据的唯一性。 第二,能够大大加快 数据的检索速度,这也是创建索引的最基本的原因。 第三,能够加速表和表之间的连接,特别是在实现数据的參考完整性方面特别有意义。 第四,在使用分组和排序 ...
分类:
数据库 时间:
2014-09-29 19:16:27
阅读次数:
176
Snippets—the few lines of text that appear under every search result—are designed to give users a sense for what’s on the page and why it’s relevant to their query. If?Google understands the ...
分类:
其他好文 时间:
2014-09-29 18:37:31
阅读次数:
316
创建地理空间索引注意事项创建地理空间索引失败,提示错误信息如下> db.places.ensureIndex({"loc":"2dsphere"}){"createdCollectionAutomatically" : false,"numIndexesBefore" : 1,"ok" : 0,"e...
分类:
数据库 时间:
2014-09-29 17:24:11
阅读次数:
241
"$near"是唯一一个会对查询结果进行自动排序的地理空间操作符"$near"的返回结果是按照距离由近及远排序的。其他排序条件不会生效。这种按照地理位置远近查询怎么在solr排序中体现?
分类:
数据库 时间:
2014-09-29 15:45:11
阅读次数:
182