垂直搜索引擎研发经验总结什么是垂直搜索引擎? 垂直搜索引擎是针对某一行业的搜索引擎,是搜索引擎的细化和延伸,是对网页库中的某类信息进行一次整合,定向分字段抽取出所须要的数据,再进行二次处理和索引,最后依据用户提交的请求,返回搜索结果。 与普通的网页搜索引擎相比,它们最大的差别是对网页信息进行了结.....
分类:
其他好文 时间:
2014-07-16 23:20:16
阅读次数:
253
在ES裡, 更新documents到index不是一件簡單的事情, 我們得在這裡留個心眼.眾所皆知RESTful風格使用HTTP的動詞來進行所謂的Update, ES也是如此.要注意到ES的更新有兩種方式整個docment更新(取代,覆蓋)根據某個field更新(count += 3, append...
分类:
其他好文 时间:
2014-07-16 23:20:03
阅读次数:
246
译者声明: 1、代码库发布在http://pablovallejo.github.io/gillie/ 2、查看API介绍直接戳这里看整理。Gillie是一个轻型MVC框架,受Backbone的启发实现。它提供了一些方法,可以实现RESTful HTTP请求,同时允许使用models,views.....
分类:
移动开发 时间:
2014-07-10 14:14:48
阅读次数:
379
solr-1.4.1 环境配置:Solr是一个apache名下非常好用的开源索引、搜索工具,网上的资料虽多但非常杂,笔者花了一天的时间对Solr进行了较为初步的研究,对Solr的基础应用做了一定的总结。文中涉及到的配置方法并不唯一,API的使用方法也未必规范,仅希望可以通过此文让大家对solr更快的...
分类:
其他好文 时间:
2014-07-07 23:10:32
阅读次数:
266
开源搜索引擎的比较(五)5.3整体评估基于以上结果,本文在不同的文档集合上进行了实验, 搜索引擎建索引的时间开销较小的是ht://Dig, Indri, IXE, Lucene, MG4J, Swish-E, Swish++, Terrier, XMLSearch, 和 Zettair。而建索引后的...
分类:
其他好文 时间:
2014-06-30 12:16:19
阅读次数:
415
使用Lucene来搜索内容,搜索结果的显示顺序当然是比较重要的.Lucene中Build-in的几个排序定义在大多数情况下是不适合我们使用的.要适合自己的应用程序的场景,就只能自定义排序功能,本节我们就来看看在Lucene中如何实现自定义排序功能. Lucene中的自定义排序功能和Java集合中的....
分类:
其他好文 时间:
2014-06-30 11:20:53
阅读次数:
174
收集的一些开源服务器软件,可用于拓展服务器功能设计与开发...
分类:
其他好文 时间:
2014-06-29 22:09:35
阅读次数:
3105
对这个课程有兴趣的朋友,能够加我的QQ2059055336和我联系,能够和您分享。课程介绍:最有前途的软件开发技术——搜索引擎技术搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个...
分类:
其他好文 时间:
2014-06-29 19:23:22
阅读次数:
211
Lucene.net入门学习系列(1)-分词 Lucene.net入门学习系列(2)-创建索引 Lucene.net入门学习系列(3)-全文检索 这几天在公司实习的时候闲的蛋疼,翻了一下以往的教程和博客,看到了Lucene.net。原本想学着写一个系列的博文,由于本人水平有限,一直找不到适合的...
分类:
Web程序 时间:
2014-06-29 18:31:57
阅读次数:
190
当我们使用rails generate scaffold的方式生成MVC的时候,rails会自动给我们生成一系列的文件,包括了如何用json显示model的view。这样其实默认了你的系统是一个CRUD的系统,但是我们知道RESTful不是CRUD。把model直接暴露出去不是一个很好的选择。
rabl是一个DSL可以方便定制生成对象的显示信息的gem:https://github.co...
分类:
其他好文 时间:
2014-06-28 08:06:56
阅读次数:
248