垂直搜索引擎研发经验总结什么是垂直搜索引擎? 垂直搜索引擎是针对某一行业的搜索引擎,是搜索引擎的细化和延伸,是对网页库中的某类信息进行一次整合,定向分字段抽取出所须要的数据,再进行二次处理和索引,最后依据用户提交的请求,返回搜索结果。 与普通的网页搜索引擎相比,它们最大的差别是对网页信息进行了结.....
分类:
其他好文 时间:
2014-07-16 23:20:16
阅读次数:
253
solr-1.4.1 环境配置:Solr是一个apache名下非常好用的开源索引、搜索工具,网上的资料虽多但非常杂,笔者花了一天的时间对Solr进行了较为初步的研究,对Solr的基础应用做了一定的总结。文中涉及到的配置方法并不唯一,API的使用方法也未必规范,仅希望可以通过此文让大家对solr更快的...
分类:
其他好文 时间:
2014-07-07 23:10:32
阅读次数:
266
第1讲Java学习路线&怎么学习Java1概述学过一段时间的同学一定会觉得Java学习最头疼的不是语法结构的繁杂,而是Java本身体系结构的庞大。以至于自己不知道接下去该学什么,或者什么样的知识才会对后续的学习有帮助。本节内容将让大家对Java学习的路线有个宏观的把握。在与市场接轨的前提下,我们会推...
分类:
编程语言 时间:
2014-07-01 21:06:36
阅读次数:
404
开源搜索引擎的比较(五)5.3整体评估基于以上结果,本文在不同的文档集合上进行了实验, 搜索引擎建索引的时间开销较小的是ht://Dig, Indri, IXE, Lucene, MG4J, Swish-E, Swish++, Terrier, XMLSearch, 和 Zettair。而建索引后的...
分类:
其他好文 时间:
2014-06-30 12:16:19
阅读次数:
415
使用Lucene来搜索内容,搜索结果的显示顺序当然是比较重要的.Lucene中Build-in的几个排序定义在大多数情况下是不适合我们使用的.要适合自己的应用程序的场景,就只能自定义排序功能,本节我们就来看看在Lucene中如何实现自定义排序功能. Lucene中的自定义排序功能和Java集合中的....
分类:
其他好文 时间:
2014-06-30 11:20:53
阅读次数:
174
这是一个先进实用的架构,采用了haproxy、lvs、keeplived进行负载均衡,使用couchbase、squid进行缓存,使用mysql数据库主从方式,使用lucene搜索等技术,提供了HA、HP的服务性能,值得采纳。对用JAVA开发的项目来说,根据“成熟稳定、先进科学、实用可靠“的原则,可以使用这样一种架构,采用多个集群来保证系统的高性能、高可靠性、伸缩性、可维护性和安全的需要,服务器可以线性扩展,使用开源免费软件和廉价服务器,提供极高的性价比。...
分类:
其他好文 时间:
2014-06-29 23:11:10
阅读次数:
729
收集的一些开源服务器软件,可用于拓展服务器功能设计与开发...
分类:
其他好文 时间:
2014-06-29 22:09:35
阅读次数:
3105
对这个课程有兴趣的朋友,能够加我的QQ2059055336和我联系,能够和您分享。课程介绍:最有前途的软件开发技术——搜索引擎技术搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个...
分类:
其他好文 时间:
2014-06-29 19:23:22
阅读次数:
211
Lucene.net入门学习系列(1)-分词 Lucene.net入门学习系列(2)-创建索引 Lucene.net入门学习系列(3)-全文检索 这几天在公司实习的时候闲的蛋疼,翻了一下以往的教程和博客,看到了Lucene.net。原本想学着写一个系列的博文,由于本人水平有限,一直找不到适合的...
分类:
Web程序 时间:
2014-06-29 18:31:57
阅读次数:
190
书籍学习——董西成《Hadoop技术内幕 深入解析HADOOP COMMON和HDFS架构设计与实现原理》HDFS 高容错,高伸缩性Lucene是引擎开发包,提供了一个纯java的高性能全文检索,可方便的嵌入到各种应用中实现全文搜索/索引功能。Nutch是以Lucene为基础实现的搜索引擎应用,Lu...
分类:
其他好文 时间:
2014-06-27 12:15:57
阅读次数:
221