到分组统计估计大家都不会陌生,就是数据库的group by语句,但是当我们采用solr4.5全文检索时,数据库提供再好的sql语句都没有任何的意义了,那么在solr4.5中我们如何做到分组统计呢?其实很简单,下面我们来看看怎么做。 示例场景: 现在有个电子商务网站的产品搜索功能,不同的商家发布不同的 ...
分类:
其他好文 时间:
2018-07-14 00:20:30
阅读次数:
187
Solr集群: Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库; Solr是以Lucene为基础实现的文本检索应用服务; SolrCloud是Solr4.0版本开发的,基于Solr和Zookeeper的分布式搜索方案,主要思想是使用Zookeeper作为集群的配置信息中心。 So ...
分类:
其他好文 时间:
2018-04-13 20:36:29
阅读次数:
179
前提 solr已经升级7.1,但是我们公司的solr还是使用的4.4,你们说low不low!!!重要的是,人家花费了大气将solr升级,从技术的角度来说solr7比solr4那是翻天覆地的改变! solr7.1安装 solr7.1官方下载地址 在solr5以前solr的启动都有tomcat作为容器, ...
分类:
其他好文 时间:
2018-04-10 17:44:49
阅读次数:
214
1.准备工作:一个干净的Tomcat,solr-4.10.3. 2.新建一个文件夹我这里命名为solr,将Tomcat和solr-4.10.3放进去。新建一个solrhome的文件夹,里面放的是solr服务器的一些配置,和索引文件。 3.接下来看看solr-4.10.3文件夹里面放的是什么: bin ...
分类:
其他好文 时间:
2018-01-23 22:08:12
阅读次数:
194
爬虫系统:通过Nutch扩展点开发插件(添加自定义索引字段到solr) 准备工作 1. 爬虫环境 —— nutch2.3.1 + solr4.10.3 + hbase0.98 2. 开发环境 —— Eclipse Mars.2 Release(4.5.2) 3. 所需jar包 —— apache n ...
分类:
其他好文 时间:
2017-12-13 19:44:27
阅读次数:
170
Solr4.10.2集成Nutch1.9与自带UI界面使用 一、Solr4.10.2与Nutch1.9集成 环境:Solr4.10.2已经配置在Tomcat上 Solr的Tomcat配置详见Solr4.10.2的Tomcat配置 将NUTCH_DIR/conf/schem ...
分类:
其他好文 时间:
2017-11-28 11:50:29
阅读次数:
183
默认情况下,Elasticsearch 用 JSON 字符串来表示文档主体保存在 _source 字段中。像其他保存的字段一样,_source 字段也会在写入硬盘前压缩。The _source is stored as a binary blob (which is compressed by Lu ...
分类:
Web程序 时间:
2017-10-24 17:22:30
阅读次数:
297
简介 ElasticSearch是一个开源的分布式搜索引擎,具备高可靠性,支持非常多的企业级搜索用例。像Solr4一样,是基于Lucene构建的。支持时间时间索引和全文检索。官网:http://www.elasticsearch.org 它对外提供一系列基于java和http的api,用于索引、检索 ...
分类:
其他好文 时间:
2017-07-25 13:38:26
阅读次数:
174
Solr是一个高性能,採用Java5开发,基于Lucene的全文搜索server。同一时候对其进行了扩展,提供了比Lucene更为丰富的查询语言,同一时候实现了可配置、可扩展并对查询性能进行了优化,而且提供了一个完好的功能管理界面,是一款很优秀的全文搜索引擎。 能够将数据库中的数据导入到solr中, ...
分类:
数据库 时间:
2017-07-22 12:09:58
阅读次数:
194
1solr简介solr官方文档:http://wiki.apache.org/solr/DataImportHandler下载地址:http://www.apache.org/dyn/closer.cgi/lucene/solr/2solr入门我们使用的是:solr4.10.2,下载zip压缩包,解压到指定目录下解压:2.1solr安装1,将解压的solr-4.10.2/文件夹复制到D盘下;2,进..
分类:
其他好文 时间:
2017-07-05 13:21:50
阅读次数:
159