What/Sphinx是什么 定义 Sphinx是一个全文检索引擎。 特性 索引和性能优异 易于集成SQL和XML数据源,并可使用SphinxAPI、SphinxQL或者SphinxSE搜索接口 易于通过分布式搜索进行扩展 高速的索引建立(在当代CPU上,峰值性能可达到10 ~ 15MB/秒) 高性 ...
分类:
其他好文 时间:
2016-04-18 15:04:28
阅读次数:
121
## 1. 搜索算法总体架构在上篇文章(工程篇)中, 我们介绍了有赞搜索引擎的基本框架. 搜索引擎主要3个部件构成. 第一, hadoop集群, 用于生成大规模搜索和实时索引; 第二, ElasticSearch集群, 提供分布式搜索方案; 第三, 高级搜索集群, 用于提供商业搜索的特殊功能. 商业... ...
分类:
编程语言 时间:
2016-04-18 01:12:30
阅读次数:
561
安装zookeeper
上面也说了 SolrCloud是基于Solr和Zookeeper的分布式搜索方案,所有要部署solrCloud+tomcat+zookeeper的集群,必须先安装zookeeper
安装环境:
Liux: CentOS release 6.4
JDK:1.7.0_55
因为我研究的是solr最新的版本,所以研究的是sol...
分类:
其他好文 时间:
2016-04-12 17:32:49
阅读次数:
268
通过Aggregation来分组查询: SearchResponse response = client.prepareSearch(INDEX_DOUBAN).setTypes(TYPE_DOUBAN) .addAggregation( AggregationBuilders.terms("by_ ...
分类:
编程语言 时间:
2016-04-05 19:41:12
阅读次数:
130
1、elasticsearch简介 中文帮助文档地址:http://es.xiaoleilu.com/ ? Elasticsearch是一个基于Lucene的实时的分布式搜索和分析引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。基于RESTful接口。 – 普通请求是... ...
分类:
其他好文 时间:
2016-03-29 23:59:56
阅读次数:
507
由于项目算法研究的需要,所以自己部署了ElasticSearch,这是一个基于lucene分布式的全文搜索引擎,具体介绍和简单wiki可以参考以下链接:http://www.learnes.net/getting_started/what_is_it.html 首先是安装:下载地址在 elastic ...
分类:
其他好文 时间:
2016-03-29 14:43:54
阅读次数:
212
最近简单了解了关于ELK的知识: ELK 由ElasticSearch 、 Logstash 和 Kiabana 三个开源工具组成 官方网站:https://www.elastic.co/products | Elasticsearch 是个开源分布式搜索引擎,它的特点有:分布式,零配置,自动发现,
分类:
其他好文 时间:
2016-03-22 06:20:54
阅读次数:
203
“11.11”是一年一度的电商盛宴,为了准备这个一年内最大规模的促销,1号店各条战线都在紧张有序地忙碌着。1号店搜索团队经过几年的大促历练,不断推动架构演进,积累了越来越多的经验。 11.11的主要特点是流量大和突发性高,这就带来了两个核心的需求: 可扩展 如何抗住这样的流量,针对这个需求,1号店搜
分类:
其他好文 时间:
2016-02-04 08:58:27
阅读次数:
168
lucene之排序、设置权重、优化、分布式搜索(转)1. 基本应用using System;using System.Collections.Generic;using System.Text;using Lucene.Net;using Lucene.Net.Analysis;using Luce...
分类:
编程语言 时间:
2015-12-26 19:36:02
阅读次数:
278