ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。官方站点:http://www.elasticsearch.com/中文站点:http://es-...
分类:
其他好文 时间:
2014-12-26 16:05:14
阅读次数:
275
UBUNTU 14.04 LTS 安装 elasticseach同步MYSQL表并实现中文搜索===========================================================================================1、下载wget htt...
分类:
其他好文 时间:
2014-12-26 11:01:31
阅读次数:
230
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
忽略TF/IDF
有时我们不需要TF/IDF。我们想知道的只是一个特定的单词是否出现在了字段中。比如我们正在搜索度假酒店,希望它拥有的卖点越多越好:
WiFi花园(Garden)泳池(Pool)
而关于度假酒店的文档类似下面这样:
{ "descript...
分类:
其他好文 时间:
2014-12-26 01:02:19
阅读次数:
342
试用了一下 elasticsearch, 的确方便
在机器 (10.15.4.207) 上
下载 elasticsearch-1.4.2.tar.gz , 解包
直接运行 ./bin/elasticsearch, 就启动了一个 node
安装 head ( 参见 http://mobz.github.io/elasticsearch-head/ )
bin/plug...
分类:
其他好文 时间:
2014-12-25 18:21:03
阅读次数:
121
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
通过查询结构调整相关度
ES提供的查询DSL是相当灵活的。你可以通过将单独的查询子句在查询层次中上下移动来让它更重要/更不重要。比如,下面的查询:
quick OR brown OR red OR fox
我们可以使用一个bool查询,对所有词条一视同仁:...
分类:
其他好文 时间:
2014-12-25 01:30:42
阅读次数:
251
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
Lucene中的Practical Scoring Function
对于多词条查询(Multiterm Queries),Lucene使用的是布尔模型(Boolean
Model),TF/IDF以及向量空间模型(Vector
Space Model)来将它们结合...
分类:
Web程序 时间:
2014-12-24 11:53:03
阅读次数:
273
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
控制相关度(Controlling Relevance)
对于仅处理结构化数据(比如日期,数值和字符枚举值)的数据库,它们只需要检查一份文档(在关系数据库中是一行)是否匹配查询即可。
尽管布尔类型的YES|NO匹配也是全文搜索的一个必要组成,它们本身是不够的。我们还需要...
分类:
其他好文 时间:
2014-12-23 10:32:51
阅读次数:
216
本章翻译自Elasticsearch官方指南的Partial
Matching一章。
索引期间的优化(Index-time Optimizations)
目前我们讨论的所有方案都是在查询期间的。它们不需要任何特殊的映射或者索引模式(Indexing Patterns);它们只是简单地工作在已经存在于索引中的数据之上。
查询期间的灵活性是有代价的:搜索性能。有时...
分类:
其他好文 时间:
2014-12-22 11:18:48
阅读次数:
239
本章翻译自Elasticsearch官方指南的Partial Matching一章。
查询期间的即时搜索(Query-time Search-as-you-type)
现在让我们来看看前缀匹配能够如何帮助全文搜索。用户已经习惯于在完成输入之前就看到搜索结果了 - 这被称为即时搜索(Instant Search, 或者Search-as-you-type)。这不仅让用户能...
分类:
其他好文 时间:
2014-12-21 12:44:42
阅读次数:
203
通配符和正则表达式查询
wildcard查询和prefix查询类似,也是一个基于词条的低级别查询。但是它能够让你指定一个模式(Pattern),而不是一个前缀(Prefix)。它使用标准的shell通配符:?用来匹配任意字符,*用来匹配零个或者多个字符。
以下查询能够匹配包含W1F 7HW和W2F 8HW的文档:
GET /my_index/address/_search
{...
分类:
其他好文 时间:
2014-12-19 12:14:46
阅读次数:
201