本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
通过查询结构调整相关度
ES提供的查询DSL是相当灵活的。你可以通过将单独的查询子句在查询层次中上下移动来让它更重要/更不重要。比如,下面的查询:
quick OR brown OR red OR fox
我们可以使用一个bool查询,对所有词条一视同仁:...
分类:
其他好文 时间:
2014-12-25 01:30:42
阅读次数:
251
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
Lucene中的Practical Scoring Function
对于多词条查询(Multiterm Queries),Lucene使用的是布尔模型(Boolean
Model),TF/IDF以及向量空间模型(Vector
Space Model)来将它们结合...
分类:
Web程序 时间:
2014-12-24 11:53:03
阅读次数:
273
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
控制相关度(Controlling Relevance)
对于仅处理结构化数据(比如日期,数值和字符枚举值)的数据库,它们只需要检查一份文档(在关系数据库中是一行)是否匹配查询即可。
尽管布尔类型的YES|NO匹配也是全文搜索的一个必要组成,它们本身是不够的。我们还需要...
分类:
其他好文 时间:
2014-12-23 10:32:51
阅读次数:
216
本文地址:http://www.cnblogs.com/archimedes/p/mapreduce-inverted-index.html,转载请注明源地址。1.倒排索引简介倒排索引(Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个...
分类:
其他好文 时间:
2014-12-22 22:31:22
阅读次数:
190
本章翻译自Elasticsearch官方指南的Partial
Matching一章。
索引期间的优化(Index-time Optimizations)
目前我们讨论的所有方案都是在查询期间的。它们不需要任何特殊的映射或者索引模式(Indexing Patterns);它们只是简单地工作在已经存在于索引中的数据之上。
查询期间的灵活性是有代价的:搜索性能。有时...
分类:
其他好文 时间:
2014-12-22 11:18:48
阅读次数:
239
hadoop 起源涉及到了:lucene,solr,nutch,hadoop@auther ayy@date 2014/12/211、lucene、nutch、solr Lucene是由Doug Cutting创建的一个基于java的全文搜索工具包,它是Apache下一个很有名的项目。主要功能有:....
分类:
其他好文 时间:
2014-12-21 22:06:05
阅读次数:
272
本章翻译自Elasticsearch官方指南的Partial Matching一章。
查询期间的即时搜索(Query-time Search-as-you-type)
现在让我们来看看前缀匹配能够如何帮助全文搜索。用户已经习惯于在完成输入之前就看到搜索结果了 - 这被称为即时搜索(Instant Search, 或者Search-as-you-type)。这不仅让用户能...
分类:
其他好文 时间:
2014-12-21 12:44:42
阅读次数:
203
通配符和正则表达式查询
wildcard查询和prefix查询类似,也是一个基于词条的低级别查询。但是它能够让你指定一个模式(Pattern),而不是一个前缀(Prefix)。它使用标准的shell通配符:?用来匹配任意字符,*用来匹配零个或者多个字符。
以下查询能够匹配包含W1F 7HW和W2F 8HW的文档:
GET /my_index/address/_search
{...
分类:
其他好文 时间:
2014-12-19 12:14:46
阅读次数:
201
部分匹配(Partial Matching)
敏锐的读者可能已经发现到目前为止,介绍的查询都是在整个词条层面进行操作的。匹配的最小单元必须是一个词条。你只能找到存在于倒排索引(Inverted Index)中的词条。
但是如果你想匹配词条的一部分,而不是整个词条呢?部分匹配(Partial Matching)允许用户指定词条的一部分然后找到含有该部分的任何单词。
匹配词条一部分这...
分类:
其他好文 时间:
2014-12-18 10:23:19
阅读次数:
314
http://docs.spring.io/spring-data/solr/首先介绍一下solr:Apache Solr (读音:SOLer)是一个开源、高性能、采用Java开发、基于Lucene的全文搜索服务器,文档通过Http利用XML加到一个搜索集合中,查询该集合也是通过 http收到一个X...
分类:
编程语言 时间:
2014-12-18 10:14:06
阅读次数:
619