本文地址:
在有搜索引擎之前,我们查文档常使用顺序匹配。比如要搜索 "我的祖国是花园",需要在文档中顺序扫描,找到完全匹配的子句。
在有了搜索引擎后,我们对查询语句做的处理就不一样了。我们通常会先分词,然后查找对应的词条索引,最后得到评分由高到低的文档列表。我一度以为没法实现完全匹配了,直到一个硬需求的出现。花了一天时间,把完全匹配用搜索引擎的思维整理出来。
简要描述实现思路...
分类:
其他好文 时间:
2015-08-25 19:43:17
阅读次数:
932
而 elasticsearch 可以很好的支持各种语言的全文检索,但我们暂时又不想切换到 elasticsearch 作为后端数据库。
当然,可以在 web 应用中存储数据的时候,再主动写一份到 elasticsearch,但这无疑污染了原有的业务逻辑。
在 IT 行业,只要有需求的地方,必然早已有了一堆好用或者不好用的开源轮子。
幸运地是,现在已经有了一些转换方案,可以将 mo...
分类:
数据库 时间:
2015-08-21 23:29:11
阅读次数:
315
如何快速检索?Elasticsearch是通过Lucene的倒排索引技术实现比关系型数据库更快的过滤。特别是它对多条件的过滤支持非常好,比如年龄在18和30之间,性别为女性这样的组合查询。倒排索引很多地方都有介绍,但是其比关系型数据库的b-tree索引快在哪里?到底为什么快呢?笼统的来说,b-tre...
分类:
数据库 时间:
2015-08-21 11:04:06
阅读次数:
210
1.安装简单的下载解压就安装完成了good[root@localhostsrc]#wgethttps://download.elastic.co/elasticsearch/elasticsearch/elasticsearch-1.7.1.zip[root@localhost
src]#unzipelasticsearch-1.7.1.zip[root@localhost
src]#mvelasticsearch-1.7.1/usr/local/elasticsearch[ro..
分类:
其他好文 时间:
2015-08-20 06:50:45
阅读次数:
161
Java代码 cluster.routing.allocation.allow_rebalance设置根据集群中机器的状态来重新分配分片,可以设置为always, indices_primaries_active和indices_all_active,默认是设置成indices_all_active...
分类:
其他好文 时间:
2015-08-17 21:06:35
阅读次数:
341
今天发现logstash没有任何数据写入elasticsearch,检查logs,发现报错high disk watermark [10%] exceeded on [asfasdf112xzvdx][flag=smasher] free:2.8gb[9.2%], shards will be relocated away from this nod...
分类:
其他好文 时间:
2015-08-17 17:34:36
阅读次数:
412
这篇博客我记录在了:http://segmentfault.com/a/1190000003100540
分类:
数据库 时间:
2015-08-16 21:20:40
阅读次数:
171
这篇博客我记录在了http://segmentfault.com/a/1190000003101351
分类:
其他好文 时间:
2015-08-16 21:08:59
阅读次数:
162
索引一个文档,使用自己的IDhadoop@tinylcy:~$ curl -XPUT localhost:9200/website/blog/123 -d '> {> "title" : "My first blog entry",> "text" : "Just trying th...
分类:
其他好文 时间:
2015-08-15 17:50:59
阅读次数:
142
这篇日志的目的很简单,就是记录一些基本的流程。要在OS X上使用Elasticsearch,其实很简单,在这里:https://www.elastic.co/downloads/elasticsearch 下载Zip压缩包,并在合适的目录下解压,然后终端下定位到解压后目录下,运行:
sudo bin/elasticsearch其实就可以启动Elasticsearch了,可以再安装一下Marvel...
分类:
系统相关 时间:
2015-08-15 14:55:27
阅读次数:
202