前提 什么是倒排索引? Elasticsearch之分词器的作用 Elasticsearch之分词器的工作流程 Elasticsearch的停用词 1、有些词在文本中出现的频率非常高,但是对文本所携带的信息基本不产生影响。 2、英文 a、an、the、of 3、中文 的、了、着、是 、标点符号等 4 ...
分类:
其他好文 时间:
2017-02-24 21:01:36
阅读次数:
230
Analyzer(分词器)的作用是把一段文本中的词按一定规则进行切分。对应的是Analyzer类,这是一个抽象类,切分词的具体规则是由子类实现的,所以对于不同的语言,要用不同的分词器。(也就是说不同的分词器分词的规则是不同的!) 在创建索引时会用到分词器,在搜索时也会用到分词器,这两个地方要使用同一 ...
分类:
其他好文 时间:
2017-02-24 20:58:26
阅读次数:
324
Luke 5 发布,可视化 Lucene 索引查看工具 oschina 发布于2015年08月31日 这是一个主要版本,该版本支持 Lucene 5.2.0。它支持 elasticsearch 1.6.0(Lucene的4.10.4)已解决的问题:#20增加支持重建索引并不会存储领域,不暴露位置的字 ...
分类:
Web程序 时间:
2017-02-23 15:51:11
阅读次数:
244
前提,是 Eclipse下Maven新建项目、自动打依赖jar包(包含普通项目和Web项目) setting.xml配置文件 如何在Maven官网下载历史版本 HBase 开发环境搭建(Eclipse\MyEclipse + Maven) MapReduce 开发环境搭建(Eclipse\MyEcl ...
Lucene学习总结之一:全文检索的基本原理http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623594.html Lucene5.5入门第一篇——hello Worldhttp://elasticsearch.cn/article/ ...
分类:
Web程序 时间:
2017-02-23 11:13:30
阅读次数:
151
elasticsearch的查询有两部分组成:query and filter。 两者的主要区别在于:filter是不计算相关性的,同时可以cache。因此,filter速度要快于query。 先记录一下es提供的各种query。 以下内容只为当做读书笔记,更多详细细节请参见http://www.e ...
分类:
其他好文 时间:
2017-02-22 19:37:17
阅读次数:
352
简介: Elasticsearch 2.4.1 安装 bigdesk bigdesk 是一个 ES 集群监控工具,可以检测到集群状态、各节点信息,包括 JVM、Thread Pools、OS、Process、Indices 等信息 对性能优化有一定帮助 1、本来这样安装 或者 但是,bigdesk ...
分类:
其他好文 时间:
2017-02-22 19:36:24
阅读次数:
223
前提, Elasticsearch之插件介绍及安装 https://i.cnblogs.com/posts?categoryid=950999&page=2 (强烈建议,从头开始看) 比如,我的这里是http://192.168.80.200:9200/_plugin/head/ 1、概览 2、索引 ...
分类:
其他好文 时间:
2017-02-21 15:23:09
阅读次数:
302
ES站点插件(以网页形式展现) 1、BigDesk Plugin (作者 Luká? Vl?ek) 简介:监控es状态的插件,推荐!【目前不支持2.x】 2、Elasticsearch Head Plugin (作者 Ben Birch) (主要) 简介:很方便对es进行各种操作的客户端。 3、ko ...
分类:
其他好文 时间:
2017-02-21 13:42:20
阅读次数:
188
扩展下, Elasticsearch之curl删除索引库 [hadoop@djt002 elasticsearch-2.4.3]$ curl -XDELETE 'http://192.168.80.200:9200/zhouls/emp/1'{"found":true,"_index":"zhoul ...
分类:
Web程序 时间:
2017-02-20 22:33:47
阅读次数:
499