这篇文章主要来介绍下什么是Analysis,什么是分词器,以及ElasticSearch自带的分词器是怎么工作的,最后会介绍下中文分词是怎么做的。首先来说下什么是Analysis:什么是Analysis?顾名思义,文本分析就是把全文本转换成一系列单词(term/token)的过程,也叫分词。在ES中,Analysis是通过分词器(Analyzer)来实现的,可使用ES内置的分析器或者按需定制化分析
分类:
其他好文 时间:
2020-08-28 11:58:35
阅读次数:
45
这篇文章主要介绍ElasticSearch的基本概念,学习文档、索引、集群、节点、分片等概念,同时会将ElasticSearch和关系型数据库做简单的类比,还会简单介绍RESTAPI的使用用法。ElasticSearch术语索引和文档是偏向于逻辑上的概念,节点和分片更偏向于物理上的概念。首先来说下什么是文档:文档(Document)ElasticSearch(简称ES)是面向文档的,文档是所有可搜
分类:
其他好文 时间:
2020-08-28 11:58:02
阅读次数:
47
1.term过滤(精准匹配) 作用:主要用于精准匹配哪些值,比如:数字,日期,布尔值,not_analyzed的字符串(未经分析的文本数据类型),例如: {“term”:{“age”:26
分类:
其他好文 时间:
2020-08-20 19:06:17
阅读次数:
71
武培轩推荐搜索SpringBootElasticsearchJavaMySQLRedisNginx最近有读者问我能不能写下如何使用SpringBoot开发Elasticsearch(以下简称ES)相关应用,今天就讲解下如何使用SpringBoot结合ES。可以在ES官方文档中发现,ES为JavaRESTClient提供了两种方式的Client:JavaLowLevelClient和JavaHigh
分类:
编程语言 时间:
2020-08-19 19:30:40
阅读次数:
73
1. 获取 ES-IKAnalyzer插件 一定和ES的版本一致( 7.8.1) 地址: https://github.com/medcl/elasticsearch-analysis-ik/releases 1 //解压zip文件到指定文件夹unzip elasticsearch-analysis ...
分类:
其他好文 时间:
2020-08-18 15:41:29
阅读次数:
88
Linux概述 消息对列(Kafka、RabbitMQ、RockeetMQ),缓存(Redis),搜索引擎(ES) 集群分布式(需要购买多台服务器,如果没服务器我们就只能使用虚拟机) 我们为什么要学Linux Linux的几个优点 免费(这个是大多数人的喜欢的吧) 很多软件原生是在Linux运行的, ...
分类:
系统相关 时间:
2020-08-15 22:35:58
阅读次数:
177
今天在统计pv和ip时遇到之前没有遇到的查询操作,在这里先记录下... 1、使用nested嵌套后,聚合查询当前嵌套的字段与嵌套外的字段,建议在嵌套内添加嵌套外需要聚合的字段: 2、跳出嵌套: 1 "aggs": { 2 "rev": { 3 "reverse_nested": {}, //跳出嵌套 ...
分类:
其他好文 时间:
2020-08-13 12:13:05
阅读次数:
43
搜索同一 query,结果ES返回的顺序却不尽相同,可能会有两个原因导致此问题发生: 这就是请求轮询到不同分片,而未设置排序条件,相同相关性评分情况下,是按照所在 segment 中 ?lucene id 来排序的,相同数据的不同备份之间该 id 是不能保证一致的,故造成结果震荡问题。 主节点 和 ...
分类:
其他好文 时间:
2020-08-10 19:51:35
阅读次数:
114
查看es集群健康状态curl-XGET"http://$ip:9200/_cat/health?"查看索引变红的原因curl-XGET"http://$ip:9200/_cluster/allocation/explain"如下确认索引是否可删除,或者调整副本为0
分类:
其他好文 时间:
2020-08-08 09:25:59
阅读次数:
119
首先从ES的支持的字段说起,ES文档中字段有多种类型 官方文档。 这几个比较常用: text,keyword,integer,float,boolean,object,geo_point(地理坐标),geo_shape(描述地理区域),date. 注:不要以为date只能表示 2015-01-01 ...
分类:
其他好文 时间:
2020-08-07 18:08:11
阅读次数:
84