标签:副本 系统 支持 客户 智能 分布 shard image and
1、ES概念 ElasticSearch是一个分布式,高性能、高可用、可伸缩的搜索和分析系统,支持海量数据搜索与分析,可以用于电商网站、门户网站、企业IT系统等各种场景下的搜索引擎,也可以用于对海量的数据进行近实时(秒级)的数据分析。
1.1集群:
多台Es服务器的结合的统称叫ES集群,一个集群包含多台服务器,多个节点。集群中有很多结点,结点与结点之间可以进行配置。比如:Node1主结点,非数据结点。(协调创建索引、查询请求)Node2非主结点,数据结点。Node3非主结点,非数据(负载 均衡,组装返回的数据给客户端。)
1.2节点
一个节点是集群中的一个服务器,作为集群的一部分,它存储你的数据,参与集群的索引和搜索功能。
节点分类:主节点、数据节点、路由节点、预处理节点。
1.3索引(index):
在ES中, 索引是一组文档的集合。
1.4 文档(doc):
它是以JSON格式定义的特定方式的字段集合。每个文档都属于一个类型,并驻留在一个索引中。每个文档都有一个唯一的标识符,称为UID。
1.5分片(shard):
因为ES是个分布式的搜索引擎, 所以索引通常都会分解成不同部分, 而这些分布在不同节点的数据就是分片. ES自动管理和组织分片, 并在必要的时候对分片数据进行再平衡分配。
1.6副本(replica):
ES默认为一个索引创建5个主分片, 并分别为其创建一个副本分片。
1.7段(segement):
Lucene索引是由多个段组成,段本身是一个功能齐全的倒排索引,使用一个commit文件,记录索引内所有的segment。
段是不可变的,允许Lucene将新的文档增量地添加到索引中,而不用从头重建索引。
对于每一个搜索请求而言,索引中的所有段都会被搜索,并且每个段会消耗CPU的时钟周、文件句柄和内存。这意味着段的数量越多,搜索性能会越低。
为了解决这个问题,Elasticsearch会合并小段到一个较大的段,提交新的合并段到磁盘,并删除那些旧的小段
1.8 倒排索引
1.9分词器(Analysis 和 Analyzer)
分词器(standard)
分词器(keyword)
分词器(stop)
中文分词(需要安装,下载后解压到plugin目录)
2、ES CRUD过程
3、常用接口
标签:副本 系统 支持 客户 智能 分布 shard image and
原文地址:https://blog.51cto.com/14361188/2507054