ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是第二流行的企业搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
NRT
elasticsearch是一个近似实时的搜索平台,从索引文档到可搜索有些延迟,通常为1秒。
集群
集群就是一个或多个节点存储数据,其中一个节点为主节点,这个主节点是可以通过选举产生的,并提供跨节点的联合索引和搜索的功能。集群有一个唯一性标示的名字,默认是elasticsearch,集群名字很重要,每个节点是基于集群名字加入到其集群中的。因此,确保在不同环境中使用不同的集群名字。一个集群可以只有一个节点。强烈建议在配置elasticsearch时,配置成集群模式。
节点
节点就是一台单一的服务器,是集群的一部分,存储数据并参与集群的索引和搜索功能。像集群一样,节点也是通过名字来标识,默认是在节点启动时随机分配的字符名。当然啦,你可以自己定义。该名字也蛮重要的,在集群中用于识别服务器对应的节点。
节点可以通过指定集群名字来加入到集群中。默认情况下,每个节点被设置成加入到elasticsearch集群。如果启动了多个节点,假设能自动发现对方,他们将会自动组建一个名为elasticsearch的集群。
索引
索引是有几分相似属性的一系列文档的集合。如nginx日志索引、syslog索引等等。索引是由名字标识,名字必须全部小写。这个名字用来进行索引、搜索、更新和删除文档的操作。
索引相对于关系型数据库的库。
类型
在一个索引中,可以定义一个或多个类型。类型是一个逻辑类别还是分区完全取决于你。通常情况下,一个类型被定于成具有一组共同字段的文档。如ttlsa运维生成时间所有的数据存入在一个单一的名为logstash-ttlsa的索引中,同时,定义了用户数据类型,帖子数据类型和评论类型。
类型相对于关系型数据库的表。
文档
文档是信息的基本单元,可以被索引的。文档是以JSON格式表现的。
在类型中,可以根据需求存储多个文档。
虽然一个文档在物理上位于一个索引,实际上一个文档必须在一个索引内被索引和分配一个类型。
文档相对于关系型数据库的列。
分片和副本
在实际情况下,索引存储的数据可能超过单个节点的硬件限制。如一个十亿文档需1TB空间可能不适合存储在单个节点的磁盘上,或者从单个节点搜索请求太慢了。为了解决这个问题,elasticsearch提供将索引分成多个分片的功能。当在创建索引时,可以定义想要分片的数量。每一个分片就是一个全功能的独立的索引,可以位于集群中任何节点上。
分片的两个最主要原因:
a、水平分割扩展,增大存储量
b、分布式并行跨分片操作,提高性能和吞吐量
分布式分片的机制和搜索请求的文档如何汇总完全是有elasticsearch控制的,这些对用户而言是透明的。
网络问题等等其它问题可以在任何时候不期而至,为了健壮性,强烈建议要有一个故障切换机制,无论何种故障以防止分片或者节点不可用。
为此,elasticsearch让我们将索引分片复制一份或多份,称之为分片副本或副本。
副本也有两个最主要原因:
高可用性,以应对分片或者节点故障。出于这个原因,分片副本要在不同的节点上。
提供性能,增大吞吐量,搜索可以并行在所有副本上执行。
总之,每一个索引可以被分成多个分片。索引也可以有0个或多个副本。复制后,每个索引都有主分片(母分片)和复制分片(复制于母分片)。分片和副本数量可以在每个索引被创建时定义。索引创建后,可以在任何时候动态的更改副本数量,但是,不能改变分片数。
默认情况下,elasticsearch为每个索引分片5个主分片和1个副本,这就意味着集群至少需要2个节点。索引将会有5个主分片和5个副本(1个完整副本),每个索引总共有10个分片。
每个elasticsearch分片是一个Lucene索引。一个单个Lucene索引有最大的文档数LUCENE-5843, 文档数限制为2147483519(MAX_VALUE – 128)。 可通过_cat/shards来监控分片大小。
LogStash由JRuby语言编写,基于消息(message-based)的简单架构,并运行在Java虚拟机(JVM)上。不同于分离的代理端(agent)或主机端(server),LogStash可配置单一的代理端(agent)与其它开源软件结合,以实现不同的功能。
Shipper:发送事件(events)至LogStash;通常,远程代理端(agent)只需要运行这个组件即可;
Broker and Indexer:接收并索引化事件;
Search and Storage:允许对事件进行搜索和存储;
Web Interface:基于Web的展示界面
正是由于以上组件在LogStash架构中可独立部署,才提供了更好的集群扩展性。
代理主机(agent host):作为事件的传递者(shipper),将各种日志数据发送至中心主机;只需运行Logstash 代理(agent)程序;
中心主机(central host):可运行包括中间转发器(Broker)、索引器(Indexer)、搜索和存储器(Search and Storage)、Web界面端(Web Interface)在内的各个组件,以实现对日志数据的接收、处理和存储。
Logstash是一个完全开源的工具,他可以对你的日志进行收集、分析,并将其存储供以后使用(如,搜索),您可以使用它。说到搜索,logstash带有一个web界面,搜索和展示所有日志。
开发人员不能登录线上服务器查看详细日志
各个系统都有日志,日至数据分散难以查找
日志数据量大,查询速度慢,或者数据不够实时
* soft nofile 65536 * hard nofile 65536 * soft nproc 2048 * hard nproc 4096 * soft memlock unlimited * hard memlock unlimited
* soft nproc 2048
注:这步不配elasticsearch会出现错误信息:[1]: max number of threads [1024] for user [elk] is too low, increase to at least [2048]
vm.max_map_count=655360
sysctl -p
useradd elk;passwd elk
mkdir -p /usr/local/elk-plf chown -R elk.elk /usr/local/elk-plf
自行官网下载elk的安装包
tar -zxvf elasticsearch-5.4.3.tar.gz -C /usr/local/elk-plf/
echo -e "cluster.name: test-cluster\nnode.name: test-node1\npath.data: /usr/local/elk-plf/elasticsearch-5.4.3/data\npath.logs: /usr/local/elk-plf/elasticsearch-5.4.3/logs\nbootstrap.memory_lock: true\nbootstrap.system_call_filter: false\nnetwork.host: 192.168.12.156\nhttp.port: 9200\nhttp.cors.enabled: true\nhttp.cors.allow-origin: "*"" >> /usr/local/elk-plf/elasticsearch-5.4.3/config/elasticsearch.yml
[root@test-node1 local]# grep "^[a-Z]" /usr/local/elk-plf/elasticsearch-5.4.3/config/elasticsearch.yml cluster.name: test-cluster node.name: test-node1 path.data: /usr/local/elk-plf/elasticsearch-5.4.3/data path.logs: /usr/local/elk-plf/elasticsearch-5.4.3/logs bootstrap.memory_lock: true bootstrap.system_call_filter: false network.host: 192.168.12.156 http.port: 9200 http.cors.enabled: true http.cors.allow-origin: "*"
vim /usr/local/elk-plf/elasticsearch-5.4.3/config/jvm.options
-Xms512m -Xmx512m
[root@qd-cs_rs-console01-bj elk-plf]# vim elasticsearch-5.4.3/bin/elasticsearch JAVA_HOME=/usr/local/jdk1.8.0_60 JRE_HOME=/usr/local/jdk1.8.0_60/jre
在文件上方添加JAVA_HOME和JRE_HOME保存退出
[root@qd-cs_rs-console01-bj elk-plf]# su elk [elk@qd-cs_rs-console01-bj elk-plf]$ elasticsearch-5.4.3/bin/elasticsearch -d
wget tar -zxvf node-v4.4.7-linux-x64.tar.gz -C /usr/local/elk5/
[root@qd-cs_rs-console01-bj src]# vim /etc/profile.d/npm.sh #!/bin/bash export NODE_HOME=/usr/local/elk-plf/node-v4.4.7-linux-x64 export PATH=$NODE_HOME/bin:$PATH [root@qd-cs_rs-console01-bj src]# source /etc/profile.d/npm.sh [root@qd-cs_rs-console01-bj src]# node -v [root@qd-cs_rs-console01-bj src]# npm -v
[root@qd-cs_rs-console01-bj elk5]# wget https://github.com/mobz/elasticsearch-head/archive/master.zip [root@qd-cs_rs-console01-bj elk5]# unzip master.zip [root@qd-cs_rs-console01-bj elk5]# cd elasticsearch-head-master/ [root@qd-cs_rs-console01-bj elasticsearch-head-master]# npm install -g grunt-cli [root@qd-cs_rs-console01-bj elasticsearch-head-master]# npm install
[root@qd-cs_rs-console01-bj elasticsearch-head-master]# vim Gruntfile.js connect: { server: { options: { hostname: ‘192.168.12.156‘, port: 9100, base: ‘.‘, keepalive: true } } }
添加hostname属性
this.base_uri = this.config.base_uri || this.prefs.get("app-base_uri") || "http://192.168.12.156:9200";
[root@qd-cs_rs-console01-bj elasticsearch-head-master]# grunt server
Q:Caused by: java.lang.RuntimeException: can not run elasticsearch as root
A:elasticsearch不允许使用root启动,因此我们要解决这个问题需要新建一个用户来启动elasticsearch
Q: java.security.AccessControlException:accessdenied("javax.management.MBeanTrustPermission""register")
A: 权限问题,给elasticsearch的安装目录相应的用户权限
Q:max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
A:文件描述符限制,如果配置了上面的limit.conf就不会出现这个错误
Q:max number of threads [1024] for user [elsearch] is too low, increase to at least [2048]
A:配置/etc/security/limit.d/90-nproc.conf,添加* soft nproc 2048
Q:max virtual memory areas vm.max_map_count [65530] is too low, increase to at least
A:配置/etc/sysctl.conf,添加vm.max_map_count = 655360
Q:system call filters failed to install; check the logs and fix your configuration or disable system call filters at your own risk
A:这是在因为操作系统不支持SecComp,而ES5.4.1默认bootstrap.system_call_filter为true进行检测,所以导致检测失败,失败后直接导致ES不能启动。在elasticsearch.yml中配置bootstrap.system_call_filter为false,注意要在bootstrap.memory_lock: false下面配置
还有一些其他的错误,由于安装时没有记录。以后有了再补上吧
Logstash是一个接收,处理,转发日志的工具。支持系统日志,webserver日志,错误日志,应用日志,总之包括所有可以抛出来的日志类型。怎么样听起来挺厉害的吧?
在一个典型的使用场景下(ELK):用Elasticsearch作为后台数据的存储,kibana用来前端的报表展示。Logstash在其过程中担任搬运工的角色,它为数据存储,报表查询和日志解析创建了一个功能强大的管道链。Logstash提供了多种多样的 input,filters,codecs和output组件,让使用者轻松实现强大的功能。好了让我们开始吧
4.2.2 安装
[root@qd-cs_rs-console01-bj src]# tar -zxvf logstash-all-plugins-2.4.0.tar.gz -C /usr/local/elk-plf/
4.2.3 启动
[root@qd-cs_rs-console01-bj src]# /usr/local/logstash-2.4.0/bin/logstash -e ‘input { stdin{} } output { stdout{} }‘ Settings: Default pipeline workers: 4 Pipeline main started hello ===> 输入 2017-11-10T17:17:03.314Z test-node1 hello ===> 输出
4.2.4 logstash输出到elasticsearch
[root@test-node1 local]# /usr/local/logstash-2.4.0/bin/logstash -e ‘input { stdin{} } output { elasticsearch { hosts => ["192.168.12.156:9200"] } }‘ Settings: Default pipeline workers: 4 Pipeline main started
上图中在logstash输入的信息已经到了elasticsearch中,并可以查询到。
4.3 安装kibana显示elasticsearch中的数据
4.3.1 简介
Kibana是一个开源的分析与可视化平台,设计出来用于和Elasticsearch一起使用的。你可以用kibana搜索、查看、交互存放在Elasticsearch索引里的数据,使用各种不同的图表、表格、地图等kibana能够很轻易地展示高级数据分析与可视化。
Kibana让我们理解大量数据变得很容易。它简单、基于浏览器的接口使你能快速创建和分享实时展现Elasticsearch查询变化的动态仪表盘。安装Kibana非常快,你可以在几分钟之内安装和开始探索你的Elasticsearch索引数据—-—-不需要写任何代码,没有其他基础软件依赖。
4.3.2 安装kibana
[root@qd-cs_rs-console01-bj src]# tar -zxvf kibana-5.4.3-linux-x86_64.tar.gz -C /usr/local/elk-plf/ [root@qd-cs_rs-console01-bj src]# cd /usr/local/elk-plf/kibana-5.4.3-linux-x86_64/
4.3.3 配置kibana
[root@qd-cs_rs-console01-bj kibana-5.4.3-linux-x86_64]# cat config/kibana.yml |grep "^[a-Z]" server.port: 5601 server.host: "192.168.12.156" elasticsearch.url: "http://192.168.12.156:9200" kibana.index: ".kibana" kibana.defaultAppId: "discover" elasticsearch.pingTimeout: 1500 elasticsearch.requestTimeout: 30000 elasticsearch.startupTimeout: 5000
4.3.4 启动kibana
[root@test-node1 kibana-5.4.3-linux-x86_64]# ./bin/kibana log [17:37:45.712] [info][status][plugin:kibana@5.4.3] Status changed from uninitialized to green - Ready log [17:37:45.881] [info][status][plugin:elasticsearch@5.4.3] Status changed from uninitialized to yellow - Waiting for Elasticsearch log [17:37:45.950] [info][status][plugin:console@5.4.3] Status changed from uninitialized to green - Ready log [17:37:45.986] [info][status][plugin:metrics@5.4.3] Status changed from uninitialized to green - Ready log [17:37:46.033] [info][status][plugin:elasticsearch@5.4.3] Status changed from yellow to green - Kibana index ready log [17:37:46.327] [info][status][plugin:timelion@5.4.3] Status changed from uninitialized to green - Ready log [17:37:46.339] [info][listening] Server running at http://192.168.12.156:5601 log [17:37:46.348] [info][status][ui settings] Status changed from uninitialized to green - Ready
4.3.5 配置kibana索引
经过上面的步骤,elk就全部装好了。下面用elk来监控catalina日志
5.1 logstash配置文件
[root@qd-cs_rs-console01-bj src]# cd /usr/local/logstash-2.4.0/ [root@qd-cs_rs-console01-bj logstash-2.4.0]# vim conf/tomcat.conf input { file { path => ["/opt/tomcat-msm/logs/catalina.out"] start_position => "beginning" } } filter { date { match => [ "timestamp" , "YYYY-MM-dd HH:mm:ss" ] } } output { elasticsearch { hosts => ["192.168.12.156:9200"] } }
5.1.2 以配置文件的方式启动logstash
[root@qd-cs_rs-console01-bj logstash-2.4.0]# bin/logstash -f conf/tomcat.conf Settings: Default pipeline workers: 4 Pipeline main started
5.2、登录kibana查看日志
本文出自 “初心、始终” 博客,转载请与作者联系!
原文地址:http://gouyc.blog.51cto.com/1594451/1981310