elasticsearch配置详解

时间：2016-05-05 22:40:09 阅读：1144 评论：0 收藏：0 [点我收藏+]

标签：

ES的默认的很多参数都是不需要改的，当遇到性能问题时首先应该考虑的是增加节点，和优化数据结构。
下面列举一些需要注意的配置项，首先是一般大家都知道的配置项：

cluster.name: elasticsearch_production 集群名称还是要改一下，不要使用默认的，万一在哪个内网，然后一台测试的笔记本开启了ES不是自动就加入了集群。

node.name: elasticsearch_005_data 节点名称，

path.data: /path/to/data1 数据存储路径

path.logs: /path/to/logs 日志路径

path.plugins: /path/to/plugins 插件路径
上面三个初始目录都在安装目录下，主要考虑重装不会因为覆盖丢失数据

discovery.zen.minimum_master_nodes 这个配置项主要是用于防止“脑裂”问题，具体设施可以看这篇文章：如何防止ElasticSearch集群出现脑裂现象

gateway.recover_after_nodes: n

这个设置主要防止不必要的数据处理，比如一个集群全部重启，然后有一个机器起的比较慢，然后机器就会组成集群，选出master，然后从备份中恢复出故障集群的数据。集群此时恢复正常。然后起的慢的机器又重启成功了，又会把数据同步到这台机器上并删除冗余数据。这项配置决定直到第n个节点可用才可以进行恢复操作

gateway.expected_nodes: 10

gateway.recover_after_time: 5m 这个配置一个是恢复的时间，上面配置的是5分钟

这三项要求首先等待n个节点恢复，然后等待5分钟或者10个节点已经加入了集群就开始数据恢复

discovery.zen.ping.multicast.enabled: false

discovery.zen.ping.unicast.hosts: [“host1”, “host2:port”]

ES通过UDP协议去发现节点，建议关闭multicast的自动发现节点机制，上面的配置主要一个是禁用multicast，一个是写出需要尝试连接的节点，如果有专门的master节点可以配置成master节点。

不要修改java的GC机制

线程池设置成内核数，比如八核机器就设置成8，很多阻塞的操作都是Lucene来操作的，比如硬盘读写。搜索的线程设置可以设置成内核数的三倍

Heap size设置

可以通过命令export ES_HEAP_SIZE=10g，或者启动时配置./bin/elasticsearch -Xmx10g -Xms10g，要让Xmx和Xms相等。也可以修改文件./bin/elasticsearch.in.sh,修改sh代码，修改相关配置

然后这个内存一般设置为内存的一半，因为还有内存要分配给Lucene使用。然后不管你有多大的内存，该项设置不要超过32GB，这个与JVM的一些特性有关

如果你是使用了服务的方式去启动ES，需要修改服务的配置文件./bin/service/elasticsearch.conf来实现相关配置。

内存交换

这个对于性能影响是致命的，可以使用命令sudo swapoff -a来暂时关闭，永久关闭需要编辑文件/etc/fstab

也可以在配置文件中添加配置bootstrap.mlockall: true，这样jvm可以锁定这些内存，避免被交换到物理存储介质。

文件描述符

这个说法我也不知道对不对，或者叫文件句柄？反正就是file descriptor,这个主要是因为Lucene要打开很多文件，Elasticsearch要开启很多socket，在linux系统下这些都是通过文件来处理的，linux会限制每个进程开启的文件数，可以通过sysctl -w vm.max_map_count=262144来临时修改，或者修改配置文件/etc/sysctl.conf的vm.max_map_count设置，最后都要执行sysctl -p使设置生效。

然后我是通过elasticsearchservicewrapper来启动ES的这里还需要修改配置文件./bin/service/elasticsearch，将配置项ULIMIT_N前面的注释去掉，并配置相应的值，建议值是32000，然而我配置了64000。

查看是否设置成功http://localhost:9200/_nodes/process?pretty，里面的max_file_descriptors就是对应的值。

配置文件位于%ES_HOME%/config/elasticsearch.yml文件中，用Editplus打开它，你便可以进行配置。
        所有的配置都可以使用环境变量，例如：
node.rack: ${RACK_ENV_VAR}
        表示环境变量中有一个RACK_ENV_VAR变量。
        下面列举一下elasticsearch的可配置项：
        1. 集群名称，默认为elasticsearch：
cluster.name: elasticsearch
        2. 节点名称，es启动时会自动创建节点名称，但你也可进行配置：
node.name: "Franz Kafka"
        3. 是否作为主节点，每个节点都可以被配置成为主节点，默认值为true：
node.master: true
        4. 是否存储数据，即存储索引片段，默认值为true：
node.data: true
        master和data同时配置会产生一些奇异的效果：
        1) 当master为false，而data为true时，会对该节点产生严重负荷；
        2) 当master为true，而data为false时，该节点作为一个协调者；
        3) 当master为false，data也为false时，该节点就变成了一个负载均衡器。
        你可以通过连接http://localhost:9200/_cluster/health或者http://localhost:9200/_cluster/nodes，或者使用插件http://github.com/lukas-vlcek/bigdesk或http://mobz.github.com/elasticsearch-head来查看集群状态。
        5. 每个节点都可以定义一些与之关联的通用属性，用于后期集群进行碎片分配时的过滤：
node.rack: rack314
        6. 默认情况下，多个节点可以在同一个安装路径启动，如果你想让你的es只启动一个节点，可以进行如下设置：
node.max_local_storage_nodes: 1
        7. 设置一个索引的碎片数量，默认值为5：
index.number_of_shards: 5
        8. 设置一个索引可被复制的数量，默认值为1：
index.number_of_replicas: 1
        当你想要禁用公布式时，你可以进行如下设置：
index.number_of_shards: 1
index.number_of_replicas: 0
        这两个属性的设置直接影响集群中索引和搜索操作的执行。假设你有足够的机器来持有碎片和复制品，那么可以按如下规则设置这两个值：
        1) 拥有更多的碎片可以提升索引执行能力，并允许通过机器分发一个大型的索引；
        2) 拥有更多的复制器能够提升搜索执行能力以及集群能力。
        对于一个索引来说，number_of_shards只能设置一次，而number_of_replicas可以使用索引更新设置API在任何时候被增加或者减少。
        ElasticSearch关注加载均衡、迁移、从节点聚集结果等等。可以尝试多种设计来完成这些功能。
        可以连接http://localhost:9200/A/_status来检测索引的状态。
        9. 配置文件所在的位置，即elasticsearch.yml和logging.yml所在的位置：
path.conf: /path/to/conf
        10. 分配给当前节点的索引数据所在的位置：
path.data: /path/to/data
        可以可选择的包含一个以上的位置，使得数据在文件级别跨越位置，这样在创建时就有更多的自由路径，如：
path.data: /path/to/data1,/path/to/data2
        11. 临时文件位置：
path.work: /path/to/work
        12. 日志文件所在位置：
path.logs: /path/to/logs
        13. 插件安装位置：
path.plugins: /path/to/plugins
        14. 插件托管位置，若列表中的某一个插件未安装，则节点无法启动：
plugin.mandatory: mapper-attachments,lang-groovy
        15. JVM开始交换时，ElasticSearch表现并不好：你需要保障JVM不进行交换，可以将bootstrap.mlockall设置为true禁止交换：
bootstrap.mlockall: true
        请确保ES_MIN_MEM和ES_MAX_MEM的值是一样的，并且能够为ElasticSearch分配足够的内在，并为系统操作保留足够的内存。
        16. 默认情况下，ElasticSearch使用0.0.0.0地址，并为http传输开启9200-9300端口，为节点到节点的通信开启9300-9400端口，也可以自行设置IP地址：
network.bind_host: 192.168.0.1
        17. publish_host设置其他节点连接此节点的地址，如果不设置的话，则自动获取，publish_host的地址必须为真实地址：
network.publish_host: 192.168.0.1
        18. bind_host和publish_host可以一起设置：
network.host: 192.168.0.1
        19. 可以定制该节点与其他节点交互的端口：
transport.tcp.port: 9300
        20. 节点间交互时，可以设置是否压缩，转为为不压缩：
transport.tcp.compress: true
        21. 可以为Http传输监听定制端口：
http.port: 9200
        22. 设置内容的最大长度：
http.max_content_length: 100mb
        23. 禁止HTTP
http.enabled: false
        24. 网关允许在所有集群重启后持有集群状态，集群状态的变更都会被保存下来，当第一次启用集群时，可以从网关中读取到状态，默认网关类型（也是推荐的）是local：
gateway.type: local
        25. 允许在N个节点启动后恢复过程：
gateway.recover_after_nodes: 1
        26. 设置初始化恢复过程的超时时间：
gateway.recover_after_time: 5m
        27. 设置该集群中可存在的节点上限：
gateway.expected_nodes: 2
        28. 设置一个节点的并发数量，有两种情况，一种是在初始复苏过程中：
cluster.routing.allocation.node_initial_primaries_recoveries: 4
        另一种是在添加、删除节点及调整时：
cluster.routing.allocation.node_concurrent_recoveries: 2
        29. 设置复苏时的吞吐量，默认情况下是无限的：
indices.recovery.max_size_per_sec: 0
        30. 设置从对等节点恢复片段时打开的流的数量上限：
indices.recovery.concurrent_streams: 5
        31. 设置一个集群中主节点的数量，当多于三个节点时，该值可在2-4之间：
discovery.zen.minimum_master_nodes: 1
        32. 设置ping其他节点时的超时时间，网络比较慢时可将该值设大：
discovery.zen.ping.timeout: 3s
http://elasticsearch.org/guide/reference/modules/discovery/zen.html上有更多关于discovery的设置。
        33. 禁止当前节点发现多个集群节点，默认值为true：
discovery.zen.ping.multicast.enabled: false
        34. 设置新节点被启动时能够发现的主节点列表（主要用于不同网段机器连接）：

discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]

35.设置是否可以通过正则或者_all删除或者关闭索引

action.destructive_requires_name 默认false 允许可设置true不允许

elasticsearch配置详解

标签：

原文地址：http://www.cnblogs.com/zhc-hnust/p/5463377.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行