标签:cgroup的使用
线上的mongodb是复制集模式的。为了便于监控mongodb的慢查询等状态,在3台机器上都部署了packetbeat,通过抓取27017端口的流量发送到ES集群。
但是第二天发现zabbix告警,显示某一台机器A(从节点)上的mongod进程宕了。日志显示是OOM导致的。
再一想到,我们每天的mongodb的备份脚本是通过远程主机连接到机器A的27017端口进行dump数据的,通过对比zabbix的网卡流量趋势图、备份脚本的执行时间、message日志中OOM的时间点,可以分析出就是因为mongodump时候产生的大量的数据包被packetbeat抓取到并缓存住,造成服务器的内存被吃光了。
解决方法:
关闭这个机器A(从节点)上面的packetbeat进程,或者配置计划任务以确保备份数据的时候,packetbeat进程不要开启。
当然,这里我们还可以用cgroup限制住packetbeat使用的内存大小,这样的话,最多导致packetbeat宕掉,不会影响到mongod进程的正常工作。
以限制mongod使用的内存大小为例(packetbeat的启动有点复杂,没去折腾),
/etc/init.d/cgconfig start 自动会在/cgroup/下生成一堆文件。
mkdir /cgroup/memory/test/
echo 1024M > /cgroup/memory/test/memory.limit_in_bytes
echo 1024M > /cgroup/memory/test/memory.memsw.limit_in_bytes
cgexec -g memory:test /usr/local/mongodb/bin/mongod -f /usr/local/mongodb/etc/mongod.conf
这样通过cgroup限制后,当mongod使用的内存达到限额1024MB后,进程会被自动kill。
标签:cgroup的使用
原文地址:http://lee90.blog.51cto.com/10414478/1961522