OSSIM架构与组成综述OSSIM布道师李晨光一、背景如果运维工程师手里没有高效的管理工具支持,就很难快速处理故障。市面上有很多运维监控工具,例如商业版的Solarwinds、ManageEngine以及WhatsUp等,开源的MRTG、Nagios、Cacti、Zabbix、OpenNMS、Ganglia等。由于它们彼此之间所..
分类:
其他好文 时间:
2016-01-27 02:08:47
阅读次数:
979
现有的环境中Hbase集群的机器需要安装ganglia,遂采取了以下步骤。 查看机器的信息, uname –a cat /etc/issue 查看当前环境是x86的,安装的是red hat 6.4 之前有一些集群也是x86,安装的是red hat 6.2 决定从已安装的集群中直接复制过来。 步骤如下...
分类:
其他好文 时间:
2016-01-25 22:47:30
阅读次数:
279
这是nagios与ganglia整合的一部分内容 。 通常我们会把ganglia的监控发送给一个主机,我们可以在这个主机上执行nc localhost 8649 可以获取到所有发往这个主机的信息,以xml的形式查看。 nagios监控ganglia的指标的方法就是使用这个思路,check_gangl...
分类:
移动开发 时间:
2015-12-29 12:54:04
阅读次数:
207
Ganglia是一个监控服务器,集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标。Ganglia的强大在于:ganglia服务端能够通过一台客户端收集到同一个网段的所有客户端的数据,ganglia集群服务端能够通...
分类:
其他好文 时间:
2015-11-26 18:42:38
阅读次数:
201
本周二的时候,涛哥找我,说明了一件事,在安装ganglia的时候,发生的一个问题。在一台suse 10 sp1的服务器上,安装ganglia的一个依赖包,libconfuse.rpm,安装完成之后,执行任何命令都会出现段错误的提示,而且无法再次ssh登录,也无法直接console登录。ssh登录,提...
分类:
系统相关 时间:
2015-11-12 10:03:42
阅读次数:
740
1. gmetad 分层;2. rrdcached 缓存;3. 更换 SSD 或者其他快速存储设备,避免使用 HDD 存储; 使用 RAID 等具有大量写入缓存的设备等 如果集群比较小,产生的文件总量也不是很大,则直接使用 RAM 来存储,定期进行备份。4. 使用大块的逻辑卷,避免对一个 rrd.....
分类:
其他好文 时间:
2015-09-26 19:57:54
阅读次数:
462
hbase ganglia 显示器hbase 构造hadoop-metrics2-hbase.properties *.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31 *.sink....
分类:
其他好文 时间:
2015-09-25 21:42:23
阅读次数:
230
一 资源下载ganglia-3.6.0.tar.gzganglia-web-3.6.2.tar.gznagios :http://sourceforge.net/projects/nagios/files/nagios-4.x/nagios-4.1.1/nagios-4.1.1.tar.gz/dow...
分类:
移动开发 时间:
2015-09-15 10:47:21
阅读次数:
2580
前言最近在排查公司Hadoop集群性能问题时,发现Hadoop集群整体处理速度非常缓慢,平时只需要跑几十分钟的任务时间一下子上张到了个把小时,起初怀疑是网络原因,后来证明的确是有一部分这块的原因,但是过了没几天,问题又重现了,这次就比较难定位问题了,后来分析hdfs请求日志和Ganglia的各项监控指标,发现namenode的挤压请求数持续比较大,说明namenode处理速度异常,然后进而分析出是...
分类:
其他好文 时间:
2015-09-13 21:43:11
阅读次数:
386