Linux下的监控器之一Ganglia详解与部署

时间：2017-08-11 15:57:55 阅读：286 评论：0 收藏：0 [点我收藏+]

Ganglia基础详解

Ganglia介绍
Ganglia是一个跨平台可扩展的，高性能计算系统下的分布式监控系统，如集群和网格。它是基于分层设计，它使用广泛的技术，如XML数据代表，便携数据传输，RRDtool用于数据存储和可视化。它利用精心设计的数据结构和算法实现每节点间并发非常低的。它已移植到广泛的操作系统和处理器架构上，目前在世界各地成千上万的集群正在使用。

Ganglia特点

具有良好的扩展性，分层架构使用与大规模服务器集群的架构
负载开销低，支持高并发
广泛支持各种操作系统

Ganglia组成
技术分享

Ganglia框架有gmond，gmated和webfronted进程组成：
gmond：是运行在被监控节点的守护进程，负责采集本节点的上数据，同时也接受替他节点上发送过来的数据，默认监听在8649。
gmated：运行在监控节点上的守护进程，负责定期检查每个gmond进程并从哪里获取数据，然后将数据存储在本地的RRD存储引擎中。
webfronted：使用PHP写成的web图形化界面，功能从gmetad获取数据并且读出数据库，通过rrdtool工具生成图表，通过http协议显示在终端上。

Ganglia的工作模型

node：监控单个服务器
技术分享

一台主机运行gmond进程，另一台主机运行gmetad进程进行数据采集。

cluster：监控一个集群

主机A,B,C,D,E模型一：
    主机A,B,C,D作为被监控端，运行gmont进程。
    主机E作为监控端运行gmetad进程。
模型二：
    主机A,B,C：被监控端
    主机D：运行gmont进程，负责采集A,B,C传送的数据，最终将数据传送给监控节点。
    主机E：监控节点
模型三：
    如见下图：

技术分享

grid：监控一个网格，由多个集群服务组成

Ganglia之间的通信

gmond<–>gmond：采用UDP通信协议，并以文件格式为XDL的格式进行发送。
gmond<–>gmetad：采用TCP通信协议，并以文件格式为XML的形式进行传送。
gmetad<–>gmetad:采用TCP通信协议，并以文件格式为XML的形式进行传送。

通常采用单播和多播进行通信
gmond与gmond之间以多播的方式行通信（默认）。gmond向外发送数据，相邻的gmond主机也会收到数据。
Ganglia的部署
部署结构

  主机                  IP                   作用
  Clone1           192.168.80.129             监控
  Clone2           192.168.80.130             被监控

监控端部署

gmetad安装：

提前安装confuse，rrdtool
yum源安装：
    [root@Clone1 ~]# yum install ganglia-gmetad ganglia-web
编译安装gmetad：
    [root@Clone1 ~]#  wget https://jaist.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.7.2/ganglia-3.7.2.tar.gz
    [root@Clone1 ~]# tar -xzf ganglia-3.7.2.tar.gz 
    [root@Clone1 ~]# cd ganglia-3.7.2
    [root@Clone1 ganglia-3.7.2]# ./configure --prefix=/usr/local/ganglia --with-static-modules --enable-gexec --enable-status --with-gmetad   --with-libexpat --with-libconfuse=/usr/local/confuse --with-libpcre --with-librrd=/usr/local/rrtdool --htmldir=/var/www/html/gangia
    [root@Clone1 ganglia-3.7.2]# make && make install

gmetad配置：

 1. 在安装包文件中找到gmetad.init文件 
 2. 将此文件复制到/etc/rc.d/init.d/gmetad
    [root@Clone1 gmetad]# cp gmetad.init /etc/rc.d/init.d/gmetad
 3. 编辑/etc/rc.d/init.d/gmetad，设置GMSTA=/usr/local/ganglia/sbin/gmetad 
 4. 添加多播地址
    [root@Clone1 sbin]# ip route add 239.2.11.71 dev eth0
 5. 编辑配置文件
    data_source "Ganglia" 192.168.80.130    //定义集群的名称，以及集群的节点
    gridname "MyGrid"      //定义一个网格名称，网格中的服务器集群由data_source定义
    xml_port 8651       //定义一个接受数据的端口，默认伪8651
    interactive_port 8652    //此参数定义web端获取数据的端口，
    rrd_rootdir "/var/lib/ganglia/rrds"     //rrd数据库的存放路径，默认伪/var/lib/ganglia/rrds

ganglia-web配置：

 1. yum源安装：
    [root@Clone1 ~]# yum install  ganglia-web
    [root@Clone1 ~]# cp /usr/share/ganglia/* /var/www/html/
 2. 编译安装：
    [root@Clone1 ~]# git clone https://github.com/ganglia/ganglia-web.git
    [root@Clone1 ~]# cd ganglia-web/
    [root@Clone1 ganglia-web]# cp -rv  * /var/www/html/ganglia/
    [root@Clone1 ganglia]# mv conf_default.php.in conf_default.php
 3. 编辑conf_default.php    
     $conf[‘gmetad_root‘] = "/var/lib/ganglia";  //ganglia-gmetad安装目录    
     $conf[‘gweb_root‘] . "/version.php"；           //genglia的web根目录 
     $conf[‘rrds‘] = "${conf[‘gmetad_root‘]}/rrds";   //web读物rrd数据库的路径    
     $conf[‘dwoo_compiled_dir‘] = "${conf[‘gweb_confdir‘]}/dwoo/compiled"; //需要777权限    
     $conf[‘dwoo_cache_dir‘] = "${conf[‘gweb_confdir‘]}/dwoo/cache";            //需要777权限    
     $conf[‘rrdtool‘] = "/usr/local/rrtdool/bin/rrdtool";      //指定rrdtool的路径    
     $conf[‘graphdir‘]= $conf[‘gweb_root‘] . ‘/graph.d‘;      //生成图成模板目录    
     $conf[‘ganglia_ip‘] = "127.0.0.1"; //gmetad服务器的地址    
     $conf[‘ganglia_port‘] = 8652;      //提供监控数据端口 
     4. 改变rrd库的权限为777
 5. 创建/var/www/html/ganglia/dwoo/下comiled目录和cache目录，并赋予可写权限

被监控端部署

gmond安装：

前提安装confuse 
     1. yum安装：
    [root@Clone2 ~]#  yum install ganglia-gmond
 2. 编译安装：
    [root@Clone1 ~]#  wget https://jaist.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.7.2/ganglia-3.7.2.tar.gz
    [root@Clone1 ~]# tar -xzf ganglia-3.7.2.tar.gz 
    [root@Clone1 ~]# cd ganglia-3.7.2
    [root@Clone2 confuse-2.5]# ./configure --prefix=/usr/local/ganglia --enable-gexec --enable-status  --with-libconfuse=/usr/local/confuse --with-expat=/usr --with-libpcre=/usr
    [root@Clone2 confuse-2.5]# make && make install

gmond配置：

 1. cp启动文件
    [root@Clone2 gmond]# cp gmond.init /etc/rc.d/init.d/gmond
 2. 编译启动文件/etc/rc.d/init.d/gmond：
    GMSTA=/usr/local/ganglia/sbin/gmond 
 3. 配置多播地址:
    [root@Clone2 ganglia-3.7.2]# ip route add 239.2.11.71 dev eth0
 4. 生成配置文件：
    [root@Clone3 gmond]# ./gmond -t > /etc/ganglia/gmond.conf
    [root@Clone3 gmond]# ./gmond -t > /usr/local/ganglia/etc/gmond.conf

gmond配置文件：

gmond的配置文件分为Gloabl，cluster，host，协议配置四部分组成
第一部分：
globals {
  daemonize = yes      //是否后台运行
  setuid = yes         //是否设置用户运行
  user = nobody        //运行程序的用户
  debug_level = 0      //调试级别
  max_udp_msg_len = 1472        //最大UDP队列长度
  mute = no             //是否将采集到的数据广播到其他节点
  deaf = no             //是否接受其他节点发送过来的数据
  allow_extra_data = yes      //允许额外数据
  host_dmax = 86400          //是否删除一个节点，0表示永不删除，非0表示不响应时间，超过这个时间系统会刷新集群节点，从而删除此节点
  host_tmax = 20            //
  cleanup_threshold = 300    //清理过期数据的时间
  gexec = no          //是否使用gexec来告知主机是否可用
  send_metadata_interval = 0       //在单播通信中，新添加的节点多长时间表示一下自己的存在，0表示启动时通知。}

第二部分：定义主机在集群中的信息cluster {
  name = "my cluster"        //集群名称，要与监控端data_source其中一项匹配
  owner = "unspecified"       //节点拥有者
  latlong = "unspecified"     //节点的坐标，一般不用指定
  url = "unspecified"         //节点的URL，一般不用指定} 

第三部分：定义主机
host {
  location = "unspecified"      //节点的物理位置，一般不用指定}

第四部分：协议配置
udp_send_channel {      //udp发送通道
    mcast_join = 239.2.11.71        //指定发送的多播地址，单播模式下，为host_ip,可以定义多个udp_send_channel
    port = 8649                     //监听的端口
    ttl = 1}

udp_recv_channel {      //udp接受通道
    mcast_join = 239.2.11.71        //指定接受的多播地址
    port = 8649                     //监听的端口
    bind = 239.2.11.71              //绑定地址
    retry_bind = true
}

tcp_accept_channel {
    port = 8649                     
    gzip_output = no
}

结果
技术分享

Linux下的监控器之一Ganglia详解与部署

标签：集群服务器监控器

原文地址：http://lnsane784.blog.51cto.com/1226518/1955141

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

Linux下的监控器之一Ganglia详解与部署

Ganglia基础详解

Ganglia的部署