标签:
为了给ganglia监控的数据加上报警的功能,在jenkins里加了一个定时job,运行报警的脚本。脚本需要对ganglia记录的数据进行分析,以下是一点粗浅的理解。
rrdtool的本质是用于画图的,所以当我运行rrdtool fetch /var/lib/ganglia/rrds/myapp/__SummaryInfo__/mycount.rrd AVERAGE时,出来的结果
1454465040: 1.7000000000e+01 3.0000000000e+00 1454465055: 1.7000000000e+01 3.0000000000e+00 1454465070: 1.7666666667e+01 3.0000000000e+00 1454465085: 1.7400000000e+01 3.0000000000e+00 1454465100: 1.4333333333e+01 3.0000000000e+00 1454465115: 1.9066666667e+01 3.0000000000e+00 1454465130: 2.1466666667e+01 3.0000000000e+00 1454465145: 1.7866666667e+01 3.0000000000e+00 1454465160: 1.3600000000e+01 3.0000000000e+00 1454465175: 2.0400000000e+01 3.0000000000e+00 1454465190: 2.4400000000e+01 3.0000000000e+00 1454465205: 3.9600000000e+01 3.0000000000e+00 1454465220: 4.0800000000e+01 3.0000000000e+00 1454465235: 4.7200000000e+01 3.0000000000e+00 1454465250: 2.7000000000e+01 3.0000000000e+00 1454465265: -nan -nan
代表的是图上的点,也就是说,每隔15秒的步长,画一个值为20的点
那么,当到运行rrdtool fetch /var/lib/ganglia/rrds/myapp/__SummaryInfo__/mycount.rrd AVERAGE -r 60时,也就是取了60秒的数据再算平均值,也就是所谓的聚合。聚合度只有几个固定的值,所以r参数不一定就是聚合度,要看显示的结果步长为多少秒。我再根据这个平均值乘以上报的频率就可以统计出一定时间内的数据了。
标签:
原文地址:http://www.cnblogs.com/liumuqiu/p/5179123.html