标签:监控 详细配置 open-falcon
Open-falcon部署文档(绘图及报警)
Agent
采集机器的监控指标, agent与Transfer建立了长连接,数据发送速度比较快,agent提供了一个http接口/v1/push用于接收用户手工push的一些数据,然后通过长连接迅速转发给Transfer。
cd agent
mv cfg.example.json cfg.json
vim cfg.json
修改如上图三处ip,
heartbeat hbs的地址,端口是hbs的rpc端口
transfer 根据需求可以填写多个。
http :此处可以不修改默认配置,这里已做修改
./control start (启动)
./control tail (查看是否报错)
部署说明:agent需要部署到所有要被监控的机器上,比如公司有10万台机器,
那就要部署10万个agent。agent本身资源消耗很少,不用担心。
transfer
transfer是数据转发服务。它接收agent上报的数据,然后按照哈希规则
进行数据分片、并将分片后的数据分别push给graph&judge等组件。
cd transfer
mv cfg.example.json cfg.json(默认配置即可)
./control start (启动)
./control tail(查看是否报错)
graph
graph是存储绘图数据的组件。graph组件 接收transfer组件推送上来
的监控数据,同时处理query组件的查询请求、返回绘图数据。
cd graph
mv cfg.example.json cfg.json
vim cfg.json
./control start (启动)
./control tail (查看是否报错)
query 组件,提供统一的绘图数据查询入口
cd query
mv cfg.example.json cfg.json (默认配置即可)
./control start (启动)
./control tail (查看是否报错)
Dashboard
dashboard是面向用户的查询界面。在这里,用户可以看到push到
graph中的所有数据,并查看其趋势图。
# 安装virtualenv。需要root权限。
yum install -y python-virtualenv
# 安装依赖。需要到dashboard的目录下执行。
cd dashboard
virtualenv ./env
./env/bin/pip install -r pip_requirements.txt
vim gunicorn.conf
vim ./rrd/config.py
./control start (启动)
./control tail (查看是否报错)
安装报警组件:
邮件服务 mail-provider
监控系统产生报警事件之后需要发送报警邮件或者报警短信,如果公司
没有自己的邮件系统可以就用这块软件,比较方便。
mkdir mail-provider
tar -zxf falcon-mail-provider-0.0.1.tar.gz -C mail-provider
cd mail-provider
mv cfg.example.json cfg.json
vim cfg.json
修改如上配置
./control start (启动)
./control tail (查看是否报错)
Sender
Sender这个模块专门用于调用各公司提供的邮件、短信发送接口。
cd sender
mv cfg.example.json cfg.json
vim cfg.json
Sender如上配置,不然发送不了邮件
fe
web前端,这是Go版本的UIC,也是一个统一的web入口,可以在Fe中
维护个人联系信息,维护人和组的对应关系
cd fe
mv cfg.example.json cfg.json
vim cfg.json
./control start (启动)
./control tail (查看是否报错)
portal
Portal是用来配置报警策略的
cd portal
virtualenv ./env
./env/bin/pip install -r pip_requirements.txt
vim gunicorn.conf
vim frame/config.py
./control start (启动)
./control tail (查看是否报错)
HBS
心跳服务器,公司所有agent都会连到HBS,每分钟发一次心跳请求。
cd hbs
mv cfg.example.json cfg.json
vim cfg.json
./control start (启动)
./control tail (查看是否报错)
Judge
用于告警判断,agent将数据push给Transfer,Transfer不但会转发给
Graph组件来绘图,还会转发给Judge用于判断是否触发告警
cd judge
mv cfg.example.json cfg.json
vim cfg.json
./control start (启动)
./control tail (查看是否报错)
Alarm
alarm模块是处理报警event的,judge产生的报警event写入redis,
alarm从redis读取处理
cd alarm
mv cfg.example.json cfg.json
vim cfg.json
./control start (启动)
./control tail (查看是否报错)
报警合并:
调整alarm配置
把p0,p1添加到high里,p2-p6添加到low里。
Links
links组件的作用:当多个告警被合并为一条告警信息时,
短信中会附带一个告警详情的http链接地址,供用户查看详情。
cd links
virtualenv ./env
./env/bin/pip install -r pip_requirements.txt
vim gunicorn.conf
vim frame/config.py
./control start (启动)
./control tail (查看是否报错)
总结:open-falcon照个官方文档部署的过程中,会遇到一些坑,当初也是花了一段时间才解决,文档中详细的配置基本都已列出来,照着部署基本没问题。
注:还是不太会用这个写博客,排版可能会有问题,看的话讲究看下吧。嘿嘿!
本文出自 “未曾走过的路” 博客,请务必保留此出处http://10551335.blog.51cto.com/10541335/1828537
标签:监控 详细配置 open-falcon
原文地址:http://10551335.blog.51cto.com/10541335/1828537