码迷,mamicode.com
首页 > 其他好文 > 详细

监控运维系统实施方案--监控对象信息收集阶段

时间:2015-07-14 20:49:09      阅读:454      评论:0      收藏:0      [点我收藏+]

标签:系统监控   业务监控   监控实施方案   监控对象信息采集   运维巡检报告   

监控运维系统不是一件一蹴而就的事情,也不是一朝一夕就能轻易完成的,监控运维系统的规模与服务器规模和软件规模息息相关,需要仔细分析和筹划才能实现一个可用的监控运维系统。  
为了直观的表示当前系统(除非特殊说明都指操作系统)和应用的运行状态,能让不熟悉运维知识的leader看明白当前的运行状态,最好的方法就是运用图的方式将这些系统和应用之间的逻辑关系展示出来。根据系统和业务两种区分可以将它们分成三张图(这些图可以叫做系统架构图、软件架构图和业务逻辑图)。    
1.系统架构图:表示所有系统的堆叠关系,例如物理服务器和虚拟服务器用不同的形式在图中展示出来,通过此图一眼就能看到那些系统存在问题,存在什么问题    
2.业务逻辑图:单独表示业务逻辑,将业务逻辑之间的依赖关系和其他关系表示出来,便于在发现整体故障时,确定哪里存在问题能导致整体故障的发生,通过此图一眼就能看到那些业务存在问题,存在什么问题    
3.软件架构图:表示业务与系统的对应关系,即那些业务运行在哪些系统中,或每个系统运行着那些业务,便于当出现问题时该去排查哪些系统或者哪些模块

为了达到较好的监控效果,需要准备以下一些内容:  
1.硬件层面:当前服务器的实际使用情况,例如服务器的数量,主机名称(规范的FQDN),IP地址(有多少地址写多少地址),操作系统类别,管理方式和管理信息(如何远程登录、用户名和密码等);如果可能,最好包含有网络设备的相关信息,如与服务器的连接方式、带宽等相关信息    
2.操作系统层面:不管操作系统是虚拟的还是非虚拟的,对于监控来说都是一个完整的监控实体,与硬件层面的服务器一样,它也需要确切的知道主机名称(规范的FQDN),IP地址(有多少地址写多少地址,并区分管理地址和业务地址等),操作系统类别,管理方式和管理信息(如何远程登录、用户名和密码等)    
3.软件(业务)层面:每一个业务模块的名称、提供的功能,依赖关系(该业务模块需要哪些其他的业务模块,哪些业务模块需要该业务模块),进程或服务名称,监听的IP地址和端口(socket),每一个业务模块正常运行时的可监控状态(如返回值是多少正常,输出什么字符串是正常等)    
4.软件层面中每一个业务模块与操作系统层面的对应关系,业务模块需要操作系统中那些软件包(依赖关系)、安装路径、可用的诊断程序和维护工具等

一些可参考的表格

表1:服务器监控列表

服务器序号主机名称IP地址1IP地址2操作系统类别登录方式管理地址管理用户名管理密码备注
1rc220.domain.cn221.0.92.31192.168.1.100Linux UbuntuiDRAC221.0.93.31usernamepassword 
2bb200.domian.cn-192.168.1.200VMware ESXi5.5UCS Manager192.168.1.200usernamepassword 
          

表2:操作系统监控列表

操作系统序号主机名称IP地址1IP地址2操作系统类别是否虚拟机登录方式用户名密码备注
1node1.domain.cn221.0.92.31192.168.1.100Linux Ubuntu-SSHusernamepassword 
2node2.domain.cn-192.168.1.101Linux Ubuntu-SSHusernamepassword 
3vcenter.domian.cn-192.168.1.201Linux SUSEvSphere Clientusernamepassword 
          

表3:业务模块监控列表

业务模块序号模块名称模块功能描述依赖关系A依赖关系B进程名称(完整命令行)监听IP地址监听端口正常状态描述
1关系数据库MySQL数据库-信息收集服务        
信息查询服务
mysqld_safe --datadir=/data/mysql192.168.1.10033063306端口已监听,进程存在,允许连接,数据库存在,数据库表存在,数据库字段存在
2信息采集服务收集用户信息关系数据库        
Web服务器1
最终用户        
信息查询服务
command --parameter=/path192.168.1.1018081xxx端口已监听,xxx进程存在,返回值为xxx,xxx URL返回xxx
3信息查询服务查询用户信息关系数据库        
信息采集服务
最终用户command --parameter=/path192.168.1.1028082xxx端口已监听,xxx进程存在,返回值为xxx,xxx URL返回xxx
4        

表4:业务模块与操作系统对应关系

编号模块名称业务模块序号操作系统序号软件包/编译参数安装路径可用诊断程序维护工具备注
1关系数据库11mysql-server,mysql,musql-libs,mysql-devel/usrmsyql,mysqladminmysql,mysqladmin 
2信息采集服务22-/usr/local/wwwrootcurl,wget- 

参考图形:

参考图形可以用Visio绘制,构图需要根据上述表格制作,由系统架构师、软件架构师或者在公司多年了解系统架构和软件架构的系统运维人员制作。

 技术分享技术分享技术分享

以上三图依次为系统架构图,软件架构图,业务与操作系统对应关系图的大体示例。

--end--

本文出自 “通信,我的最爱” 博客,请务必保留此出处http://dgd2010.blog.51cto.com/1539422/1674040

监控运维系统实施方案--监控对象信息收集阶段

标签:系统监控   业务监控   监控实施方案   监控对象信息采集   运维巡检报告   

原文地址:http://dgd2010.blog.51cto.com/1539422/1674040

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!