Cluster Health Monitor(简称CHM)是一个Oracle提供的工具,用来自动收集操作系统的资源(CPU、内存、SWAP、进程、I/O以及网络等)的使用情况。CHM会每秒收集一次数据,11.2.0.3版本是5秒收集。
这些系统资源数据对于诊断集群系统的节点重启、Hang、实例驱逐(Eviction)、性能问题等是非常有帮助的。还以使用CHM来及早发现一些系统负载高、内存异常等问题,从而避免产生更严重的问题。
CHM会自动安装在下面的软件:
11.2.0.2 及更高版本的 Oracle GridInfrastructure for Linux (不包括Linux Itanium) 、Solaris (Sparc 64 和 x86-64)
11.2.0.3 及更高版本 Oracle GridInfrastructure for AIX 、 Windows (不包括Windows Itanium)。
在集群中,可以通过下面的命令查看CHM对应的资源(ora.crf)的状态:
$ crsctl stat res ora.crf -init
CHM主要包括两个服务:
1). SystemMonitor Service(osysmond):这个服务在所有节点都会运行,osysmond会将每个节点的资源使用情况发送给cluster logger service,后者将会把所有节点的信息都接收并保存到CHM的资料库。
2). Cluster Logger Service(ologgerd):在一个集群中的,ologgerd 会有一个主机点(master),还有一个备节点(standby)。当ologgerd在当前的节点遇到问题无法启动后,它会在备用节点启用。(这个和DRM的master是不同的概念)
CHM Repository:用于存放收集到数据,默认情况下,会存在于Grid Infrastructure home 下 ,需要1 GB 的磁盘空间,每个节点大约每天会占用0.5GB的空间。 您可以使用OCLUMON来调整它的存放路径以及允许的空间大小(最多只能保存3天的数据)。
关闭和开启CHM(最好用grid账号在2个节点上分别执行执行)
关闭:
ora11grac1</home/grid>$ crsctl stop res ora.crf –init
ora11grac2</home/grid>$ crsctl start res ora.crf –init
开启:
ora11grac1</home/grid>$crsctl startres ora.crf -init
ora11grac2</home/grid>$crsctl startres ora.crf -init
备注:
1.关闭服务后I/O缓缓下降
2.本次修改仅仅适用于本次,重启DB或者crs服务本次修改失效
3.是否启用主要取决于生产环境的设备IO,测试机可以直接禁用
启用和禁用CHM:
#<GRID_HOME>/bin/crsctl modify resource ora.crf -attr"AUTO_START=never" –init
#<GRID_HOME>/bin/crsctl modify resource ora.crf -attr"AUTO_START=always" -init
参考文档:MOS文档: Cluster Health Monitor (CHM) FAQ(Doc ID 1328466.1)
原文地址:http://blog.csdn.net/jacson_bai/article/details/30427413