一:namenode出现missing blocks 日常巡检CDH集群和HDP集群发现有些namenode下有很多missing blocks ,hadoop数据存储单位为块。一块64M,这些Missing大多因为元数据丢失而毁坏,就行硬盘故障一样,需要fsck CDH集群 :Cloudera m ...
分类:
其他好文 时间:
2018-05-11 20:14:03
阅读次数:
318
《架构师之运维监控》 PS:监控是什么,运维喝茶之道。 (凡人) 1.识别监控对象(分级) 2.理解监控对象(理论知识) 3.细分监控对象的指标 4.确定告警的基准线 预中级(筑基) 1.工具化和监控分离 2.监控对象的分类: 2.1硬件监控(方法:机房巡检,IPMI,SNMP) https://w ...
分类:
其他好文 时间:
2018-05-05 13:27:44
阅读次数:
752
#!/usr/bin/sh FILE_DATE=`/usr/bin/date +%Y%m%d` HOSTNAME=`hostname`# Get Serial numberSERIAL=`lscfg -vpl sysplanar0 |grep -p "System:" |grep "Machine/Cabinet"`if [[ $? -e
分类:
其他好文 时间:
2018-04-10 18:47:55
阅读次数:
180
精密空调RT:现在的温度SP:设置的温度RH:现在的湿度SH:设置的湿度“风车图标”:表示风机工作正常回风温度:22度送风温度:18度温湿度设定:45%rh另外,尽量不要关机半年清洗一次水垢半年换一次发动机皮带三个月至半年清洗一次过滤网配电柜:开关都不要碰强电输入电压(V): a:217.1 b:217.8 c:217.5&
分类:
其他好文 时间:
2018-03-19 19:02:37
阅读次数:
480
监控 1,识别监控对象 2,理解监控对象 3,细分监控对象的指标 4,确定告警的基准线 预中级 1,工具化和监控分离 2,监控对象分离 2.1 硬件监控(方法:机房巡检,IPMI,SNMP) 2.2 系统监控(对象:CPU,内存,IO[磁盘,网络]) 2.3 服务监控(对象:各类服务[Nginx|T ...
分类:
其他好文 时间:
2018-03-11 21:08:12
阅读次数:
183
风哥Oracle数据库巡检工具V1.0下载地址:http://www.itpux.com/thread-5927-1-1.html
分类:
数据库 时间:
2018-03-01 10:17:01
阅读次数:
203
同事在给客户做数据库巡检的过程中,发现其中一个数据库的alert日志中报了一个坏块的错误信息,具体如下: Readingdatafile'+DATA_DW/xtdw/datafile/sysaux.295.819217697'forcorruptionatrdba:0x0081140e(file2,... ...
分类:
其他好文 时间:
2018-02-25 00:03:49
阅读次数:
324
一、问题概述1、数据库环境:Oracle Database 11.2.0.3.0 for Oracle Linux Server release 6.4,RAC,虚拟机?2、巡检时发现某数据库alert.log日志报ORA-00600[13011]错误,报错频繁,虽然未导致数据库宕机,但已影响业务,报错如下:[oracle@NODE1?trace]$?grep&nbs
分类:
其他好文 时间:
2018-02-12 16:54:48
阅读次数:
197
不论是前期调研还是定期维护巡检,经常性地需要很快了解Exchange的整体大概情况。懒得在ECP里逐个点开看,也懒得一条一条输入命令,所以花了点时间,写了个收集Exchange信息的PowerShell的脚本。 用VS Code写PowerShell脚本也挺舒服的,除了暂时不支持特定Module的提示。估计后续会有人写吧。另外就是需要
分类:
系统相关 时间:
2018-02-11 21:22:21
阅读次数:
217
#!/bin/sh
#定义检查操作系统版本的函数
NUM_VERSION=$(uname -r)
function Check_OS(){
[[ $NUM_VERSION =~ el6 ]] && return 0||return 1
}
echo "#####
分类:
系统相关 时间:
2017-12-20 22:44:23
阅读次数:
369