标签:磁盘清理
磁盘清理工作分2步进行
每日巡检:我们自己的监控地址
http://221.181.100.38/yq/accessreport/disk.txt
最好超过80%提前进行清理,可有效避免大部分的HM报警。
移动方HM监控报警处理
阀值为90%
一般磁盘报警主要有5种情况
/ (根目录)
/usr (/usr/local/为应用安装点)
/var (此目录已经脚本解决,基本不会出现报警)
/nas (此为存储挂载点)
数据库及其他
清理前注意(重要的事情说三遍):
慎用rm -rf!
慎用rm -rf!!
慎用rm -rf!!!
1、
/ 根目录
查看哪个目录占空间最大。
一般情况,是脚本运行失败,导致/logs/exchange/下的日志没压缩或者超期日志没及时删除导致(保留3个月)
ll /logs/exchange
drwxr-xr-x 2 root root 4096 05-05 00:03 201504
drwxr-xr-x 2 root root 4096 06-05 00:03 201505
drwxr-xr-x 2 root root 12288 06-29 00:02 201506
drwx------ 2 root root 45056 06-29 06:43 recent
删除3个月前的,并压缩日志(除了当天的)即可。
也有可能是一些人为操作不当导致,比如抓包后没有及时停掉进程,导致抓包日志不停打印,将本地磁盘撑爆。
需要运用du命令仔细分析。
du -sh * 常用
2、
/usr
一般为 /usr/local/apache/logs 和/usr/local/tomcat/logs 2个应用的日志没有及时压缩或者清理导致。
有几种情况
a 刷量导致的当日日志过大,不可压缩
访问及订购日志不可动(不可清空),可以清空localhost日志或者mod_jk日志。如果还是告警,先将旧日志转移其他目录,待明日日志压缩后移回。
b 旧日志没有压缩
gzip 当日之前的日志即可
c 应用备份过多
一般为tomcat/webapps/,删除最老的备份(注意查看软链接和mount点是否取消)
3 、
/var
一般为/var/spool/clientmqueue下垃圾文件过多导致,也有可能是/var/spool/mail/root 邮件数量太多。
现在大部分服务器已经实现了脚本自动清理。
前者进行删除操作,后者进行清空操作.
4、
/nas
此处为存储默认挂载点
root@SHYQ-PS-MV-SV03-IPADCS-02 ~]# ll /nas
total 96
drwxr-xr-x 102 root root 8192 Jun 26 17:58 nas_log
drwxr-xrwt 39 root root 8192 Jun 11 17:53 nas_preview
drwxr-xr-x 13 root root 4096 Jun 2 15:14 nas_sup
drwxr-xr-x 28 root root 4096 Jan 30 16:36 nas_wap
drwxrwxrwx 147 root root 8192 Jun 27 21:19 nas_www
由于是数据共享目录,不可擅自进行操作,请联系相关研发人员进行商议,或者扩容或者清理过期数据。
5、
数据库及其它
数据库请在分析目录情况后联系DBA进行协助清理,比如hadoop和oracle ,不可擅自操作。一般为监听日志未及时清空导致。
以下目录重点关注
/home/oracle/app/oracle/diag/tnslsnr/*/listener/trace
/home/oracle/app/oracle/diag/tnslsnr/*/listener/alert
另一种情况、
df -h 查看本地磁盘没有超过阀值 却导致磁盘告警No space left on device,同时应用也无法正常启动。
使用df -i 查看inodes是否已经没有剩余。
此时多为文件数目过多,导致索引节点被用尽,需要进行文件清理。
谨记:
慎重,及时,仔细。
标签:磁盘清理
原文地址:http://9776453.blog.51cto.com/9766453/1669012