标签:uptime cpu top 磁盘阵列 running kill free 压力 存储
1.资源管理的命令
2.阈值是多少
3.如何定位问题(关键指标)
4.如何解决
查看命令:ps top uptime
检查项:进程总数、running队列(正在使用cpu的程序)、load值(平均负载值)、使用率
总进程数-0业务进程数(开机时候的进程)=业务进程数
cpu使用率高,进程数高
是:说明机器压力大,需要升级配置或者通过集群解决
不是:查看任务管理器中的进程,找陌生进程,不认识百度,继续综合后续指标
running 单核不超过10个
是:说明机器压力大,需要升级配置或者通过集群解决
不是:找到R队列中的进程,判断是否为恶意程序,恶意的kill,并清除相关连接
load值和使用率成正比
单核load average 接收范围3-5 ,使用率80%,多核N*100%
找到高消耗的cpu进程,判断是否为业务进程
是:说明机器压力大,需要升级配置或者通过集群解决
不是 判断是否为恶意程序,恶意的kill,并清除相
磁盘管理
查看命令 df使用率 iostat iotop
检查项 使用率 io队列长度
磁盘使用率预警线80%
超过80加磁盘清空间
队列长度2-3
检查哪个进程占用了Io,是否为恶意进程
是 找到进程kill,清除对应的文件
不是 优化IO,磁盘阵列或加存储
磁盘满了,虚拟机直接挂了
网络
查看命令 iftop
检查项 流入流出峰值
阈值:总带宽的80%
内存
查看命令 free
查看项 物理/swap使用率
阈值 80%/5%
内存使用进程 ps top
当swap出现就代表内存不够用了
标签:uptime cpu top 磁盘阵列 running kill free 压力 存储
原文地址:https://www.cnblogs.com/zx125/p/12118421.html