标签:
一个兼职DBA的数据库运维经验 小米科技 xx@xiaomi.com 2011
报警监控系统粒度太大,不好用(我们公司现状)
数据库状况:十个服务器,惠普HP380G7 戴尔R710 ,都做了主从
全部sas盘 15K RAID10
服务器内存24G
数据库跟业务混用,不是专门给数据库用 导致出问题(我们公司现状)
备份用的xtrabackup
数据库不大:160G 70G 30G
程序支持分库分表
--------------------------
问题
io util% 100%(学)
正常io util%应该稳定在20%~30%
磁盘await/svctm值高,经常在毫秒级(学)
问题:
raid卡电池无电(学)
买电池后,io util% 降到10%,await/svctm值在0.x毫秒级
数据数据和binlog文件分到不同磁盘(未做到)
kernel io deadline调度算法
内存 swappiness=0(学)
重视dmesg(学)
架构优化后,qps稳定在1500~2000
源码编译mysql
权限最小化,只分配CRUD权限(已经做到)
内存扩容16G->64G ,调大bp后,凌晨监控内存有余量情况下,开吃swap
解决方法1:定时 echo 1> /proc/sys/vm/drop_caches (学)
解决方法2:下次实例重启期间,numactl-interleave all (学)
执行计划不好,就直接force index
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
一个兼职DBA的数据库运维经验 小米科技 xx@xiaomi.com 2011
标签:
原文地址:http://www.cnblogs.com/MYSQLZOUQI/p/4857437.html