首页
Web开发
Windows程序
编程语言
数据库
移动开发
系统相关
微信
其他好文
会员
首页
>
其他好文
> 详细
破除虚拟化运维困境---假如时间能倒回
时间:
2020-05-14 10:56:51
阅读:
61
评论:
0
收藏:
0
[点我收藏+]
标签:
虚拟化
通过
存储
紧急
排查
云端
内存
导致
原来
在日常虚拟化运维中,运维人员时不时会遇到突发的故障,而故障是怎么发生的、在什么时间点、因何而发生的,往往是困扰运维人员的难题。假如时间能倒回,回到故障发生的时间点,看清是什么导致的故障,那运维人员排查故障时将会轻松很多。西南某省某医疗云数据中心就遇到过类似的问题
西南某省某医疗云数据中心,承载着省内各大医院云端的业务系统。一日,运维团队收到某医院反馈:业务系统当天上午忽然中断,又在十几分钟后自动恢复。虽然十几分钟的中断时间不长,但正值门诊高峰,严重影响了医院系统的正常运行。数据中心的运维团队紧急排查,必须找出业务中断的原因。
但业务中断后又自动恢复,这种故障如何排查?还好有明辰智航云安的时间回溯功能。
1. 突发故障,业务中断又恢复
医院反馈,业务是在当天上午忽然中断,而又在十几分钟后自动恢复,时间不长,却严重影响了医院系统的正常运行。
2.将时间回溯到业务中断的时间
运维人员通过明辰智航云安时间回溯功能将时间调整到业务中断的时间段内,云安界面完整呈现出那十几分钟的系统状态,
3.通过云安界面查找业务中断根本原因
界面显示存储版块红色示警,点击鼠标,进一步查看原因,是存储读写延迟严重超标,最终导致的业务中断。而又是什么导致在那十几分钟内存储读写延迟呢?原来,在那个时间,某业务系统厂家运维工程师做了删除虚机快照的操作,而同时VMware会在删除快照后自动进行虚拟磁盘合并,导致大量读写发生,进而虚机发生了迁移并重启。
业务中断的原因找到了!谁也没想到一次不经意的操作会引发医院系统的业务中断,但如果没有明辰智航云安的时间回溯,那可能真会成为一个不解的谜团。
明辰智航云安的时间回溯功能,可将系统时间调至前一个小时、前一天、前一周等特定时间,运维人员可轻松查看任意时间段的系统状态和数据,系统运行时好时坏的故障再也不怕找不到原因。
破除虚拟化运维困境---假如时间能倒回
标签:
虚拟化
通过
存储
紧急
排查
云端
内存
导致
原来
原文地址:https://blog.51cto.com/14724023/2494910
踩
(
0
)
赞
(
0
)
举报
评论
一句话评论(
0
)
登录后才能评论!
分享档案
更多>
2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)
周排行
更多
分布式事务
2021-07-29
OpenStack云平台命令行登录账户
2021-07-29
getLastRowNum()与getLastCellNum()/getPhysicalNumberOfRows()与getPhysicalNumberOfCells()
2021-07-29
【K8s概念】CSI 卷克隆
2021-07-29
vue3.0使用ant-design-vue进行按需加载原来这么简单
2021-07-29
stack栈
2021-07-29
抽奖动画 - 大转盘抽奖
2021-07-29
PPT写作技巧
2021-07-29
003-核心技术-IO模型-NIO-基于NIO群聊示例
2021-07-29
Bootstrap组件2
2021-07-29
友情链接
兰亭集智
国之画
百度统计
站长统计
阿里云
chrome插件
新版天听网
关于我们
-
联系我们
-
留言反馈
© 2014
mamicode.com
版权所有 联系我们:gaon5@hotmail.com
迷上了代码!