内核报错、CPU工作不正常、硬盘故障、业务扩展导致性能出现瓶颈……..这些都是运维工程师们的噩梦。怎样积极、有效地预防故障的发生?如何主动提高运维可靠性?在性能危机出现时,怎样化解?所有这些问题,在风云互联的“零感知”在线迁移解决方案中,都能找到答案。
在线迁移是什么?
Live Migration (在线迁移)是指将一台虚拟机从其所在物理机无缝地转移到另一台物理机的过程。
哪些场景下会用到在线迁移?
场景一:
在物理机发生内核报错、CPU工作不正常等底层基础设施故障时,管理员可以将虚拟机迁移到状态正常的物理机上,提前预防更恶劣的故障发生,比如机器彻底宕机。
场景二:
物理机硬盘故障,尽管云服务商往往使用了多副本的存储方式保障可靠性,即某块盘坏了另一块能够继续服务。但是坏盘送修往往有一定的时间窗口,在这段时间内将关键业务在线迁移走也是一种更为安全的选择。
场景三:
云计算服务商存在批量采购新机器,以及淘汰旧有机器的现象,可能某次采购之后,机器资源池有富余,这时候可以将老用户的机器均匀迁移到新机器上,以便提升性能。
场景四:
用户的某些机器上承载的业务发生变化,负载持续过高,性能下降,可以联系云计算服务商进行主动迁移。
场景五:
共享块存储服务(EBS)大大降低了在线迁移的成本,对用户来说,在上层业务暂时没有做到高可用性的情况下,可以通过将数据存在云端,底层快速保障就绪这种方式来提高可用性。
为什么风云互联的在线迁移方式被称为“零感知”?
传统情况下,在数据迁移的过程中,用户的业务会被迫中断,因此被称为“冷迁移”。相反,风云互联采用了“热迁移”方式,整个过程中,不关机不断网,用户业务始终不会中断。同时,无需运维介入,风云互联能够替用户选择迁移路径及时间点,并进行高效的集中式运维管理。因此无论从业务角度,还是运维角度,风云互联的迁移方案对用户来说,都是“零感知”的。
风云互联正在不断迭代,试图在更严峻的环境下,为用户提供真正“零感知”的在线迁移解决方案,从而大幅度提高云服务的可靠性,并降低运维的依赖性。这样靠谱的云,你值得拥有!
原文地址:http://11645851.blog.51cto.com/11635851/1786702