分布式奇偶校验的独立磁盘结构(也就是我们称之为的raid 5)数据恢复有一个“奇偶校验”概念需要理解。我们可以把它简单的理解成为二进制运算中的“异或运算”,通常使用的标识是xor。这个用运算的规则就是若二者值相同则结果为0,若二者结果不同则结果为1。
不要盲目强行上线
Offline指示灯提示时要求用户更换一个完好的相同硬盘,并且重新校验算法。RAID5磁盘阵列很可能同时采购的多个硬盘中,有几个已经出现了不稳定现象。而服务器的Offline提示可能并不是最准确的,经常会误报(也有硬盘不稳定的因素)或是遗漏其它也同样存在隐患的硬盘。强制上线过程中硬盘需要进行大量的读写操作,一旦其它硬盘突然掉线则数据恢复难度加大。所以在强制上线前要检测每一个硬盘的稳定性情况,这样才更加保险。
保护好第一现场
对于厂商而言,硬件设备才是售后服务的主要宗旨,因此往往为尽快确保硬件设备完好反而牺牲了数据。据数据恢复中心的主管工程师介绍,因为寻×××商的售后服务工程师修复而导致最终数据彻底破坏的案例几乎每个星期都会发生。毕竟售后服务工程师基本都偏向于硬件,而RAID数据恢复则是以软件类操作为主。此外,即便是简单的检验性操作,也有可能为后期的数据恢复带来不便。当raid硬盘损坏超过容错能力时,必须将损坏硬盘的镜像完全提取才能进行最终的恢复。而如果频繁对硬盘上电,很容易造成磁头进一步疲劳损伤,甚至划伤盘片。正确的处理方法应当是立即咨询专业数据恢复服务商。
选择专业数据恢复中心
在选择数据恢复服务商时公司规模、技术水平、工程师团队、业界内的口碑都是需要考量的重要指标。
Raid磁盘阵列数据恢复案例背景:
出现故障的raid阵列在更换磁盘后进行了数据同步,此时删除了VG信息,数据同步中止。运维人员将备份的VG信息导入后RAID是一个新的RAID阵列,一般而言数据一旦同步则新的raid阵列将同步为空白磁盘,数据不可恢复。值得庆幸的是厂家技术人员为了安全,关闭了数据同步功能,正是此操作才挽救了此数据,否则服务器的数据将遭受到不可逆的损坏。客户在多家北京的数据恢复公司中进行比较 后选择了北亚数据恢复中心。
Raid磁盘阵列数据恢复步骤
1.将服务器磁盘阵列中所有的磁盘单独镜像到北亚数据恢复中心的安全存储中,后将不再操作原盘,保证用户磁盘的原始性。
2.分析底层结构,重构原始RAID,虚拟重组RAID,再次镜像到北亚数据中心的临时存储中。
3.使用北亚数据恢复中心自主研发的 VMWare ESX 数据恢复软件: Frombyte Recovery For ESX 进行恢复
4.能正常看到所有的数据后将恢复好的存储挂到北亚数据恢复中心的 ESXi 服务器上,验证所有数据。
Raid磁盘离线过程描述
服务器中有8组Mdisk,其中一组Mdisk中有一块硬盘故障离线,在热备盘启用并替换过程中,同组Mdisk中的另一块硬盘也故障离线,导致热备盘同步失败,该组Mdisk失效,从而导致整个通用卷无法使用。
服务器磁盘阵列数据恢复方法:
1.我通过镜像软件对每一块磁盘都进行镜像操作,后期所有的数据恢复工作将在镜像盘上进行,原始磁盘始终保持原始状态,不影响数据。目的主要是为防止数据恢复过程中发生误操作情况,一旦操作失误将导致原盘数据的二次破坏,后期数据恢复难度将更大。
2.分析并重组Mdisk,首先根据客户提供的一部分配置信息,把硬盘按照Mdisk组进行分类。将每一组Mdisk中的所有硬盘都进行分析,从而得到相关的raid信息。使用专业的数据恢复软件进行Mdisk的虚拟重组。
3.对所有Mdisk进行分析,得到pool的相关信息。使用专业的数据恢复软件虚拟重组出pool。
4.掉盘分析。由于raid5的固有特性我们知道raid5最多能允许一块成员盘离线,也就是说如果有一块成员盘发生故障的情况下,raid5还可以正常使用。所以可以结合之前存在raid失效的情况判断当时有两块盘发生故障。
在对各成员盘中的底层数据进行分析后发现,有两块硬盘,在硬盘前部的数据完全一样,则判断两块盘中一块硬盘为热备盘,另一块硬盘为故障盘。
据此可以初步推断,raid中有一块成员盘先发生故障,在热备盘进行同步的过程中,另一块成员盘也发生故障,导致raid失效。后raid恢复正常时,由于先发生故障的硬盘上的数据已经不是最新的,所以正常后的raid中的数据出现部分错误。
5.对硬盘的raid结构与成员盘的掉盘情况分析完成后,使用专业数据恢复软件完成对Mdisk和pool的组建,并生成其中的数据。
服务器raid5磁盘阵列不同故障的数据恢复方法列举和raid磁盘阵列分析
原文地址:http://blog.51cto.com/sun510/2088578