服务器数据恢复案例 / raid5阵列多块硬盘离线处理方法

时间：2018-07-18 15:17:12 阅读：194 评论：0 收藏：0 [点我收藏+]

服务器数据恢复案例一：

某研究院 DELL服务器磁盘阵列崩溃，内置15块1TB硬盘搭建的RAID5阵列。一开始有一块硬盘离线，在更换新硬盘进行同步的过程中，第二块磁盘指示灯报警，同步失败，阵列无法正常工作。
服务器数据恢复检测：
最先离线的硬盘访问速度极其缓慢，第二块离线的磁盘有少量坏扇区，其他磁盘无明显物理问题。
服务器质逻辑状况：
整个阵列只包含一个卷组，该卷组占用阵列全部空间；并且该卷组只有一个起始位置为0扇区的XFS裸分区。
制定服务器数据恢复方案：
RAID5阵列架构在设计上只支持一块磁盘的错误冗余功能，当第二块磁盘离线后阵列便无法正常工作。根据用户描述可知，整个阵列的崩溃主要由第二块磁盘造成。所以第二块磁盘的处理是此次恢复的关键
服务器数据恢复过程：
1、对所有硬盘做只读镜像的备份，单独备份第二块离线的硬盘，备份过程中略过坏扇区。
2、对15块硬盘镜像文件进行异或测试，全部通过，无明显错误。
3、计算第二块硬盘损坏扇区位置的数据，并将其写入镜像文件。
4、在备份过程中同时分析原RAID组成结构，构建虚拟RAID环境。
5、验证RAID结构是否正确。
6、将第二块磁盘的镜像备份到新硬盘，并将其强制上线，更换第一块磁盘，并对其进行同步。(注意：在操作之前要对所有硬盘进行备份)
7、拷贝数据。
服务器数据恢复结论：
因为异或测试完全通过，所以表明该存储发生故障后没有新数据写入，或结构改动。
所以可以根据其他几块好硬盘计算出坏硬盘对应位置的数据。
恢复完成后，目录结构完整，重要文档全部完好。FSCK无任何错误提示，客户认可所恢复的数据，恢复成功。

服务器数据恢复案例二：

某公司的P4500服务器raid故障，强制上线操作后raid依然不可用，该用户存储中共三组raid，两个卷，12块物理硬盘。具体情况如下：
技术分享图片
服务器数据恢复第一步：检测物理硬盘，硬盘无故障，随后对服务器中所有磁盘进行全盘镜像并对镜像文件进行分析。底层的RAID是一个HP双循环RAID5，第一组RAID正常。第二组RAID也是RAID5，所以可以肯定第二组RAID中掉盘数量至少为2块。
服务器数据恢复第二步：使用穷举加校验的方法分析最早掉线的磁盘后踢出，重组raid。
最后将生成的数据和第一组完好的RAID一同挂载到HP-P4500服务器上。然后启动服务器，上层卷可用，检查最新文件正常，数据恢复成功。

服务器数据恢复案例总结：

由于技术的不断进步，不同型号的服务器出现RAID 5故障后，处理方法也不同。
现在大型应用程序的网络拓朴结构，一般都采用C/S结构或B/S结构，至少需要一台装有大型数据库的服务器安放于中心机房。基于对服务器安全性与可靠性的考虑，通常会对服务器的磁盘采用磁盘阵列RAID(Redundant Array of Inexpensive Disk)进行磁盘冗余备份。其中RAID 5阵列级别为无独立校验磁盘的奇偶校验磁盘阵列，采用数据分块和独立存取技术，能在同一磁盘上并行处理多个访问请求，同时允许阵列中的任何一个硬盘出现故障。
实际应用中，由于某些不可避免的客观原因，可能会造成一些阵列故障。最常出现的状况就是硬盘自行脱机，联机状态显示为DDD(Defunct Disk Drive，无效磁盘驱动器)，硬盘出现物理故障或逻辑故障。如果是物理故障，只有进行硬盘更换;如果是逻辑故障，可以通过有针对性的技术修复，恢复硬盘的在线状态，继续保持其原始阵列中的硬盘数据条带化分布状态，延续数据存储体系的一致性。

服务器数据恢复案例 / raid5阵列多块硬盘离线处理方法

标签：文件 func 目录指示 http 描述大型操作硬盘离线

原文地址：http://blog.51cto.com/sun510/2146600

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行