标签:文件 func 目录 指示 http 描述 大型 操作 硬盘离线
服务器数据恢复案例一:某研究院 DELL服务器 磁盘阵列崩溃,内置15块1TB硬盘搭建的RAID5阵列。一开始有一块硬盘离线,在更换新硬盘进行同步的过程中,第二块磁盘指示灯报警,同步失败,阵列无法正常工作。
服务器数据恢复检测:
最先离线的硬盘访问速度极其缓慢,第二块离线的磁盘有少量坏扇区,其他磁盘无明显物理问题。
服务器质逻辑状况:
整个阵列只包含一个卷组,该卷组占用阵列全部空间;并且该卷组只有一个起始位置为0扇区的XFS裸分区。
制定服务器数据恢复方案:
RAID5阵列架构在设计上只支持一块磁盘的错误冗余功能,当第二块磁盘离线后阵列便无法正常工作。根据用户描述可知,整个阵列的崩溃主要由第二块磁盘造成。所以第二块磁盘的处理是此次恢复的关键
服务器数据恢复过程:
1、对所有硬盘做只读镜像的备份,单独备份第二块离线的硬盘,备份过程中略过坏扇区。
2、对15块硬盘镜像文件进行异或测试,全部通过,无明显错误。
3、计算第二块硬盘损坏扇区位置的数据,并将其写入镜像文件。
4、在备份过程中同时分析原RAID组成结构,构建虚拟RAID环境。
5、验证RAID结构是否正确。
6、将第二块磁盘的镜像备份到新硬盘,并将其强制上线,更换第一块磁盘,并对其进行同步。(注意:在操作之前要对所有硬盘进行备份)
7、拷贝数据。
服务器数据恢复结论:
因为异或测试完全通过,所以表明该存储发生故障后没有新数据写入,或结构改动。
所以可以根据其他几块好硬盘计算出坏硬盘对应位置的数据。
恢复完成后,目录结构完整,重要文档全部完好。FSCK无任何错误提示,客户认可所恢复的数据,恢复成功。
某公司的P4500服务器raid故障,强制上线操作后raid依然不可用,该用户存储中共三组raid,两个卷,12块物理硬盘。具体情况如下:
服务器数据恢复第一步:检测物理硬盘,硬盘无故障,随后对服务器中所有磁盘进行全盘镜像并对镜像文件进行分析。底层的RAID是一个HP双循环RAID5,第一组RAID正常。第二组RAID也是RAID5,所以可以肯定第二组RAID中掉盘数量至少为2块。
服务器数据恢复第二步:使用穷举加校验的方法分析最早掉线的磁盘后踢出,重组raid。
最后将生成的数据和第一组完好的RAID一同挂载到HP-P4500服务器上。然后启动服务器,上层卷可用,检查最新文件正常,数据恢复成功。
由于技术的不断进步,不同型号的服务器出现RAID 5故障后,处理方法也不同。
现在大型应用程序的网络拓朴结构,一般都采用C/S结构或B/S结构,至少需要一台装有大型数据库的服务器安放于中心机房。基于对服务器安全性与可靠性的考虑,通常会对服务器的磁盘采用磁盘阵列RAID(Redundant Array of Inexpensive Disk)进行磁盘冗余备份。其中RAID 5阵列级别为无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,同时允许阵列中的任何一个硬盘出现故障。
实际应用中,由于某些不可避免的客观原因,可能会造成一些阵列故障。最常出现的状况就是硬盘自行脱机,联机状态显示为DDD(Defunct Disk Drive,无效磁盘驱动器),硬盘出现物理故障或逻辑故障。如果是物理故障,只有进行硬盘更换;如果是逻辑故障,可以通过有针对性的技术修复,恢复硬盘的在线状态,继续保持其原始阵列中的硬盘数据条带化分布状态,延续数据存储体系的一致性。
标签:文件 func 目录 指示 http 描述 大型 操作 硬盘离线
原文地址:http://blog.51cto.com/sun510/2146600