标签:警告 集群 ado href 生效 版本 def 系统 led
HP DL380G9 iLO降级(Degrated)及存储失败(storage Failed)报错如何处理??Lander Zhang 专注外企按需IT基础架构运维服务,IT Helpdesk 实战培训践行者
http://blog.51cto.com/lander
2018/09/7 7:30
问题描述
某沙特公司搭建的虚拟化环境中有一台ESXi主机报Storage Fialed警告但是仍能正常运行,通过iLO登陆主机后发现System Health: Critical, iLO Heath: DegradedStorage Failed :
点击 System Health 看到提示 Storage: Failed:
点击 Failed 查看具体情况: logical Driver 01 - Failed 逻辑磁盘状态失败;Physical Driver OK 物理磁盘状态是好的。
点击 iLO 看到提示 Controller Firmware revsion 2.10 Embeded media manager failed initialization:
问题分析
客户采用的是传统虚拟化架构,使用EMC共享存储虚拟机,主机上只安装了ESXi,标配2块SAS 300G硬盘做了RAID1。与客户IT沟通澳洲公司之前也发生类似的问题,后来把服务器的BIOS固件升级到最新就解决问题了。与DELL售后联系回复说这是两个问题,他们之间没有必然联系要分开来解决。
问题1:iLO的报错,可以尝试升级服务器BIOS到最新版本看问题是否解决。
问题2:Storage Failed,从报错看可能是有人重新插拔了硬盘导致磁盘阵列出问题了,可能需要备份数据然后重建RAID。
解决方法
1.客户IT下载并升级BIOS到最新,我们再次查看时Storage报错依旧,iLO的报错信息变化为 Controller firmware revision 2.10.00 NAND write fuilure :
2.升级BIOS没有生效,尝试重启主机看是否能解决问题:
2.1 将主机置于维护模式:登陆vCenter,右击故障主机 - Enter Maintainace Mode :
勾选 Move powered off and suspended virtual machines to other hosts in the cluster - Yes :
勾选这个选项后自动将这台主机上所有虚机转移到其他集群的主机上:
看到故障主机已经处于维护模式下了,这种模式下主机不参与虚拟环境下的HA等高级功能特性:
2.2 通过iLO远程控制台登陆故障主机,关闭ESXi系统:
Remote Console - Launch -Run :
输入ESXi主机用户名和密码登陆ESXi主机:
按F11重启主机:
2.3 重启后显示两条报错,无法继续启动系统,同时F10的功能禁用没有显示出来:
Embeded RAID1 : ......
338-HPE RESTful API Error - Unable to communicate with iLO FW. BIOS configuration resources may not be update-to-date.
Action: Restore Manufacturing Defualts in RBSU.
2.4 致电DELL被告知需要首先排除iLO的故障然后再处理Storage的故障。对于iLO当前错误提示,尝试关机放电操作,如果还是不行,可能需要更换主板。
关机放电操作步骤:在控制台里关闭电源 - 拔掉所有外接电源线 - 静置5分钟彻底放电 - 再连上电源线开机 - 启动后iLO报错消失,F10选项出现 - iLO故障解决:
3.解决Storage报错。
3.1 在2.4步骤下,按 F10:
等待初始化网络并自动会跳过:
选择 Perform Maintenance :
Smart RAID/HBA Controllers - Smart Array P440ar - Configure :
Controller Devices - Logical Devices - Logical Driver 1 - Re-enable Failed Logical Drive - Yes - Finish :
重新修复失败的阵列,如果修复成功就不需要重建RAID,ESXi主机就不用重装安装了。
点击 X - OK 退出配置界面:
点击右上角电源按钮在弹出的对话框中选择 Reboot :
系统重启在BIOS界面,按 F11 选择启动项:
不手动选择的话,默认先从PXE IPv4 IPv6等启动,然后反复这样就是不能自动从RAID1上的逻辑盘上启动。
选择 Embeded RAID 1: ...... :
至此ESXi顺利启动到正常运行状态:
4.登陆到vCenter查看,故障主机已经恢复正常:
如果文档对你有用,烦请转发分享!
HP DL380G9 iLO降级Degrated及存储失败storage Failed报错如何解决?
标签:警告 集群 ado href 生效 版本 def 系统 led
原文地址:http://blog.51cto.com/lander/2171453