zhy 发表于 2011-12-15 23:51:45

RAID故障现象与常见RAID故障原因

本帖最后由 军达成技术支持1 于 2015-10-9 00:39 编辑

1、阵列柜报警
   一般磁盘阵列卡都有检测功能,如果磁盘出现问题会自动报警,在盘柜面板上显示黄灯或者红灯,称为磁盘掉线(Offline)。当系统数据出现问题时客户可一根据提示判断是那块磁盘出现问题。
2、无法进入系统
在服务器开启过程中会对硬件进行检查,如果阵列无法正常识别,如果系统是安装在阵列中的,则会提是无法找到系统常见提示是 Operating System not found,或是Disk Boot Failure Insert SystemAnd Press Enter
3、文件系统无法挂载
这种问题主要出现在非Windows系统中,即Linux,Unix服务器经常出现这种问题。在使用mount命令时出错。
4、分区丢失
   在Windows操作系统,或使用逻辑卷管理的Linux和UNIX系统中经常出现分区信息丢失的情况。
5、部分文件丢失
在各类文件系统中都会发生部分目录变空,文件丢失
常见RAID故障原因
1、阵列卡损坏、阵列卡电池电力耗尽、槽口控制芯片损坏
2、磁盘硬件故障(包括 坏道和 磁盘损坏)
阵列中的磁盘如果有坏道的话,会导致磁盘掉线或阵列不稳定,这时应尽早将有坏道的硬盘换掉,如果出现多坏硬盘有坏道的话,阵列将可能瘫痪。
3、断电或意外关机
4、扩容失败或扩容过程中意外中断
目前很多阵列都支持不破坏数据直接扩容,但是这种操作十分危险,在扩容的过程中如果出现意外情况,比如说,突然断电,硬盘有坏道等,数据是很难恢复的。
5、操作系统的check disk
Windows,Linux,Unix等操作系统都有自己的一个硬盘检测程序,当你硬盘中的分区或文件出现问题无法正常读取的时候,操作系统就会在重启的时候去自动运行Check disk去试图修复,这时,如果是阵列的检验出现问题而导致分区或文件出错的话,运行Check disk将有可能破坏阵列中数据。
6、文件目录混乱,部分或全部文件无法访问
这种情况是由于阵列中某块硬盘的数据是不正确的,导致校验出错,其实并不是文件本身的问题。这时如果重启系统的话,操作系统会对这个分区做Check disk,注意不要让系统做Check disk。
7、RAID盘序错误
客户会对磁盘进行清理,但回放磁盘时盘序错误导致数据丢失。
8、其他自然原因
雷击,静电等



yI首简单歌 发表于 2023-7-27 11:05:13

学习学习,感谢分享。
页: [1]
查看完整版本: RAID故障现象与常见RAID故障原因