科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道拿什么拯救你?我的RAID! 数据修复学问大

拿什么拯救你?我的RAID! 数据修复学问大

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

RAID是英文Redundant Array of Independent Disks缩写,翻译成中文是"独立磁盘冗余阵列"。

作者:CNET科技资讯网 2007年8月29日

关键字:

  • 评论
  • 分享微博
  • 分享邮件

RAID是英文Redundant Array of Independent Disks的缩写,翻译成中文意思是"独立磁盘冗余阵列",有时也简称磁盘阵列(Disk Array)。简单地说,RAID是一种把多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术。

组成磁盘阵列的不同方式成为RAID级别。数据备份的功能是在用户数据一旦发生损坏后,利用备份信息可以使损坏数据得以恢复,从而保障了用户数据的安全性。在用户看起来,组成的磁盘组就像是一个硬盘,用户可以对它进行分区,格式化等等。总之,对磁盘阵列的操作与单个硬盘一模一样。不同的是,磁盘阵列的存储速度要比单个硬盘高很多,而且可以提供自动数据备份。

我们使用RAID的目的就是利用磁盘空间的冗余实现数据容错,当磁盘出现故障的时候能够确保数据的安全。不过这一切都是在所有的磁盘或卷没有任何问题的前提下实现的,也就是说必须保证冗余磁盘或卷的正常运转。

当RAID卷中的单个磁盘出现故障后,尽管数据可能暂时不会受到威胁,但是磁盘冗余已经不复存在了。此时,任何不当的操作,都可能毁掉已经存放的数据。因此,在充分享受RAID所带来的存储好处时,还应该想到它危险的一面。比如现在最常用的RAID5,在一块硬盘发生故障后,RAID组从"Online"变为"Degraded"方式,I/O读写不受影响,直到故障盘恢复。但是,如果"Degraded"状态下,又有第二块盘故障,整个RAID组的数据将丢失。

RAID 0代表了所有RAID级别中最高的存储性能,但它不提供数据冗余,可靠性最差,一旦损坏,数据将无法得到恢复。其次,正如一些业内人士所言,RAID技术在实验室里的成熟并不代表真正应用的成熟,真正应用起来,仍然还会遇到意想不到的问题,比如突然断电、重新配置RAID阵列,都可能造成RAID磁盘阵列卡信息的丢失,用户的错误操作(如误删除、误格式化、误分区、误克隆、病毒损坏等)都会导致数据的丢失。

一旦RAID阵列出现故障,硬件服务商只能给客户重新初始化或者重建,这样客户数据就会无法挽回,工作就无法正常地进行。一旦出现RAID数据灾难,对于企业来讲可能会丢失关键的信息,是比较严重的数据灾难。在RAID出现故障的时候,为了最大程度地保护数据,只有及时修复故障才能保证冗余的存在,而对于丢失的数据,数据修复是比较理想的手段。知名的数据修复机构国家信息中心数据修复中心结合实际磁盘阵列的修复经验,给出了常见的磁盘阵列错误:

磁盘阵列出错

磁盘阵列出错的具体原因有阵列卡损坏、阵列卡电池电力耗尽、槽口控制芯片损坏等。这类情况的数据恢复率相当高,但也有失败的案例。比如,板载的控制程序出错,发生大规模混乱的数据读写(误Rebuild等操作)是相当危险的。当发生阵列卡损坏时,随意更换新的阵列卡极易造成磁盘ID号紊乱。

系统故障

当发生系统故障甚至是系统崩溃时,一些用系统自带功能(Ms windows,Unix,Linux,Sun solaris等)创建的磁盘阵列或者用第三方软件(Disk management,Veritas disk management等)组建的磁盘阵列会发生数据丢失。此时,阵列日志和相关记录是相当重要的,如果您有详细的系统日志甚至是阵列组合信息备份, 修复的成功率就会大大提高。

磁盘故障

虽然有的磁盘阵列容许1至2块硬盘故障而数据不丢失。然而由于管理不善和服务器相对稳定的特性对管理者造成麻痹,发生超出允许数量坏硬盘的事故屡屡发生(Raid-5损坏两块硬盘)。一旦RAID阵列出现故障,硬件服务商只能给客户重新初始化或者REBUILD,这样客户数据就会无法挽回。

谈到RAID修复,国家信息中心数据修复中心负责人叶红说:"RAID问题表面看起来是一个硬件故障,但是,RAID修复以软件类操作为主,是一个比较复杂的修复过程。只有专业的数据修复企业,修复RAID故障的成功率才会高。我们对RAID 0、RAID 1、RAID 5以及组合型的RAID系列磁盘阵列数据恢复具有丰富的实践经验,出现故障以后只要不对阵列作初始化操作,我们就有能力恢复出故障阵列的数据。"

由于一些用户对RAID问题的严重性认识不足,一旦出了故障,就会寻找集成商的售后服务工程师来尝试解决问题,但是,由于服务工程师的经验和技术重在硬件方面,对于RAID的数据修复认识不充分,往往会采用一些常规的方法,尝试修复。然而,大部分的结果是导致最终数据彻底破坏,无法进行修复。此外,即便是简单的检验性操作,也有可能为后期的数据恢复带来不便。

以普通RAID 5恢复为例,当硬盘损坏超过容错能力时,必须将损坏硬盘的镜像完全提取才能进行最终的恢复。而如果频繁对硬盘上电,很容易造成磁头进一步疲劳损伤,甚至划伤盘片。因此,"术业有专攻"的重要性便体现出来了。国家信息中心数据修复中心对RAID系列磁盘阵列方面具备丰富的实战经验和娴熟的操作技术。

比如,不久前国家信息中心数据修复中心对国内一家知名的航空公司的RAID故障进行了成功修复。该公司的一台服务器,由于错误操作被格式化,数据顷刻之间便消失了。该服务器采用的是RAID 5的工作方式,由5块146G的硬盘组成的阵列。

国家信息中心数据修复中心的数据修复专家,在符合数据修复标准的洁净间里分别对每块硬盘进行镜像,不在原盘进行操作,避免造成二次破坏。通过对RAID信息的诊断和分析,发现是由软件故障引起的误操作,最终,仅仅用了两天的时间,就帮客户找回了丢失的数据。

对于大部分的企业用户而言,已经在大量地使用RAID技术进行数据的存储。目前,除了等待RAID技术的不断完善,用户需要关注RAID的风险,一旦出现RAID故障,不要对RAID进行任何操作,然后,咨询技术过硬、修复率高的数据修复公司,把数据丢失的风险降到最小。

数据修复不仅仅考虑技术和服务质量,更重要的还要考虑修复成功数据的保护。对于一些涉密单位、重要行业以及政府机构,许多数据都是机密的。一旦遇到RAID问题,首先考虑的不仅仅是数据修复成功率,更重要的是要考虑数据的保密性和安全性。而国家信息中心是首批获得国家涉密数据修复资质的单位,具备非常高的可信度。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章