一文搞懂:“世界备份日“聊聊不同RAID有什么区别?

摘要

如果你接触电脑的时间足够久,一定会遇到在某次大扫除中从犄角旮旯里翻出光盘,甚至一张 3.5 寸软盘的有趣经历。

​如果你接触电脑的时间足够久,一定会遇到在某次大扫除中从犄角旮旯里翻出光盘,甚至一张 3.5 寸软盘的有趣经历。这些早已淘汰不用的或方或圆的存储介质中,一定还保存着「人类早期驯服数据」的有趣纪录。没错,数据需要及时备份也是颠扑不破的话题。美国网络社区 Reddit 甚至发起倡议活动,建议将愚人节前一天 3 月 31 日作为「世界备份日」,提醒大家只有傻瓜才会忘记备份数据。

生活在信息时代的我们,其实每天都在跟海量的数据打交道,至少运营商每天都在发短信提醒我套餐剩余流量。也许你会说,数据不就在电脑和手机里摆着么?但是只需一杯不小心倾倒的奶茶,你平时不在意的重要文件资料,就会迅速毁于一旦。而我们逃避这种焦虑的最好方式,不是忽略它,而是及时对数据做备份。

简单的数据备份,我们平时都会用到。小到一颗 U 盘,就能够让你家庭电子相册的安全系数加倍。但是随着我们需要存储的文件越来越多,又或者是在工作中要随时保存和读取重要文件,相信很多人都选择了云盘、NAS、甚至小型服务器的方式。当然还有更适合中小型企业直连的 DAS(直连式存储)。但其实说到底,他们用到的存储备份技术大同小异,至少这个词你应该不陌生——RAID。

1988 年美国加州大学的 D. A. Patterson 教授首次提出了 RAID 的概念,起先,RAID(Redundant Array of Inexpensive Disks)的官方说法是「便宜的冗余磁盘阵列」。这样一个怪称呼诞生,主要是因为在当时,大容量磁盘价格非常昂贵。因此如何利用好多块容量小、成本易控制的磁盘组合,获得与大容量硬盘相当的容量、性能以及可靠性,成为了一个非常关键的课题。

RAID 这种新思路一经推出,就被业界吸纳,快发展出一批高性能、高可靠性的新存储技术,并且时至今日都一直在广泛应用。如今 RAID 中「I」的含义已经不再是「Inexpensive 便宜的」,而变成「Independent 独立的」;RAID 天团也已经从当初 D. A. Patterson 教授论文中定义的 RAID 1 到 RAID 5「五小强」,扩展出了 RAID 0、RAID 6、RAID 7,甚至是 RAID 10/01、RAID 50、RAID 53、RAID 100。那这些听起来好像在不断「升级」的 RAID,彼此之间有什么关系?不同的 RAID 对我们到底有哪些帮助?

首先我们厘清一下概念。RAID 其实是对一类「多磁盘管理技术」的统称,我们一般简称为「磁盘阵列「。磁盘阵列利用物理存储空间区隔的方式,为我们备份数据的冗余信息。一旦某个磁盘或访问路径出现故障,冗余信息就可以快速帮助用户恢复已故障存储中保存的数据。这也就是 RAID 最常见的用处——日常备份与恢复数据。而不同的 RAID 等级,彼此之间更多的是方式不同,而非优劣之差。通常 RAID 0 到 RAID 6 这七个等级,被默认是标准的 RAID 等级,因为他们中包含了最基本也是最常用的 RAID 配置。

RAID 0RAID 1

首先 RAID 家族里有一个著名的混子——RAID 0,甚至 RAID 0 都不算是一种真正的 RAID 方式。RAID 0 实现起来最简单,因为它其实是把不同硬盘组合成了一个「大硬盘」,例如一块 2TB 硬盘和 4TB 硬盘组了 RAID 0 会怎样?答案是会变成了一块 6TB「大硬盘」,这块硬盘容量增大了,但是本身不具备任何备份功能。适用于同性能级别硬盘混用且对数据安全性要求不高的应用场景。至于为什么 RAID 0 能够成功混入其中,这还要归功于它可以提升硬盘阵列的读写速度,理论上可以实现直接×N 的效果。因此 RAID 0 也成为一种很常见的 RAID 方式。

RAID 1 也很简单,数据在 RAID 1 中是以「1+1」的方式存在,两块硬盘此时就互为备份,一块出了问题,另一块可以随时顶上,此时我们只需要更换故障盘就可以了。RAID 1 的好处是组阵列的方式简单,缺点是对容量不友好。因为两款 1TB 的硬盘组成 RAID 1,实际的可用空间也仅有 1TB。看起来十分不科学,但其实 RAID 1 确实非常保险的备份方式,适合服务器、数据库这类对安全性要求很高的应用场景。但相比 RAID 0,RAID 1 的缺点则是并不能提升磁盘阵列的读写性能。

RAID 2

RAID 2 相较两位兄长,就来的高级了一些。它使用了「海明码」实现数据校验冗余。海明码的优点是具备纠错能力,复杂程度不算高。缺点是这种纠错方式本身并不算高明,因为数据在 RAID 2 中是按位存储,4 位数据需要 4 个数据硬盘,16 位数据就需要 16 个数据硬盘。很显然,这种组合方式非常不灵活,因此在日常使用中我们很少见到 RAID 2 这种形式的磁盘阵列。

RAID 3RAID 5

相比 RAID 2「一是一,二是二」的磁盘阵列方式,RAID 3 和 RAID 5 显然就更灵活了,因为无论是何种数据,他们都仅需要最少 3 块硬盘就能实现了。其中 RAID 3 中有一块专门的硬盘作为校验盘(RAID 2 也用到了校验盘),用来存放单独的奇偶校验信息。当其中某块硬盘出问题,可以通过另一块正常工作的数据盘,加上校验盘的计算重构,恢复故障盘中所有数据。因此理论上 RAID 3 非常适合对存储介质价格比较敏感的家庭应用场景,日常可以用来存放一些视频素材、流媒体素材等等,素材量巨大的视频和其他视觉创意工作者,都建议直接选择 RAID 3 做日常数据的备份。

RAID 5 和 RAID 3 的区别在于,RAID 5 这种阵列方式,没有专用的校验硬盘。RAID 5 阵列的校验数据是随机分布在所有磁盘中的。RAID 5 的优缺点都很突出,优点在于它具备非常好的灵活性和扩展性——RAID 5 中可以随时增加阵列硬盘的数量,甚至 RAID 5 还可以模拟 RAID 3 方式运行,而且理论上 RAID 5 可以实现(N-1)的读取速度提升,因此非常适合作为高码率流媒体播放使用的存储阵列;缺点则是 RAID 5 是一种介于 RAID 0 和 RAID 1 之间的折中方案,对硬盘的利用率和 RAID 3 相当,都是 N-1。

RAID 4

RAID 4 原理上面和 RAID 3 一脉相承,只不过校验方式略有不同。但就是这说大不大说小不小的区别,却让 RAID 4 相比前两者应用限制更多。RAID 4 采用了统计数据块使用相同 XOR 校验的形式。在读取时可以实现即使校验,也就是不影响读取性能。但是写入时只能单盘进行,而且要同时写入校验数据,因此校验盘的写入速度,就很容易成为整个阵列的性能瓶颈(这也是 RAID 3 存在的问题,但 RAID 3 的组合方式更加灵活,因此应用场景更广泛)。目前主流存储产品中很少见到 RAID 4 这种备份方式。

RAID 6

看到这里的小伙伴可能有个大大的疑惑,前面提到的 RAID 等级,貌似只能保护单块硬盘出现故障的情况。因为一旦两块数据盘同时发生故障,整个阵列依然会数据崩溃。那么这时候就轮到 RAID 6 出场了。RAID 6 首次引入了双重校验的概念,也就是阵列中畸变发生两个数据盘同时失效的情况,整个阵列依然可以保障数据安全。同时 RAID 6 也是在 RAID 5 思路基础上出现的一种「加强级」方案,可以看作 RAID 5 的等级扩展。当然代价是,RAID 6 至少需要 4 块硬盘组合(N-2 构成备份),往往适合对数据安全等级要求极高的应用场景。

RAID 10

除了以上的 RAID「七兄弟」,还有一种非常常见的 RAID 方式——RAID 10,也有人把它称作 RAID 01。因为 RAID 10 其实是 RAID 0 和 RAID 1 的组合。先将硬盘两两构建 RAID 1 备份,再通过 RAID 0 的方式构建扩展。因此使用效率和安全性方面。RAID 10 结合了 RAID 0 和 RAID 1 的优缺点,安全的同时硬盘使用率仅有一半,但由于组合方式比较简单,因此适合安全和效率需折中的应用场合,比如金融业、电影创作等领域。同理,之前提到的 RAID 50、RAID 53、RAID 100 这些大数字 RAID,同样是以上七种常用 RAID 方式的有机组合。但除了 RAID 10 外,其它几种 RAID 等级实现起来成本更高,因此也就并不常见了。

下面也为大家总结一个无脑选择法:

追求大容量,不考虑数据安全=RAID 0;

不追求大容量,考虑数据安全=RAID 1;

即要大容量,又要数据安全,大文件存储为主=RAID 3;

即要大容量,又要数据安全,小文件存储为主=RAID 5;

数据安全性要求更高=RAID 6。

了解了以上的 RAID 等级,你也就明白了为什么常见的 NAS 分成了双盘位、四盘位和六盘位三种。双盘位只适合散装以及 RAID 0、RAID 1,四盘位则在 RAID 0、RAID 1 之外,增加了对 RAID 3 和 RAID 5 的支持,扩展性和 RAID 灵活性,相比双盘位就提升了一个等级。至于六盘位,那显然是为更高安全性的 RAID 6 和更大容量而设计的。

众所周知,高性能和高可靠性的西部数据 WD Red 系列,一直是 NAS 用户的极佳选择。此前我们也评测了 WD Red SN700 NVMe SSD 这款高性能 SSD,但对大量 I/O 密集型工作负载的用户,大容量、高性能、高安全性的 WD Red SN700,无疑是构建 NAS 高速缓存的极佳选择。

WD Red SN700 NVMe SSD

最近,针对单盘大容量存储需求,西部数据又推出了 WD Red Pro 20TB HDD,借助 9 个 ePMR(能量辅助垂直磁记录)盘片,在 3.5 英寸体积内塞入了夸张的 20TB 容量。并且西部数据 WD Red Pro 20TB 采用了西部数据的 OptiNAND 技术,通过 iNAND UFS 嵌入式闪存驱动器 (EFD) 提供更高的性能、可靠性和容量。参数方面,西部数据 WD Red Pro 20TB 采用 SATA 接口,标配 512MB 缓存,转速为 7200RPM,拥有快至 268 MB/s 的优秀读取性能。对于追求极限单盘容量的小伙伴,WD Red Pro 20TB 显然是很好的选择。

WD Red Pro 20TB HDD

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。