众志和达:磁盘阵列技术
导读:众志和达(SOUL):磁盘阵列技术
关键词:soul
"磁盘阵列",或说是"硬盘数组",或是 "磁盘数组",在今天,相信已经不再是那么令人感到陌生了.因为在这几年来,网络以及服务器之成长迅速,相随的对资料之安全性,也更加重视和要求.固然,每日的磁带或其它媒体方式的备份仍然重要,但对于硬盘故障后的恢复间隔,也希望在可接受范围内,得到最大的缩短. 此时最好的方案,则非磁盘阵列莫属.因为磁盘阵列的优点:具有单一大容量的好处,提供了硬盘容错功能,易于管理的优点。
磁盘阵列又叫RAID(Redundant Array of Inexpensive Disks LD廉价磁盘冗余阵列),是指将多个类型、容量、接口,甚至品牌一致的专用硬磁盘或普通硬磁盘连成一个阵列,使其能以某种快速、准确和安全的方式来读写磁盘数据,从而达到提高数据读取速度和安全性的一种手段。因此,磁盘阵列读写方式的基本要求是,在尽可能提高磁盘数据读写速度的前提下,必须确保在一张或多张磁盘失效时,阵列能够有效地防止数据丢失。磁盘阵列的最大特点是数据存取速度特别快,其主要功能是可提高网络数据的可用性及存储容量,并将数据有选择性地分布在多个磁盘上,从而提高系统的数据吞吐率。另外,磁盘阵列还能够免除单块硬盘故障所带来的灾难后果,通过把多个较小容量的硬盘连在智能控制器上,可增加存储容量。磁盘阵列是一种高效、快速、易用的网络存储备份设备。
RAID的分类
以下就几项基本的名词作一分项解释.
|
数组种类 |
英文简述 |
硬盘容错吗? |
N颗硬盘 可用容量 |
|
RAID level 0 |
Stripe / Span |
No |
N |
|
RAID level 1 |
Mirror |
Yes |
N÷2 |
|
RAID level 3 |
Parallel with Parity |
Yes |
N?D1 |
|
RAID level 4 |
Parallel with Parity |
Yes |
N?D1 |
|
RAID level 5 |
Striped with Rotating Parity |
Yes |
N?D1 |
|
RAID level 0+1 |
Mirror + Stripe |
Yes |
N÷2 |

RAID level 0
这个代号是被定义为非容错的硬盘群组.而组构的多颗硬盘机,被依一定的切割区段,连贯成一颗大容量的数组硬盘.它没有同位检核的位,所以无法救回因其中任一硬盘故障而毁损的整个资料。
这是最有效率的一种数组类别,因为资料可以多个区段方式,在同一时间,将之分别存放在该群所有数组硬盘里.在读取资料时,亦可在同一时间,由该群所有数组硬盘送出资料至数组控制器.换言之,此种数组类型的效率,是与该群内数组硬盘数成正比.所以在读写强而集中的应用领域 (如:影音播放系统),可藉 RAID level 0 得到较佳的输出效率及品质。

RAID level 1
就是"磁盘镜像" Disk Mirroring. 它可将两颗硬盘机为一组,在有资料欲写入时,在同一时间将之存放在本组的两颗硬盘中,所以在同"镜像对" Mirrored Pair 中的两硬盘,其内部资料是完全一样的.而在读取资料时,则可自两颗硬盘同时读出,即使是来自不同的客户端所提出之不同读取要求。
这一型式的磁盘阵列,不但不会降低写入的速度,更能提高读取的效率.事实上,它是容错型式的磁盘阵列中,效率最高的.不过其硬盘机的容量利用率,则只有实际容量的一半.所以, RAID level 1 常应用于高安全要求的多人使用环境,例如:操作系统磁盘 OS Disk

RAID level 0+1
这是一种Dual Level RAID, 也有人称之为RAID level 10. 这可不是"十",它是"零加一",亦即是两组依一定的切割区段,连贯成不同的两颗大容量的数组硬盘,互相为"镜像".在每次写入数据,磁盘阵列控制器会将资料同时写入该两组"大容量数组硬盘组"内。
同RAID level 1 一样,虽然其硬盘使用率亦只有50%,但它却是最具高效率的规划方式.真理:真正的"安全性"加"速度"是建立在成本上的

RAID level 3
这种规划方式,常用在绘图,影像处理,…等,对资料进行大量读或写的应用领域.它由数组控制器内建的XOR逻辑,根据切割之区段大小,计算出同位检核位或字节.这项功能,提供了资料容错效果.而这个区段的大小,是以bit或byte为单位。
每项资料中的同位检核资料,统一存放在一特定的同位碟(Parity Disk)上.而资料则是分别散存在各资料碟Data Disk内.单从少部份的资料碟,是无法取得完整原资料的。

RAID level 4
跟上述的level 3 大部份相同.不过其支持的区段大小相当多样,是以block为单位计算的.它可以是单一block为区段,也有以多个block为区段大小.所以有些资料是可以从某资料碟中取得,这促成一个较RAID level 3 势的是:允许"重叠读取" Overlapped Read Operation.
但是在作写入时,因为需同时更新"同位碟"的信息,所以不具有"重叠写入"的能力.换言之,在同时间中多笔资料要求写入时,因为每笔资料之同位信息需写在同一颗"同位碟"中,所以并不会有任何速度的优势。
所以在一般使用多人数据库, RAID level 4 是较不适合的规划.但是在如:计算机绘图,非线性剪接,动画处理,数字图书馆, 等用途上,这样的规划,却是最佳的选择。

RAID level 5
通常亦为"轮转同位型数组" Rotating Parity Array. 它和RAID level 4 一样的,在每次的写入前,由数组控制器内建的XOR逻辑,根据切割之区段大小(单一或多个block为单位),计算出同位检核信息.每项资料中(以Stripe为单位)的同位检核资料,随着资料分别散存在各数组硬盘内,没有特定同位碟.相较于上述RAID level 4, 这个型式可允许多个写入,因为这多个写入动作时,同位信息是置在不同的数组硬盘中。
相关存储术语
SCSI
就是Small Computer System Interface(小型计算机系统接口),它最早研制于1979,是为小型机研制出的一种接口技术,但随着电脑技术的发展,现在它被完全移植到了普通PC上。
ATA(AT嵌入式接口)
即俗称的IDE,设计该接口的目的就是为了将1984年制造的IBM AT计算机中的总线直接与结合在一起的驱动器和控制器相连。ATA中的“AT”就来源于首次使用ISA总线的IBM AT计算机。
ATA从最早的ATA-1开始,已经经历了从ATA-1、ATA-2、ATA-3、Ultra ATA、Ultra ATA/33、Ultra ATA/66、Ultra ATA/100、Ultra ATA/133的发展历程。
Serial ATA(串行ATA)
采用的是串行数据传输方式,每一个时钟周期只传输一位数据。ATA硬盘一直都采用并行传输模式,线路间的信号会互相干扰,在高速数据传输过程中,影响系统的稳定性。由于串行传输方式不会遇到信号串扰问题,所以要提高传输速度只需要提高工作频率即可。Serial ATA只需4线电缆。
SATA采用的是点对点的传输方式,使得用户在使用SATA硬盘时不再需要设置硬盘的主从盘,而直接每个硬盘对应一个数据通道直接连接系统。SATA1.0的标准规定,硬盘的接口传输速率为150MB/s,SATA可扩展到2X和4X的规格,相应的传输速率则分别提升至了300MB/s和600MB/s。SATA硬盘还可以实现热插拔功能,不过目前为止还没有操作系统支持这项功能,人们还要等到微软的下一代操作系统Windows Longhorn面世后才能享受到这项功能带来的便利。
NAS(Network Attached Storage-网络附加存储)
即将存储设备通过标准的网络拓扑结构(例如以太网),连接到一群计算机上。NAS是部件级的存储方法,它的重点在于帮助工作组和部门级机构解决迅速增加存储容量的需求。
DAS(Direct Attached Storage-直接附加存储)
是指将存储设备通过SCSI接口或光纤通道直接连接到一台计算机上。DAS产品包括存储器件和集成在一起的简易服务器,可用于实现涉及文件存取及管理的所有功能。
SAN(Storage Area Network-存储局域网络)
通过光纤通道连接到一群计算机上。在该网络中提供了多主机连接,但并非通过标准的网络拓扑。SAN专注于企业级存储的特有问题,主要用于存储量大的工作环境。
Array:阵列
磁盘阵列模式是把几个磁盘的存储空间整合起来,形成一个大的单一连续的存储空间。RAID控制器利用它的SCSI通道可以把多个磁盘组合成一个磁盘阵列。简单的说,阵列就是由多个磁盘组成,并行工作的磁盘系统。需要注意的是作为热备用的磁盘是不能添加到阵列中的。
Array Spanning:阵列跨越
阵列跨越是把2个,3个或4个磁盘阵列中的存储空间进行再次整合,形成一个具有单一连续存储空间的逻辑驱动器的过程。RAID控制器可以跨越连续的几个阵列,但每个阵列必需由相同数量的磁盘组成,并且这几个阵列必需具有相同的RAID级别。就是说,跨越阵列是对已经形成了的几个阵列进行再一次的组合,RAID 1,RAID 3和RAID 5跨越阵列后分别形成了RAID 10,RAID 30和RAID 50。
Cache Policy:高速缓存策略
RAID控制器具有两种高速缓存策略,分别为Cached I/O(缓存I/O)和Direct I/O(直接I/O)。缓存I/O总是采用读取和写入策略,读取的时候常常是随意的进行缓存。直接I/O在读取新的数据时总是采用直接从磁盘读出的方法,如果一个数据单元被反复地读取,那么将选择一种适中的读取策略,并且读取的数据将被缓存起来。只有当读取的数据重复地被访问时,数据才会进入缓存,而在完全随机读取状态下,是不会有数据进入缓存的。
Capacity Expansion:容量扩展
在RAID控制器的快速配置工具中,设置虚拟容量选项为可用时,控制器将建立虚拟磁盘空间,然后卷能通过重构把增加的物理磁盘扩展到虚拟空间中去。重构操作只能在单一阵列中的唯一逻辑驱动器上才可以运行,你不能在跨越阵列中使用在线扩容。
Channel:通道
在两个磁盘控制器之间传送数据和控制信息的电通路。
Format:格式化
在物理驱动器(硬盘)的所有数据区上写零的操作过程,格式化是一种纯物理操作,同时对硬盘介质做一致性检测,并且标记出不可读和坏的扇区。由于大部分硬盘在出厂时已经格式化过,所以只有在硬盘介质产生错误时才需要进行格式化。
Hot Spare:热备用
当一个正在使用的磁盘发生故障后,一个空闲、加电并待机的磁盘将马上代替此故障盘,此方法就是热备用。热备用磁盘上不存储任何的用户数据,最多可以有8个磁盘作为热备用磁盘。一个热备用磁盘可以专属于一个单一的冗余阵列或者它也可以是整个阵列热备用磁盘池中的一部分。而在某个特定的阵列中,只能有一个热备用磁盘。
当磁盘发生故障时,控制器的固件能自动的用热备用磁盘代替故障磁盘,并通过算法把原来储存在故障磁盘上的数据重建到热备用磁盘上。数据只能从带有冗余的逻辑驱动器上进行重建(除了RAID 0以外),并且热备用磁盘必须有足够多的容量。系统管理员可以更换发生故障的磁盘,并把更换后的磁盘指定为新的热备用磁盘。
Hot swap Disk Module:热交换磁盘模式
热交换模式允许系统管理员在服务器不断电和不中止网络服务的情况下更换发生故障的磁盘驱动器。由于所有的供电和电缆连线都集成在服务器的底板上,所以热交换模式可以直接把磁盘从驱动器笼子的插槽中拔除,操作非常简单。然后把替换的热交换磁盘插入到插槽中即可。热交换技术仅仅在RAID 1,3,5,10,30和50的配置情况下才可以工作。
I2O(Intelligent Input/Output):智能输入输出
智能输入输出是一种工业标准,输入输出子系统的体系结构完全独立于网络操作系统,并不需要外部设备的支持。I2O使用的驱动程序可以分为操作系统服务模块(operating system services module,OSMs)和硬件驱动模块(hardware device modules,HDMs)。
Initialization:初始化
在逻辑驱动器的数据区上写零的操作过程,并且生成相应的奇偶位,使逻辑驱动器处于就绪状态。初始化将删除以前的数据并产生奇偶校验,所以逻辑驱动器在此过程中将一并进行一致性检测。没有经过初始化的阵列是不能使用的,因为还没有生成奇偶区,阵列会产生一致性检测错误。
IOP(I/O Processor):输入输出处理器
输入输出处理器是RAID控制器的指令中心,实现包括命令处理,PCI和SCSI总线的数据传输,RAID的处理,磁盘驱动器重建,高速缓存的管理和错误恢复等功能。
Logical Drive:逻辑驱动器
阵列中的虚拟驱动器,它可以占用一个以上的物理磁盘。逻辑驱动器把阵列或跨越阵列中的磁盘分割成了连续的存储空间,而这些存储空间分布在阵列中的所有磁盘上。RAID控制器能设置最多8个不同容量大小的逻辑驱动器,而每个阵列中至少要设置一个逻辑驱动器。输入输出操作只能在逻辑驱动器处于在线的状态下才运行。
Logical Volume:逻辑卷
由逻辑磁盘形成的虚拟盘,也可称为磁盘分区。
Mirroring:镜像
冗余的一种类型,一个磁盘上的数据在另一个磁盘上存在一个完全相同的副本即为镜像。RAID 1和RAID 10使用的就是镜像。Parity:奇偶校验位
在数据存储和传输中,字节中额外增加一个比特位,用来检验错误。它常常是从两个或更多的原始数据中产生一个冗余数据,冗余数据可以从一个原始数据中进行重建。不过,奇偶校验数据并不是对原始数据的完全复制。
在RAID中,这种方法可以应用到阵列中的所有磁盘驱动器上。奇偶校验位还可以组成专用的奇偶校验方式,在专用奇偶校验中,奇偶校验数据可分布在系统中所有的磁盘上。如果一个磁盘发生故障,可以通过其它磁盘上的数据和奇偶校验数据重建出这个故障磁盘上的数据。
Snapshot:快照
快照(Snapshot)是静态映像(Frozen Image)的备份技术,是一种保留某一时刻文件系统映像的技术,其核心是对备份和恢复过程采取“即时”(point-in-time)数据拷贝的方式。Snapshot可以很快的产生多个当前数据的快照,这些快照可用于数据备份,数据分析,数据恢复,以及提供给其它程序数据等。与备份软件系统、镜像软件系统相比,它具有自己的特色:如可以避免大数据量备份时长时间无法提供服务的问题,可以实现数据的即时恢复,实时数据分析等特有功能。
Power Fail Safeguard:掉电保护
当此项设置为可用时,在重构过程中(非重建),所有的数据将一直保存在磁盘上,直到重构完成后才删除。这样如果在重构过程中发生掉电,将不会发生数据丢失的危险情况。
网友评论
暂时没有评论!- 相关文章
-
- 北京众志和达公司多职位诚待有识之士2006-07-06 17:44:09
- SureSave 系列磁盘库拥有更好的性能和适应性2006-07-06 17:26:00
- 众志和达:某市电力信息系统企业备份方案2006-07-06 17:18:59
- 众志和达解决方案概述2006-03-08 18:04:44
- 众志和达:异地容错典型案例2006-03-08 18:03:17
- 众志和达:磁盘阵列SAN解决方案2006-03-08 18:02:33
- 众志和达:HA案例(Windows 、Solaris 平台)2006-03-08 18:02:04
- 众志和达:某报社LAN-FREE案例2006-03-08 18:01:36






发表评论