存储技术基础知识.pdf-得力文库

资源描述

《存储技术基础知识.pdf》由会员分享，可在线阅读，更多相关《存储技术基础知识.pdf（88页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、华普信息技术有限公司存储技术基础知识版本:1.1审批人:文档控制变更记录日期作者版本变更描述2010-02-18王守能1.0创建文档2011-07-03王守能1.1修改文档审阅人姓名职位发行拷贝号姓名地址123目录第 1 章磁盘原理与技术详解.81.1 磁盘.81.2 影响磁盘的指标.91.3 条带化的磁盘.91.3.1 条带化.101.4 同步10、异步1 0.101.5 LUN.11第 2 章 RAID技术.112.1 RAID 概述.112.2 RAID 级别.112.2.1 RAID0.112.2.2 RAID1.122.2.3 RAID2.132.2.4 RA1D3.1

2、32.2.5 RAID4.152.2.6 RAID5.152.2.7 RAID6.162.2.8 RAID-DP.172.2.9 RAID10.172.2.10 RAID01.182.2.11 JBOD.192.3 不同RA I D 级别对比.1 9第 3 章卷管理及文件系统.2 23.1 逻辑磁盘.2 23.2 卷管理.2 23.3 什么是文件系统.2 33.4 主流文件系统和特点.2 43.5 N F S和 C I F S网络文件系统工作原理和特点.2 63.6 存储系统与文件系统的关系.2 7第 4 章存储主要协议和相关技术.2 84.1 F C (FIBRE CH A N N EL

3、)协议.2 84.2 F C 适配器.2 94.3 SC SI.2 94.4 SC SI 迁移至ij F C.3 04.4.1 引入F C后的提升:.3 14.5 I SC SI.3 2第 5 章网络存储技术概述.3 35.1 概述.3 35.2 D A S：直接附加存储.3 45.3 N A S：网络附加存储.3 55.4 SA N：存储区域网络.3 75.4.1 什么是 SA N?.3 75.4.2 SA N 的误区.3 85.4.3 SA N 的组成.3 85.4.4 FC SAN 的问题.395.4.5 IP SAN.405.5 SAN 和 NAS.415.5.1 SAN 和

4、 NAS 的区分.415.5.2 SAN 和 NAS 的定位.425.5.3 SAN 与 NAS 的结合.445.5.4 IP SAN 和 NAS 的定位.44第 6 章磁盘阵列.456.1 磁盘柜、磁盘阵列.45第 7 章主机系统高可用技术.467.1 概述.467.1.1 双机热备份方式.467.1.2 双机互备份方式.517.1.3 群集并发存取方式.537.2 工作模式.557.2.1 双机热备份方式.557.2.2 双机互备方式.557.2.3 群集并发存取方式.557.3 适用场合.567.4 对存储系统的要求.56第 8 章数据一致性.578.1 数据一致性概述.578.

5、2 CACHE引起的数据一致性问题.588.3 时间不同步引起的数据一致性问题.598.4 文件共享中的数据一致性问题.59第 9 章数据复制与容灾.609.1 灾难恢复/业务连续性.609.2 数据备份系统.639.2.1 数据备份.639.2.2 数据复制.659.3 数据一致性.679.4 总结.68第 10章备份技术.6910.1 什么是备份.6910.2 备份与拷贝、归档的区别.6910.3 常规备份的实现方式.6910.4 LA N FREE 和 SERVERLESS 备份.7110.5 主流备份软件和介质.7210.6 备份技术新趋势.75第 11章存储连接设备.7811

6、.1 H B A 卡介绍.7811.1.1 FC HBA 相关知识:.7811.1.2 主要HBA卡厂商.7911.1.3 iSCSI HBA 相关知识:.7911.1.4 iSCSI HBA和TOE网卡主要厂商.8011.2 FC连接设备介绍.801 1.2.1 FC HUB 相关知识:.801 1.2.2 FC Switch 相关知识:.801 1.2.3 FC Director 相关知识:.801 1.2.4 iSCSI-FC 存储路由器.811 1.2.5 FC Switch 和FC Director 主要厂商.81第12章信息生命周期.821 2.1 什么是信息生

7、命周期.821 2.2 信息生命周期的实现.831 2.3 实现ILM的技术保障和面临的挑战.8312.4 信息生命周期管理现状.831 2.5 法规遵从与信息生命周期管理.841 2.6 与信息生命周期相关的存储技术.841 2.6.1 固定内容管理.841 2.6.2 WORM.841 2.7 怎样看待信息生命周期管理.85第13章其他存储技术及标准.851 3.1 SMI-S.8513.2 CDP（持续数据保护）.8613.3 虚拟存储.8613.4 网格计算.8713.5 高性能计算.8713.6 负载均衡.87第1章磁盘原理与技术详解1.1磁盘磁盘：磁盘被逻辑划分为磁道、柱面以及扇

8、区。1 .盘面：磁盘每一个盘片都有两个盘面，即上、下盘面，每个盘面都能利用,都可以存储数据，成为有效盘片，按从上到下的顺序从0开始依次编号，盘面号又叫磁头号。2 .磁道：磁盘在格式化时被划分为许多同心圆，这些同心圆轨迹叫做磁道。磁道从最外圈向内圈从0开始顺序编号。3 .扇区：磁道不是连续记录数据的，而是被划分成一段段的圆弧，这些圆弧角速度一样。每段圆弧叫做一个扇区，扇区从1开始编号，每个扇区中的数据作为一个单元同时读出或写入，是1 0的最小单位。扇区最小的单位是5 1 2字节。4 .柱面：所有盘面上的同一磁道，在竖直方向上构成一个圆柱，通常称作柱面。每个圆柱上的磁头由下而上从0开始编号。数据的

9、读写是按照柱面进行，即磁头读写数据时首先在同一柱面内从0磁道开始进行操作，依次向下在同-柱面的不同盘面（即磁头）上进行操作。只有在同一柱面所有的磁头全部读写完毕后磁头才转移到下一柱面，因为选取磁头只需要通过电子切换，而选取柱面则必须通过机械切换，即寻道、换道。5 .编址方式：柱面、磁头、扇区三者简称C H S,扇区的地址乂称为C H S地址。现在C H S编址方式已经不在使用，而转为L B A编址方式。L B A编址方式不再划分柱面和磁头号，这些数据由磁盘自身保留，而磁盘对外提供的地址全部为线性的地址，即 L B A 地址。所谓线性，指的是把磁盘想象成只有一个磁道，这个磁道是无限长的直线，扇区

10、为这条直线上的等长线段，从 1开始编号，直到无限远。6.1 0：磁盘读写的时候都是以扇区为最小寻址单位的，也就是说不可能往某个扇区的前半部分写入一段数据，每次磁头连续读写的时候，只能以扇区为单位。对于磁盘来说，一次磁盘的连续读或者写叫做一次1 0。1.2影响磁盘的指标i.影响磁盘性能的因素：转速，转速是影响硬盘连续i o 时吞吐量性能的首要因素。寻道速度，寻道速度是影响磁盘随机1 0 性能的首要因素。单碟容量，容量高密度就越大，在相同的转速和寻道速度条件下，会显示出更高的性能。接口速度，接口速度都已经能满足从磁盘所能达到的最高外部传输带宽。2.I 0 P S：每秒能进行多少次1 0,每次1 0

11、根据写入数据的大小，这个值也不是固定的。如果在不频繁换道的情况下，每次1 0 写入很大的一块连续数据，则此时每秒所做的1 0 次数是比较低的。如果磁头频繁换道，每次写入数据比较大的话，此时I 0 P S 应该是这块硬盘的最低数值。如果在不频繁换道的条件下，每次写入最小的数据块，比如5 1 2 字节，那么此时的I 0 P S 将是最高值。1.3条带化的磁盘-提示：一个1O操作，控制器是同时对RAID0所有的盘进行读写。控制器首先把每块硬盘要写入或者读取的数据计算好，然后由控制器同时驱动所有的硬盘同时进行读写。而不是读写完一个硬盘再读写下一个硬盘，请区分。磁盘上实实在在存在的只有扇区结构，S

12、t r i p e并不是一个实实在在的结构，它只是由程序根据算法公式现套现用的。另外，条带化之后的多块硬盘，数据是被并行写入所有磁盘的，也就是多管齐下，而不是横向写满一个条带，再写下一个条带。1.3.1条带化条带：在磁盘相同偏移处横向逻辑分割，形成S t r i p ee,条带完全是由程序在内存中虚拟出来的，说白了就是一个m a p公式。条带深度：一个条带所占用的单块磁盘上的区域，条带深度为整数倍的扇区容量。条带长度：一个条带横跨过的扇区或块的个数或字节数，就是条带长度。条带化后的写数据：条带化之后的多块硬盘，数据是被并行写入所有磁盘的,也就是多管齐下，而不是横向写满一个条带，再写下一个条带

13、。一提示：一般文件系统常用的是以4K B为一个块。如果随机小块1 0 多,则适当加大条带深度，如果连续大块1 0 多，则适当减小条带深度。1.4 同步10、异步10 同步i o：是指程序的某一个进程或者线程，如果某时刻调用了同步i o接口，则1 0请求发出后，这个进程或者线程必须等待1 0路径上的下位程序返回的信号（不管是成功收到数据的信号还是失败的信号），如果不能立刻收到下位的信号。则一直处于等待状态，不继续执行后续的代码，被操作系统挂起，操作系统继续执行其他的进程或线程。异步1 0：异步1 0请求发出后，操作系统会继续执行本线程或者进程中后续的代码，直到时间片到时或者因其他

14、原因被挂起。异步1 0模式下，应用程序的响应速度不会受到1 0瓶颈的影响，即使这个1 0很长时间没有完成。虽然应用程序得不到它要的数据，但不会影响其他功能的执行。D i r ec t 1 0:文件系统都有自己的缓存机制，增加缓存就是为了使性能得到优化。而有些应用程序，比如数据库程序，它们有自己的缓存，1 0在发出之前已经经过自己的缓存算法优化过了，如果请求1 0达到文件系统这后，又被缓存起来进行额外的优化，就是多次一举了，浪费时间又降低了性能。所以文件系统提供了另外的一种借口，就是D i r ec t 1 0接口，调用这种接口的程序，其他1 0请求、数据请求以及回送的数据将都不被文

15、件系统缓存，而是直接进入应用程序的缓存，这样提升了性能。1.5 LUN人们把硬件层次生成的虚拟磁盘，统一称为“L U N”，不管是不是在SC SI环境下，虽然LU N最初只是SC SI体系里面的一个概念。而由软件生成的虚拟磁盘，统一称为“卷”，比如各种卷管理软件、软 RA ID 软件等所生成的虚拟磁盘。第2章RAID技术2.1 RAID 概述RA ID 为廉价磁盘冗余阵列（Re d u n d a n t A r r a y o f In e x p e n s i v e D i s k s）,RA ID技术将一个个单独的磁盘以不同的组合方式形成一个逻辑硬盘，从而提高了磁盘读取的性能和数据的

16、安全性。不同的组合方式用RA ID 级别来标识。RA ID 技术是由美国加州大学伯克利分校D.A.Pa t t e r s o n 教授在1 9 8 8 年提出的，作为高性能、高可靠的存储技术，在今天已经得到了广泛的应用。2.2 RAID 级别RA ID 技术经过不断的发展，现在已拥有了从RA ID 0到 5 等 6 种明确标准级别的RA ID 级别。另外，其他还有6、7、1 0 （RA ID 1 与 RA ID 0的组合）、0 1 （RA ID0 与 RA ID 1 的组合）、30 （RA ID 3 与 RA ID 0 的组合）、50 （RA ID 0 与 RA ID 5 的组合）等。不同R

17、A ID 级别代表着不同的存储性能、数据安全性和存储成本，下面将介绍如下 RA ID 级别：0、1、2、3、4、5、6、0 1、1 0。2.2.1 RA ID 0 优点：i o 性能好，条带化之后的多块硬盘，数据是并行写入所有硬盘的也就是双管齐下，而不是横向写满一下条带再写下一个条带。缺点：没有数据冗余及安全保护机制，坏某一块盘，整个RAID0的数据全部丢失。适用于：RAID0应用于对读取性能要求较高但所存储的数据为非重要数据的情况下。RA ID 0 也称为条带化（s t r i p e）,将数据分成一定的大小顺序的写道阵列的磁盘里，RA ID 0 可以并行的执行读写操作，可以充分利用总线的带

18、宽，理论上讲，一个由N 个磁盘组成的RA ID 0 系统，它的读写性能将是单个磁盘读取性能的N 倍。且磁盘空间的存储效率最大（1 0 0%）RA ID 0 有一个明显的缺点：不提供数据冗余保护，一旦数据损坏，将无法恢复。如图所示：系统向R A I D 0 系统（四个磁盘组成）发出的I/O 数据请求被转化为 4项操作，其中的每一项操作都对应于一块物理硬盘。通过建立R A I D 0,原先顺序的数据请求被分散到四块硬盘中同时执行。从理论上讲，四块硬盘的并行操作使同时间内磁盘读写速度提升了 4 倍。但由于总线带宽等多种因素的影响，实际的提升速率会低于理论值，但是，大量数据并行传输与串行传输比较，性

19、能必然大幅提高。一提示：个IO 操作，控制器是同时对RAIDO所有的盘进行读写。控制器首先把每块硬盘要写入或者读取的数据计算好，然后山控制器同时驱动所有的硬盘同时进行读写。而不是读写完一个硬盘再读写下一个硬盘，请区分。2.2.2 R A I D 1 优点：数据冗余安全性高，一旦数据丢失，可利用备份数据及时恢复。缺点：浪费存储空间，只能使用5 0%的空间，另外的5 0%空间用于镜像。对于R A I D 1 的写1 0,速度不但没有提升，而且有所下降，因为数据要同时向多块物理盘写，时间以最慢的那个为准，因为是同步的进行。适用于：R A I D 1 应用于对数据保护极为重视的应用。R A I D

20、 1 成为镜像（m i r r o r）,它将数据完全一致的分别写到工作磁盘和镜像磁盘，因此它的磁盘空间利用率为5 0%,在数据写入时时间会有影响，但是读的时候没有任何影响，RAIDO提供了最佳的数据保护，旦工作磁盘发生故障，系统自动从镜像磁盘读取数据，不会影响用户工作。工作磁盘镜像磁盘2.2.3 R A I D 2RAID2称为纠错“汗明码 Hamming Code”磁盘阵列，阵列中序号为2N的磁盘（第 1、2、4、6）作为校验盘，其余的磁盘用于存放数据，磁盘数目越多，校验盘所占比率越少。RAID2在大数据存储额情况下性能很高，RAID2的实际应用很少，现在早已被淘汰。2.2.4 R A

21、 I D 3 优点：由于RAID3的条带深度很小，每次 1 0 总是能牵动所有磁盘为它服务，所以对于大块连续的数据读写性能优秀，。缺点：由于RAID3的每次1 0 因为条带深度小必将牵动占用所有盘，那么此时其他的并发1 0 就必须等待，所以 RAID3根本就不适合用在并发10环境。而对于随即读写的性能，RA ID 3也没有提升，和单盘一样，甚至不及单盘。适用于：RAID3适用于少量的并发1 0 环境，同时每次1 0 连续读写的大数据的操作。RAID 3 适于单一大文件以高数据率进行读写的应用，诸如超级计算机和图形图像处理。对于多用户并行发起众多互不相关磁盘操作的应用则不适宜。按照布尔逻

22、辑，数据盘的每一个位之间做XOR（与）运算，然后将结果写入到校验盘的对应位置。这样，任何一块数据盘损坏，或者其中的任何一个扇区损坏,都可以通过剩余的位和校验位一同进行XOR运算，而运算的结果就是这个丢失的位。RAID3采用一个硬盘作为校验盘，其余磁盘作为数据盘，数据按位或字节的方式交叉的存取到各个数据盘中。不同磁盘上同带区的数据做异或校验，并把校验值写入到校验盘中。RAID3系统在完整的情况下读取时没有任何性能上的影响，读性能与RAIDO 一致，却提供了数据容错能力，但是，在写时性能大为下降，因为每一次写操作，即使是改动某个数据盘上的一个数据块，也必须根据所有同一带区的数据来重新计算校验

23、值写入到校验盘中，一个写操作包含了写入数据块，读取同一带区的数据块，计算校验值，写入校验值等操作，系统开销大为增加。当RAID3中有数据盘出现损坏，不会影响用户读取数据，如果读取的数据块正好在损坏的磁盘上，则系统需要读取所有同一带区的数据块，然后根据校验值重新构建数据，系统性能受到影响。RAID3的校验盘在系统接受大量的写操作时容易形成性能瓶颈，因而适用于有大量读操作如web系统以及信息查询等应用或持续大块数据流（例如非线性编辑）的应用。一提示：般来说，RAID3的条带长度=文件系统的块大小。因为这样会使条带深度低，每次10会同时并发读写到所有盘中。2.2.5 R A I D 4RAID3的设

24、计中，一次 10尽量让每块磁盘都参与，而控制器的一次10数据块不会很大，那么想让每块磁盘都参与这个1 0,就只能人为地减小条带深度的大小。事实证明这种10设计在I0SIZE/I0PS比值很大的时候，效果的确明显。但是现实应用中，很多应用的I0SIZE/I0PS都很小，比如随机小块读写等，这种应用每秒产生的 1 0 数目很大，但是每个 1 0 所请求的数据长度却很短。如果所有磁盘同一时刻都被一个1 0 占用着，且不能并发1 0,只能一个10 一个 1 0 的来做。由于 10块长度小，此时全盘联动来传输这个1 0,得不偿失，还不如让这个10的数据直接写入一块磁盘，空余的磁盘就可以做

25、其他10 了。将 RAID3进行简单改造，增加了条带深度，于是就形成了 RAID4 0RAID4与 RAID3原理基本-致，区别在于条带深度不样，因为条带深度大，所以在写操作时只涉及两块磁盘，数据盘和校验盘，提高了系统的并发10性能。但面对随机的分散的写操作，单一的校验盘往往成为性能瓶颈。2.2.6 R A I D 5优点：RAID5在随机读方面性能出色。缺点：RAID5在写操作性能较差，其根本原因在于每写一个扇区的数据就要产生其校验扇区，一并写入校验盘，尤其是修改数据的时候，这种情况的影响尤其严重。适用于：适用于随机10读操作多的环境，RAID5在随机IOPS大的时候具有高性能。RAI

26、D5与 RAID3的机制相似，但是数据校验的信息被均匀的分散到的阵列的各个磁盘上，这样就不存在并发写操作时的校验盘性能瓶颈。阵列的磁盘上既有数据，也有数据校验信息，数据块和对应的校验信息会存储于不同的磁盘上，当一个数据盘损坏时，系统可以根据同一带区的其他数据块和对应的校验信息来重构损坏的数据。R A I D 5 可以理解为是R A I D 0 和 R A I D 1 的折衷方案。R A I D 5 可以为系统提供数据安全保障，但保障程度要比R A I D 1 低而磁盘空间利用率要比R A I D 1 高。R A I D 5具有和R A I D 0 相近似的数据读取速度，只是多了一个奇偶校验信息

27、，写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,R A I D 5的磁盘空间利用率要比R A I D 1 高，存储成本相对较低。R A I D 5 在数据盘损坏时的情况和R A I D 3 相似，由于需要重构数据，性能会受到影响。由于-R A I D 5 的条带深度比较大，每次1 0 一般只使用一块数据库盘，而且通常R A I D 5 系统一般被设计为数据块都是先放满一个S e g m e n t,再去下一个磁盘的S e g m e n t 存放。一提示：RAID5环境中，最多只能坏掉一块硬盘，不可以同时坏掉两块硬盘，否则数据丢失。2.2.7 R A I D

28、 6R A I D 6提供两级冗余，即阵列中的两个驱动器失败时，阵列仍然能够继续工作。为了增加R A I D 5 的安全性，R A I D 6 的校验盘有两块，也是将校验盘分布打算到数据盘中，在每块磁盘上放置两个数据的校验值，也就是R A I D 6 同时在一个条带上保存了两份数学上不相关的校验数据，这样能够保证同时坏两块盘的情况下，数据依然可以通过联立这两个数学关系等式来求出丢失的数据。R A I D 6 相对R A I D 5而言提高了安全性，但它的写性能更差了，因为要多读一个校验数据，而且计算后还要写入一次。一般而言，R A I D 6的实现代价最高，因为R A I D 6不仅要支持数据

29、的恢复，又要支持校验的恢复，这使R A I D 6 控制器比其他级R A I D 更复杂和更昂贵。2.2.8 R A I D-D PR A I D-D P 是由N e t A p p 公司(N e t w o r k A p p l i a n c e)所开发的一种非标准型的R A I D 等级技术(N o n-s t a n d a r d R A I D l e v e l s)。其中 D P”的意思是 ud u a l p a r i t y、d o u b l e p a r i t y 或是 d i a g o n a l p a r i t y”即双同位元”，指的是可以允许磁

30、盘阵列群组可以在同一个时间发生两个硬盘故障，避免某颗硬盘故障就使整个S A T A 硬盘系统无法作用。R A I D-D P 使用对角线双奇偶校验算法。R A I D-D P 采用的是从R A I D 4延伸的“固定式同位元”架构，效能、可靠度和延展性都比R A I D 6更理想。(R A I D 6也支援“双同位元”，由于是从R A I D 5 演化而来的“分布式同位元”架构，对处理器的运算能力要求较高，效能较差。)2.2.9 R A I D 1 0R A I D 1 0 是R A I D 1 和 R A I D 0 的结合，也称为R A I D (0+1),先做镜像然后做条带化，既提高了系

31、统的读写性能，有提供了数据冗余保护，R A I D 1 0 的磁盘空间利用率和R A I D 1 是一样的，为 5 0%。R A I D 1 0 适用于既有大量的数据需要存储，有对数据安全性有严格要求的领域，比如金融，证券等。2.2.1 0 R A I D 0 1R A I D O l 也是R A I D O 和 R A I D l 的结合，但它是对条带化后的数据进行镜像。但与 R A I D 1 0 不同，一个磁盘的丢失等同于整个镜像条带的丢失，所以一旦镜像盘失败，则存储系统成为一个R A I D-0 系统（即只有条带化）。R A I D 0 1 的实际应用非常少。2.2.1 1 J B

32、O DJ B O D (J u s t B u nd l e O f D i s k s)译成中文可以是“简单磁盘捆绑“，通常又称为S pa no J B O D 不是标准的R A I D 级别，它只是在近几年才被一些厂家提出，并被广泛采用。S pa n是在逻辑上把儿个物理磁盘一个接一个串联到一起，从而提供一个大的逻辑磁盘。S pa n上的数据简单的从第一个磁盘开始存储，当第一个磁盘的存储空间用完后，再依次从后面的磁盘开始存储数据。S pa n存取性能完全等同于对单一磁盘的存取操作。S pa n也不提供数据安全保障。它只是简单的提供一种利用磁盘空间的方法，S pa n的存储容量等于组成S pa

33、 n的所有磁盘的容量的总和。2.3不同RAID级别对比在各个r a i d 级别中，使用最广泛的是r a i d。，r a i d l,r a i d l O,r a i d 5R A I D-O,将数据分成条带顺序写入一组磁盘中。R A I D-0 不提供冗余功能，但是它却提供了卓越的吞吐性能，因为读写数据是在一组磁盘中的每个磁盘上同时处理的，吞吐性能远远超过单个磁盘的读写。R A I D-1,每次写操作都将分别写两份到数据盘和校验盘上，每对数据盘和校验盘成为镜像磁盘组。也可使用并发的方式来读数据时，提高吞吐性能。如果镜像磁盘组中某个磁盘出错，则数据可以从另外一块磁盘获得，而不会影响系统的性

34、能，然后，使用一块备用磁盘将健康磁盘中的数据复制出来然后这两块磁盘又组成新的镜像组。RAID1/0,即 RAID1与 RAIDO的结合，既做镜像又做条带化，数据先镜像再做条带化。这样数据存储既保证了可靠性，又极大地提高了吞吐性能。RAID-0/1也是RAIDO与RAID1的结合，但它是对条带化后的数据进行镜像。但与RAID10不同，一个磁盘的丢失等同于整个镜像条带的丢失，所以一旦镜像盘失败，则存储系统成为一个RAID-0系统（即只有条带化）。RAID-5是将数据校验循环分散到各个磁盘中，它像 RAID-0 一样将数据条带化分散写到一组磁盘中，但同时它生成校验数据做为冗余和容错使用。校验磁盘

35、包含了所有条带的数据的校验信息。RAID-5将校验信息轮流地写入条带磁盘组的各个磁盘中，即每个磁盘上既有数据信息又同时有校验信息，RAID-5的性能得益于数据的条带化，但是某个磁盘的失败却将引起整个系统的下降，这是因为系统将在承担读写任务的同时，重新构建和计算出失败磁盘上的数据，此时要使用备用磁盘对失败磁盘的数据重建恢复整个系统的健康。从一个普通应用来讲，要求存储系统具有良好的10性能同时也要求对数据安全做好保护工作，所以raidlO和 raid5应该成为我们重点关注的对象。下面从10性能，数据重构及对系统性能的影响，数据安全保护等方面，结合磁盘现状来分析两种技术的差异。I O 的性能：读操作

36、上raidlO和 raid5是相当的,RAID-5在一些很小数据的写操作（如比每个条带还小的小数据）需要2 个读、2 个写，还有2 个 XOR操作，对于单个用户的写操作，在新数据应用之前必须将老的数据从校验盘中移除，整个的执行过程是这样：读出旧数据，旧数据与新数据做XOR,并创建一个即时的值，读出旧数据的校验信息，将即时值与校验数据进行XOR,最后写下新的校验信息。为了减少对系统的影响，大多数的RAID5都读出并将整个条带（包括校验条带）写入缓存，执行 2 个 XOR操作，然后发出并行写操作（通常对整个条带），即便了进行了上述优化，系统仍然需要为这种写操作进行额外的读和XOR操作。小量写操作

37、困难使得RAID-5技术很少应用于密集写操作的场合，如回滚字段及重做日志。当然，也可以将存储系统的条带大小定义为经常读写动作的数据大小，使之匹配，但这样会限制系统的灵活性，也不适用于企业中其它的应用。对于 raidlO,由于不存在数据校验，每次写操作只是单纯的执行写操作。应此在写性能上raidlO要好于raid5o数据重构：对于raidlO,当一块磁盘失效时，进行数据重构的操作只是复制一个新磁盘,如果假定磁盘的容量为250G,那么复制的数据量为250Go对于 ra id 5 的存储阵列，则需要从每块磁盘中读取数据，经过重新计算得到一块硬盘的数据量，如果raid5是以4+1的方式组建，每块磁

38、盘的容量也为250G,那么，需要在剩余的4 个磁盘中读出总共是1000G的数据量计算得出250G的数据。从这点来看，ra id 5 在数据重构上的工作负荷和花费的时间应该远大于ra id lO,负荷变大将影响重构期间的性能，时间长意味再次出现数据损坏的可能性变大。数据安全保护：raidlO 系统在已有-块磁盘失效的情况下，只有出现该失效盘的对应镜像盘也失效，才会导致数据丢失。其他的磁盘失效不会出现数据丢失情况。Raid5系统在已有-块磁盘失效的情况下，只要再出现任意的一-块磁盘失效，都将导致数据丢失。从综合来看，raidlO和 raid5系统在出现一块磁盘失效后，进行数据重构时,raid5需耗

39、费的时间要比raidlO长，同时重构期间系统负荷上raid5要比raidlO高，同时raid5出现数据丢失的可能性要比raidlO 高，因此，数据重构期间，raid5系统的可靠性远比raidlO来的低。Raid5在磁盘空间率用率上比raidlO高,raid5的空间利用率是(NT)/N(N为阵列的磁盘数目)，而 raidlO 的磁盘空间利用率仅为50%。但是结合磁盘来考虑，今天的硬盘厂商所生产的ATA或 SATA硬盘的质量已经可以承担企业级的应用，并且，容量的增加幅度相当大，目前已经可以实现单个磁盘400G的存储容量。SCSI硬盘由于要求高转速而使用小直径盘片，容量的增加相对缓慢。ATA磁盘相对

40、SCSI磁盘拥有成本也要小很多。应此，在采用价格昂贵的FC或 SCSI硬盘的存储系统中，对于预算有限同时数据安全性要求不高的场合可以采用RAID5方式来折中；其他应用中采用大容量的 ATA或 SATA硬盘结合raid lO,既降低了 raidlO 的为获得一定的存储空间必须采用双倍磁盘空间的拥有成本，又避免了 raid5相对raidlO 的各种缺点。在企业应用中，raidlO结合SATA磁盘意味着一个更好的选择。第3章卷管理及文件系统音图马达永磁铁空气过滤片主输（马达电机与轴承在其下方）3.1 逻辑磁盘逻辑磁盘是由R A I D 卡进行划分的，每个逻辑盘对O S 来说都人称一块单独的物理磁盘

41、，这里不要和分区搞混，分区是O S 在一块物理磁盘上做的再次划分。R A I D 卡可以针对总线上的某儿块磁盘做一种R A I D 类型，然后针对另外的儿种磁盘做另一种R A I D 类型。一种R A I D 类型中包含的磁盘共同组成一个R A I D G r o u p,简称R G。逻辑盘就是从这个R G 中划分出来的，原则上逻辑盘不能跨R G 来划分。3.2 卷管理卷管理器V o l u m e M a n a g e r,是在操作系统层面，将 O S 识别到的物理磁盘（可以是真正的物理磁盘，也可以是经过R A I D 卡虚拟化的逻辑磁盘）进行组合，并再分配的软件。比如：在Win2000中

42、引入的动态磁盘，就是和Veritas公司合作开发的一种VM,称为LDM(逻辑磁盘管理)。Veritas 自己的产品 Veritas Volume Manager(VxVM)广泛用于 Linux、AIX、HP-Unix 系统的 LVM(Logical Volume Manager)用于 Sun Solaris 的 DiskSuite这些V M 的实现方法大同小异，只不过细节方面有些差异罢了，这里需要重点讲一下L V M,因为它的应用非常普遍。L V M开始是在L i nu x 系统中的一种实现，后来被广泛应用到了 A I X 和 H P-U ni x 等系统上。P V：L V M将操作系统识别到

43、的物理磁盘或者R A I D 控制器提交的逻辑磁盘叫做物理卷(P h y s i cal V o l u me)。V G：多个P V 可以被逻辑地放到一个V G 中，也就是V o l u me G r o u p 卷组。V G是一个虚拟的大存储空间，逻辑上是连续，尽管它可以由多块P V 组成，但是 V G会将所有的P V 首尾相连，组成一个逻辑上连续编址的大存储池，这就是V G。P P：P h y s i cal P ar t i t i o n物理区块，在逻辑上再将一个V G 分割成连续的小块(把一大盘面掰成大小相等的无数块小面团块)。注意，是逻辑上的分割，而不是物理上的分割。L P：P

44、P 可以再次组成L P,即L o g i cal P ar t i t i o n逻辑区块。逻辑区块是比较难理解的一个东西，一个L P 可以对应一个P P,也可以对应多个P PO前者对应后者没什么区别。后者又分两种情况，一种为多个P P 组成一个大L P,像 R A I D 0 一样;另一种是一个L P 对应几份P P,这几份P P 每一份内容都一样，类似于R A I D 1,多个 P P 内容互为镜像，然后用一个L P 来代表它们，往这个L P 写数据，也就是同时写入了这个L P 对应的几份P P 中。L V：若干L P 再经过连续组合组成L V (L o g i cal V o l u m

45、e,逻辑卷)，也就是L V M所提供的最终可用来存储数据的单位。生成的逻辑卷，在主机看来还是和普通磁盘一样，可以对其进行分区、格式化等。L V M看起来很复杂，其实操作起来很简单。创建P V,将 P V 加入V G,在 V G 中再创建L V,然后格式化这个L V,就可以当做一块普通硬盘使用了。容量不够了，还可以任意扩展。L V M 个最大的好处就是生成的L V 可以跨越R A I D 卡提交给O S的物理磁盘(实际是R A I D 卡虚拟的逻辑盘)。3.3什么是文件系统文件系统定义了把文件存储于磁盘时所必须的数据结构及磁盘数据的管理方式。我们知道，磁盘是由很多个扇区(S e cto r)组成

46、的，如果扇区之间不建立任何的关系，写入其中的文件就无法访问，因为无法知道文件从哪个扇区开始，文件占多少个扇区，文件有什么属性。为了访问磁盘中的数据，就必需在扇区之间建立联系，也就是需要一-种逻辑上的数据存储结构。建立这种逻辑结构就是文件系统要做的事情，在磁盘上建立文件系统的过程通常称为“格式化”。以W i n do w s平台下最常见的FA T文件系统为例。FA T文件系统有两个重要的组成部分：FA T表(Fi le A llo cati o n T able)和数据存储区。FA T表是FA T文件系统的名称来源，它定义了存储数据的簇(C lus te r,由2的n次方个S e cto r组

47、成,n值根据分区大小而定，需综合考虑数据存取效率和存储空间的利用率)之间的链接关系，这种链接关系是一个单向链表，指向O x FF表示结束。依据一个簇编号所用bi t数的不同，可分为FA T 1 2、FA T 1 6和FA T 32文件系统。数据区存储的数据包含文件目录项(D i r e cto r y E n tr i e s)和文件数据。文件目录项存储的是一个文件或目录的属性信息，包括文件名称(把目录也看成是文件)、读写属性、文件大小、创建时间、起始簇编号等，一个目录下的每个子目录和文件都对应一个表项记录。文件目录项以固定32字节的长度存储，以树型结构管理，其中根目录的位置是确定的。也就是

48、说，根据分区根目录可以找到下级子目录和文件的起始簇编号，根据下级子目录又可以找到更下级目录或文件的起始簇编号。可见，FA T表和文件目录项是为了文件的访问和管理而建立的。应用程序要访问一个文件时，根据文件路径(逻辑分区号+目录，如F:s o f tw ar e)和文件名称(如s e tup.e x e)可从文件目录项中获得存储文件数据的起始簇号，之后从FA T表查询这个簇号对应的链表，就可以获得该文件对应的全部簇编号。从这些簇中读出全部数据，就得到一个完整的文件。一般来说，文件系统是和操作系统紧密结合在一起的，不同的操作系统使用不同的文件系统，但有时为了兼容，不同操作系统也使用相同

49、的文件系统。3.4主流文件系统和特点在W i n do w s系列操作系统中,M S-D O S和W i n do w s 3.x使用FA T 1 6文件系统,默认情况下W i n do w s 9 8也使用FA T 1 6,W i n do w s 9 8和W i n do w s M e可以同时支持FA T 1 6,FA T 32两种文件系统,W i n do w s N T则支持FA T 1 6、N T FS两种文件系统,W i n do w s2 0 0 0可以支持FA T 1 6、FA T 32、N T FS三种文件系统.每一种文件系统提供的功能与特点各不相同。比如F AT 3

50、2文件系统。，采用3 2位的文件分配表，磁盘的管理能力大为增强。但由于文件分配表的增大，性能相对来说有所下降。此外，这个版本的文件系统不能向下兼容。N T F S是随着W i n d o w s N T操作系统而产生的，它的优点和F AT文件系统相比是有更好的安全性和稳定性，在使用中不易产生文件碎片，N T F S分区对用户权限作出了非常严格的限制，同时它还提供了容错结构日志，从而保护了系统的安全。但N T F S分区格式的兼容性不好，W i n d o w s 98/M E操作系统均不能直接访问该分区。对于超过4 G B以上的硬盘，使用N T F S分区，可以减少磁盘碎片的数量，大大

展开阅读全文