|
RAID(Redundant Array of Inexpensive Disks)就是我们平常所说的磁盘阵列。可以把RAID理解成一种使用磁盘驱动器的方法,它将一组磁盘驱动器用某种逻辑方式联系起来,作为逻辑上的一个磁盘驱动器来使用。一般情况下,组成的逻辑磁盘驱动器的容量要略小于各个磁盘驱动器容量的总和。RAID的具体实现可以靠硬件也可以靠软件,Windows NT操作系统就提供软件RAID功能。
磁盘阵列不仅可以提高数据的安全性,而且还可以提高整体磁盘系统的数据传输率。本来磁盘RAID仅用在服务器系统中,现在,RAID也用在PC机中了。RAID包括三种不同的模式,其中分为RAID 0、RAID 1和RAID 0+1。
RAID 0模式(stripe/磁盘阵列)
它可以把数据分散到多块硬盘上进行存贮,在进行数据存取时,能同时对这几个磁盘进行存贮访问,通过并行存贮访问来提高磁盘的整体数据传输速度。而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍、几十倍的速率,这也是RAID最初想要解决的问题。
简单的说,RAID 0采用多硬盘来提高读写性能的,RAID 0模式时数据会交叉地对硬盘上的数据进行存取。例如,外接两个同样大的硬盘,采用 8 KB的阵列(数据块), 当数据传输到硬盘时,RAID控制器将数据分成8 KB的数据单块,并将每个偶数数据块写到一个硬盘,同时将奇数数据块写到另外一块硬盘上,并发操作,双倍地提高了读写效率。
要注意的是,其中对于单个磁盘来说,它的数据传输率却并未提升。因为RAID 0不具有数据冗余功能,所以不能提高数据的安全性。RAID 0模式下可以使用的磁盘总空间相当于组成阵列的两块磁盘的容量之和。如果其中任何一块硬盘出现问题,整个系统都将无法使用。
在使用RAID 0方式的磁盘阵列时,大家应该使用同样型号和容量的硬盘。如果硬盘型号和容量不同的话,一块的速度比另外一块慢很多的话,会损失很多性能的,因为较快的硬盘会慢下来等待较慢的硬盘做完工作。
另外,RAID 0阵列的容量大小由阵列中最小容量的硬盘决定的。总的阵列容量就等于这个最小磁盘容量乘以磁盘的个数。例如,要阵列3个 1 GB硬盘和一个10 GB硬盘,那么阵列的总容量大小就只有 4 GB (最小容量的磁盘 = 1 GB, 乘 4 个硬盘= 4 GB), 那个10GB硬盘所剩下的 9 GB就不能被利用了。这就是这种方式下需要相同硬盘的另一个原因:避免浪费硬盘容量。
RAID 1模式(镜像模式)
它能够自动对数据进行备份,提高数据的完整性和安全性。RAID 1主要是通过将一块硬盘中的数据完整复制到另外一块硬盘实现数据的冗余。每一个磁盘驱动器都有一个镜像磁盘驱动器,镜像磁盘驱动器随时保持与原磁盘驱动器的内容一致。
例如:两块 5 GB硬盘做成一个阵列将看起来像一个 5 GB的硬盘。当数据写入一块硬盘时,RAID控制器同时地将同样的数据写到另外一块硬盘上。结果,第二块硬盘就完全成了第一块硬盘的镜像。一旦第一块硬盘损坏,第二块硬盘将自动接管操作--特别是适合于安全性要求很高的场合下的应用。在这些特别的场合,要用到多个备份。一个 RAID 1 阵列可用四个(或更多)硬盘来设置,为其中一个硬盘做成3个之多的冗余备份!
RAID1具有最高的安全性,但只有较少的磁盘空间被用来存储数据,这是以损失另外一块硬盘的容量为代价的。它主要用在对数据安全性要求很高,而且要求能够快速恢复被损坏的数据的场合。虽然RAID 1可以加强数据安全性,但是速度却有所降低。这是因为RAID 1需要对同一数据进行两次读写,分别写入到两块硬盘之中。当保存文件时,数据被同时复制到两块硬盘上。这样,即使其中一块硬盘损坏,整个系统仍然可以继续正常使用,不会出现任何问题。
同样,在是使用RAID镜像时,可用的磁盘容量依然是等于最小硬盘的容量。使用 1 GB和10 GB来做RAID 1阵列是愚蠢的,整个阵列的容量只有 1 GB的容量,10GB上有9GB不能被使用。这一点上,也说明最好需要同样容量大小和同样性能的硬盘做 RAID 1阵列。
RIAD 0/1模式
它是对上述两种不同模式的结合,可以同时支持磁盘阵列和磁盘镜像,这样既可以提升速度又可以加强数据的安全性。RAID 0/1模式需要使用4块硬盘,总空间相当于4块硬盘容量总和的一半。例如,如果我们使用4块20GB的硬盘,那么实际可用空间为40GB。4块硬盘两两组成一组,所有的文件和数据都会被一次性写入每组磁盘中,并且在磁盘组之间建立带集。
硬件RAID VS 软件RAID
在目前来说,在PC机中使用磁盘RAID模式还比较少,但在服务器系统中,磁盘RAID模式就显得非常必要了。磁盘RAID系统的整体高数据传输率,特别是它的数据冗余安全性,是服务器能正常安全工作的必要条件。当然随着时代的发展。在PC机系统中使用磁盘RAID模式将会越来越多。
目前RAID技术大致分为两种:基于硬件的RAID技术和基于软件的RAID技术。这两种技术都将在近期成为性能比较适中的产品,并联用户提供可行的数据保护措施。
其中基于硬件的RAID解决方案比基于软件RAID技术在使用性能和服务性能上稍胜一筹,具体表现在检测和修复多位错误的能力、RAID保护的可引导阵列、错误磁盘自动检测、剩余空间取代和阵列重建、共有的或指定的剩余空间和彩色编码报警等许多方面优于后者。另外,还提供从单一控制实施的对多RAID安装、多操作系统远程检测和管理的能力。
从安装过程来看,两种RAID解决方案的安装过程都比较容易,安装耗时也相差无几。从CPU占有率来看,基于硬件的RAID显然能够减少CPU的中断次数,同时降低主PCI总线的数据流量。从而是系统的性能产生一个提升。从I/O占用角度考虑,两种解决方案的差别并不算很大。基于硬件的RAID方案仅在下列两方面有一定优势;减少RAID5阵列在降级模式的运行时间;平行引导阵列的能力。另外,在硬件解决方案中,可以采用RAID0/1 取代RAID1来提高性能。尽管基于硬件的RAID 方案具有优势,但在产品的价格上仍然无法与基于软件的RAID抗衡--后者完全免费。不过,硬件解决方 案的价格也不是不可接受,一般只需增加少许投资即可获得一套基于硬件入门级RAID解决方案。而基于软件的RAID解决方 案也不是分文不花,至少还需购置一块SCSI卡。因此,在计算总体拥有成本是,必需考虑基于软件的RAID解决方案的隐性成本,如用户生产效率、管理成本和重新配置的投资等等。这些成本的综合往往会超过购买一套基于硬件的RAID解决方 案所需投资。
在当今企业环境中,任务密集型数据以应用于各种商业活动。为了使自己的数据获得更好的保护,许多企业已经开始利用RAID技术。一套优秀的RAID解决方 案意味着可行性、友好的用户界面和简单的热键,总之应使用第一次使用的用户也能够非常方便的运行系统。同时还需要具有更加详细的功能,以方便那些高级用户对他们的RAID进行优化配置。企业在选择RAID 解决方案时,如果不考虑初始投资和某些I/O资源的占有,或是出于对某些远程集体性能上的优势是基于软件的RAID技术无法比拟的。
在软件RAID 中不能提供如下功能:
硬盘热拔插
硬盘热备用
远程阵列管理
可引导阵列支持
在硬盘上实现阵列配置
硬盘温拔插
SMART硬盘支持
SCSI与IDE接口的比较
我们从SCSI与IDE最基础的对比开始。虽然从硬件的安装上看,两种驱动器的安装方法几乎是相同的:例如一个内置驱动器,首先要将驱动器装在一个槽位上,连接上数据线和电源,然后设置跳线(短路帽,JUMPER)。但是他们有一些特点是截然不同的。
几乎每一种PC机都支持IDE设备,典型的是连接在主板上。当安装一个SCSI设备时,如果你的系统本身没有SCSI接口,首先要安装一块SCSI卡。如果你的系统支持既插既用,只须将SCSI卡插入一个扩展槽即可。注意,SCSI设备是一种串接链式结构,并且需要在每个链的末端连接一个叫终结器的设备。现代的SCSI设备一般自身带有终结器,这样在大多数情况下无须考虑终结器的问题了。
设置SCSI设备的跳线比IDE设备简单。对于SCSI设备,你只须确认每一个SCSI设备都设置为不同的ID号即可,启动盘设置为最低的ID号。IDE设备具有三种不同的设置选择--主盘、从属盘和单盘,但是不是所有的IDE设备都提供了这三种设置。一般来说,如果你在同一条数据线上连接两台IDE设备,那么启动盘应设置为主盘,另外一个设置为从属盘。如果你只有一个IDE设备,可设置为主盘或单盘,具体采用哪一种设置取决于设备本身的说明。
从总体上讲网络服务器的硬盘接口和高级用户一般选择使用SCSI,而IDE是几乎都在使用的接口。虽然总体上如此,但也不尽然。事实上,即使对于高级用户来讲IDE常常也是一种很好的选择,甚至比SCSI更好,或许是混合使用两种设备。
在人们的观念中一直都认为SCSI设备比IDE设备快,但这并不完全是事实。当然有史以来,在同等时间内SCSI的突发速率高于IDE接口,但突发速率只能显示出接口能传输的数据有多快。而一个制约整体速度的重要因素是内部传输速率--这在很大程度上取决于驱动器的读写头及其移动定位系统所能处理的数据速率。
由于接口的最大吞吐量远高于内部传输速率,因而在决大多数情况下无论采用哪种接口吞吐量都是相同的--至少在单用户系统下是如此。在某些情况下,SCSI设备甚至比类似的IDE设备还要慢。SCSI设备的一大优点是可对网络环境下同时发生的多个数据请求提供良好的控制。在单用户环境下,这种高层控制反而会使设备的吞吐量降低,因而显示出IDE设备的优势。
另一个造成普遍认为SCSI设备优于IDE设备的原因,是由于设备制造商们惯于将他们较快的新产品首先采用SCSI接口,然后才应用于IDE接口。IDE设备的性能有时也会超过SCSI设备,一个快的IDE驱动器会比一个较慢的SCSI驱动器性能优越,而价格更便宜。所以,除非你需要最佳的性能并且刻不容缓,否则你无须选择SCSI设备。
你可从以上SCSI与IDE的对比中选择你所需要的,当然,两种方式混用也许更能使你受益。
怎样安装SCSI硬盘
SCSI硬盘一向认为是昂贵且高不可攀的存储设备,不仅本身价位高于IDE硬盘很多,而且入彀想要使用IDE硬盘,就必须另外选择SCSI接口卡。因此在这样的条件下,一般计算机用户便倾向于使用IDE接口的硬盘。IDE硬盘虽然具有低价的优势,但始终敌不过SCSI硬盘的强悍速度;再加上SCSI接口为进行"多任务"的最佳利器,许多追求稳定、速度的玩家还是钟情与SCSI硬盘。
很多人认为安装SCSI硬盘简直是大工程,不像IDE硬盘那样,只要设置先后(Master或是Slave)就可以是使用了。其实他也没有想象中那么复杂,毕竟愈严谨的安装与设置,愈能提供我们稳定的使用环境。
认识SCSI硬盘
每当SCSI又发表新规格的时候,SCSI硬盘便跟着同时支持新规格,着使得SCSI硬盘俨然成为SCSI外设的领导者。由于开发硬盘的技术已经相当成熟,因此SCSI硬盘在接口上的配合,总是能够跟得上时代;再者,硬盘是计算机相当重要的设备,而且缺他不可。其实所有的硬盘都长得差不多,不过因为SCSI规格的不同,而使得部分外观上还是有一些差异。
不同SCSI规格的硬盘:
采用68-Pins Wide SCSI接脚,可以使用16-bit的通道宽度传输数据。
采用60-Pins Narrow SCSI接脚,只能以8-bit的通道宽度传输数据。
Jimper(跳线)设置,主要用来调整硬盘的ID、终端电阻开关等。
SCSI硬盘是相当昂贵的计算机外围设备,在搬运时绝对请你要十分小心。由于目前的SCSI硬盘转速都相当高(约7200RPM~10,000RPM),因此不管是以外置方式或是内置方式来安装硬盘,都需要配备良好的散热环境。
以内置方式安装硬盘
大部分从市面上买回来的硬盘都是内置式硬盘,只有某些厂商回将较高级的SCSI硬盘搭配外置盒来出售,如此一来便成为现成的外置式硬盘。如果你觉得自己的计算机机箱散热性良好,也有空余的空间,可以剩下外置盒的钱,直接将SCSI硬盘接在计算机机箱内。
安装时的必要工具:
要将硬盘安装到机箱内,需要一些工具来帮忙,你至少需要准备以下两样:
1、 十字改锥:硬盘、SCSI接口卡都需要用螺丝来固定在机箱上,这时必须借助十字改锥来完成这些工作。
2、 尖嘴钳:你必须借助尖嘴钳来拔除、插入硬盘上的Jumper,以设置硬盘的ID、终端电阻开关等等。
备齐所有套件:
以内置方式安装SCSI硬盘时,请准备以下各组配件:
1、 SCSI硬盘:这当然是绝对不可缺少的主角。
2、 SCSI接口卡:除非你的主板已经内置了SCSI接口,否则绝对要准备一张SCSI接口卡;此外SCSI接口卡和硬盘的搭配也相当重要,请依照硬盘的SCSI规格来搭配使用。如果你使用Fast SCSI接口卡来搭配Ultra-Wide SCSI硬盘,虽然在使用上没问题(可以用转换头),但是速度与通道宽度却会降低长Fast SCSI的标准。
3、 SCSI排线:SCSI内置排线分成50-Pin Single-Ended、68-Pin Single-Ended、68-Pin LVD三种,请认清楚自己的SCSI硬盘必须搭配哪一种排线。
4、 螺丝:用来固定硬盘与SCSI接口卡,两者使用的规格可能不一样喔!
安装步骤:
安装SCSI硬盘之前,请你先了解一下整个流程:
硬盘Jumper设置→固定接口卡与硬盘→以排线连接硬盘与接口卡→接上硬盘电源
接着我们可以开始在机箱上安装SCSI硬盘咯!
1、 调整SCSI硬盘Jumper(跳线):硬盘上的Jumper可以用来设置SCSI ID、终端电阻、Parity Check等等。
2、 将SCSI接口卡插在主板上:将SCSI接口卡插在主板上的正确插槽,并确认是否正确插入;接着利用十字改锥与螺丝将接口卡固定好。
3、 固定硬盘:将硬盘固定在机箱固定架上。
4、 连接排线:用排线连接SCSI接口卡与硬盘,68-Pins Wide SCSI为特殊梯形接头,因此在连接上没有反接的困扰。
若安装的是Narrow(50-Pin)的硬盘,请注意50-Pin排线的红线部分要对准硬盘或接口卡的Pin-1。
5、 将固定架插回机箱中并接上电源:确定固定架中的硬盘是否已经安装好,然后在将硬盘电源线插上。
到目前为止,硬件的安装大致上已经没有问题,请你再检查一次SCSI接口卡、排线、电源线是否连接正确;如果一切都确认无误,你可以打开主机电源,看看屏幕上SCSI BIOS的显示是否已经可以找到这台SCSI硬盘的型号。启动后出现了SCSI BIOS的画面,找到了SCSI硬盘,表示硬件安装正确!
外置硬盘
将SCSI硬盘外置有很多好处,例如:
1、 不需要用到硬盘时可以关闭电源,减少硬盘无谓的工作量。
2、 拆卸、安装方便,不需要打开主机机箱。
3、 ID可以直接在机箱上的开关切换,不需要在硬盘上插拔Jumper。
4、 外置盒可以配备独立完善的三热系统,让硬盘有更好的散热工作环境。
一般较常见的SCSI硬盘外置盒,其外接接口为低密度50-Pin或是高密度50-Pin的SCSI接头,外置盒内部则以50-Pin的内接排线连接于硬盘。至于Ultra Wide SCSI硬盘的专用外置盒则较为少见,其外接接口为68-PinWide接头。内部则以梯形68-Pin Wide SCSI内接排线连接于硬盘。目前最新的Ultra2 Wide SCSI LVD硬盘,由于连接的排线要求较高,再加上特殊的双绞线设计,因此不论在外置盒排线或是SCSI外接线都必须重新设计,目前仍然没有看到这方面的产品。
安装两个以上的SCSI硬盘
若是你有两块以上的SCSI硬盘,可采用以下的排列组合来安装:
1、 硬盘都内置于同一张SCSI接口卡:一般SCSI接口卡所附的内置排线只能连接1~2台设备,如果需要内置多块硬盘,可能需要另购排线。另外有些Ultra2 SCSI LVD接口卡不仅可以同时提供内置Ultra2 LVD SCSI与Ultra-Wide SCSI,而且能让这两种规格的SCSI设备,在同一个SCSI通道中不相互牵制、影响。
2、 两块SCSI卡连接多块硬盘:这是比较奢侈的做法,因为你需要再买一块SCSI接口卡;但是如此一来,连接的数量与SCSI的长度就没有顾虑了。
3、 同时使用外置与内置方式:同时内置与外置SCSI硬盘,也是一种连接多台硬盘的方式,但是也要注意内置排线加上外置线的总长度是否超过限制。还有外置的最后仪态与内置的最后一台硬盘都必须打开终端电阻。
一般我们建议在安装高级SCSI硬盘时,尽量使用内置的方式,例如Ultra-Wide SCSI或Ultra2 SCSI,因此这些需要频宽、低噪音的硬盘,若采用内置的方式能够达到理想的性能。
SAN和NAS技术的比较
从现在开始,我们将探讨如何通过将网络集成到存储I/O以改进这些技术。
网络存储包括了网络和I/O的精华,特别是灵活的网络寻址能力、远距离传输能力、I/O高效的原性能。尽管在开放系统服务器中使用的网络存储技术还很新,但几年以前该技术就已经出现在诸如IBM的ESCON和Digital和Computer Interconnect等大型机环境中了。
如第1章中所提到,网络存储沿着两条主要技术的发展方向前进:SAN和NAS。网络连接存储(NAS)具有提供以太网络数据访问的传统。它的模型主要源于网络文件服务器的概念。NAS的产品,通常以与现有网络结构相容的应用包形式,提供集成服务。
存储区域网络(SAN)是一种新存储连接拓扑结构。它被设计用于代替现有的系统和存储系统之间的SCSI/O连接。SAN代表了一种将数据由数据处理系统传输到数据存储系统的新方法。
本章将分别讨论NAS和SAN,并解释它们在技术实现方面的区别。
一、自由的I/O
NAS和SAN之间的相同点之一在于系统和存储之间连接的外部特性。多年以来,PC服务器存储主要在服务系统内部实现,并作为整个服务器系统的一部分出售。1999年,外部服务器存储子系统开始普及,而且仍然主要作为服务器系统结构的一部分出售。在许多人的心目中,存储和服务器是不可分的。与这种思想伴随而来的是,人们认为存储器必须紧挨着服务器放置。因此,当想到要把存储器柜从它们的服务器挪开时,一些系统管理员就开始紧张了。但这恰恰是网络存储的优点:它可以将数据放置到那些能被最可靠地访问、并能被最有效地进行管理的存储器中。
本章是为那些有些惧怕求知、对网络存储说法不太舒服的人,以及那些对这些概念有些混淆的人而写的。如果您也是其中一员,那么现在您一定不会感到太孤单了。到1999年,存储网络还是一种新概念。它仍然等待着“杀手锏“的出现,以将它们并入市场的主流。
尽管存储网络的反对者们对已经存在的实现方法提出了质疑,但对于网络存储的概念他们却无话可说。所有新技术出现时都会遇到这种情况。原始的阴极射线并不代表电视显像管,但通过在屏幕上产生移动的亮点,它们成功地证明了显像管的原理。存储网络将成为下个时代网络和互联网计算中最重要的技术之一。因为它可以使用比服务器连接存储更有效的文式来管理和访问数据。
两种方法:SAN和NAS
正如在第1 章所讨论的,目前存储网络技术领域中的两个基本乐章是SAN和NAS。它们两者并不相互独立,也没有竞争相同的市场。这两种技术是相互补充和相互配合的。现在NAS系统能使用SAN技术--将来SAN也将被作为连接NAS产品的网络技术。下面将比较NAS和SAN技术,并讨论几个相关的主题。
SAN通常被认为是一种光纤路径网络,它通过使用被称为光纤路径技术(FCP)的串行SCSI I/O协议来传输I/O流量。NAS产品,则通常被理解为是具有自己的文件系统的专用文件服务器。表列出了两者之间的差别。
SAN和NAS的比较
SAN NAS
协议 FCP,串行SCSI NFS,CIFS网络 光纤路径 以太网源/目的 服务器/设备 客户机/服务器,服务器/服务器传输对象 设备块 文件存储设备连接 网络上的直接连接 服务器上的I/O总线路径嵌入的文件系统 否 是
1. SAN悖论
SAN一直被作为一种开放系统计算环境中数据可用性的解决方案来兜售。通过将某些I/O处理过程从系统转移到存储,可以获得更好的数据可用性。因此,存储管理功能可以独立于访问数据的服务器。这种方法有着明显的优点,例如,可以使用大型存储子系统为来多个服务器的数据提供接口管理控制。
然而,提供这种能力的存储子系统必须获得更多的信息,而不仅仅是目前系统中提供的块传输表。进行存储管理必须对整个数据实体的信息有清楚的认识,如对于文件就不仅仅是保存面向连接的块存储表。恢复文件的过程是一个很好的例子:用户简单地提供想恢复的文件名和文件版本,然后选中该文件,启动恢复过程并将文件恢复。他们在恢复一个文件时,并没有先找到所有需要恢复的文件的相关数据块,然后提交这些数据块列表来进行恢复。由此可见,如果SAN想提供有用的存储管理能力,则必须掌握数据库/文件系统的信息,而不仅仅是关于数据块的信息。这样SAN才能直接管理文件和数据库对象。
其中,如果SAN想提供预期的自治管理能力,则必须要求那些SAN中的智能组件提供关于数据/文件的处理功能。目前SAN中的智能组件可以支持块传输功能层的功能,并作为“超强虚拟设备”工作。但这并不意味着它们的智能足以极大简化存储和数据管理的过程。因此,需要将文件系统和数据库管理系统将逐渐演化,成为一种SAN可识别的分布式资源。无论从哪一方面发展,这两种技术都将逐渐相互融合,而不是相互分离。
记住下面的这些要点将会很有帮助:
·SAN和NAS不是对立的。
·SAN是一种网络,NAS产品则是一个专有文件服务器或一个智能文件访问设备。
·SAN包括面向块(SCSI)和面向文件(NAS)的存储产品。
·NAS产品能通过SAN连接到存储设备。
2.NAS中的“网络“
NAS和SAN具有很多相同的特征,因此容易产生混淆。鉴于概念的混淆会影响到市场的发展,NAS和SAN厂商都不希望混淆出现。因此,业界人土进行了许多关于它们的讨论以澄清这两个概念。
不幸的是,混淆是无法避免的。这里主要的问题似乎在于,这两个词的构成本身就易于混淆。从计算机市场业界是观点来看,并不奇怪他们热衷于使用三个字母的缩写(TLA)。如果让搞计算机市场的人给冰箱分类,他们一定会把冰箱称为RFD(冷冻食品设备)或者EIC(电子冰冻盒)。现在NAS和SAN都出现了。对于我们这些患有间歇性诵读困难的人而言,至少我们知道它们和存储、以及网络有关。这此词在发明时并没有太多考虑人们会如何使用它――它们被自由地用来描述很多种类的事物,从不同的产品到网络,到各种应用和技术。
部分混淆于对NAS产品预期运行环境定义。在其基本实现中,NAS仅简单地包含了在现存的以太网中集成一个专用存储服务器。对某些人而言,这种网络和存储数据传输没有任何关系。当然,NAS的厂商并不认为网络是否和存储相关连有什么关系。从他们的角度看,最重要的是他们的产品能否正常工作――当然是阶段性的正常工作。
一些SAN的支持者不同意前者的观点,他们认为NAS产品是与其他所有服务器和工作站一起接入到现有以太网中的。换而言之,他们不希望NAS这个词和专用存储网络有任何关系。从他们的观点来看,专用存储网络就是指SAN。
那么那些NAS厂商的反应就可想而知了。生产NAS产品的公司显然希望尽量多地出售其产品,无论采用什么方法。这样,一些NAS厂商将他们的NAS产品性能提高为不但可以用于现存的以太网,还可以用于可提高性能和管理能力的新的、独立的专用网络。
有一个观点认为更多的是顾客,而有是NAS厂商,会接受这种将限制该技术通用性的定义。这个观点有些令人难以理解。大多数以太网系统管理员乐于讲述他们在解决网络问题方面的成就,包括如何配置交换机和路由器以形成子网,从而将LAN通信分离成高优先级和低优先级的虚拟LAN。很难想象他们不会马上想到去同样处理NAS文件服务器。
二、NAS和SAN的差异
除了前面提到的方法,还有其他一些方法可以用来比较NAS和SAN。下面的章节将引入其他一些方法并讨论其优缺点。我们希望通过这种分析,能让读者对那些可能产生矛盾和混淆的命题有一个清楚的认识。
1. 文件系统处的分隔
图1说明了人们普遍接受的关于SAN之间的差异。该图的基本思路是选择文件系统作为分界以分隔两个区域。换而言之,文件访问是NAS的工作,而SAN的任务则是操作块设备。
图1并不代表一个综合了SAN和NAS的完整网络I/O系统,也不试图解释SAN和NAS两者之间的依赖关系。因为这两者之间是相互独立的。这里举出该图的目的在于形象地对两种技术之间实现的差异进行比较。
应用程序 文件系统 磁盘
NAS NAS
图 1 NAS和SAN实现的简单模型
这张草图能很快地说明对象,但是它不能很好地对两种技术进行实质性的描述。例如,对初学者而言,它没有很好地对数据库系统进行说明。当然,给这个模型添加数据库系统并不困难,只需要将图中的文件系统换成数据库系统即可。
该图的不足之处在于,它对不同组件的所处地位描述太模糊,特别是对位于中间的文件系统。
本书的第2章和第3章分别讨论了I/O路径中的硬件和软件组件。图2显示了正在访问一台服务器上文件的客户机的I/O路径。它说明有两个文件系统需要被考虑:客户机上文件系统和文件服务器上的文件系统。尽管客户机上的数据访问可能被重定向,从而绕过它的本地文件系统,但实际上仍然存在本地文件系统。图显示一个简单的系统,它没有被重定向,但也因此容易产生混淆。
2. NAS和SAN的软件模型
图2重新绘制了图1中的内容,只是这一次显示一系列更为复杂的软件组件。它包括左右两边的组件,并重新标记了中间的文件系统。
存储控制器
客户端重定向器 网络服务/系统 设备驱动器
NAS SAN
文件系统数据库
网络应用程序
图2 SAN和NAS的软件模型
图2中左显示了一个客户端重定向器,它主要用于发送请求的文件和数据。客户端重定向器是一个文件系统级的软件。它将网络文件和数据服务与本地资源合并起来,然后将它们提交给应用程序或用户。图1中的文件系统部分被标记为网络文件系统。它在原有文件系统的基础上增加了数据库和网络应用的功能。模型的右边为一个存储控制器的设备驱动器,它代替原来的磁盘驱动器。
注意SAN的位置在该驱动器的右边,而不是它和网络服务器之间。在这张图中假设该设备驱动器(例如HBA)位于主机I/O总线上。将来,这种连接控制器也许会通过网络连接到系统中。
3. NSA和SAN的硬件差异
尽管图2中的模型比图1中的更详细,但对于那些从系统硬件角度来考虑的读者来说,帮助也许不大。下面将从硬件组件成的角度来重新考虑两者之间的区别。图33给也了一个硬件视图,并把注意力集中于中间的网络服务系统内部。
图3左边是一个网络适配器,它用于连接网络服务系统和客户机系统,可位于连接各种类型通信的网络中。中间是一个服务器系统,它运行客户应用程序的请求,并将它们映射到真实或虚拟的存储设备中。图3的右边是一个主机I/O控制器,它将应用程序和用户请求传递到真实或虚拟的存储设备和子系统。
设备
服务器系统
SAN
NAS
到客户系统
网络接口卡 系统I/O总线 主机I/O控制器
图3 SAN和NAS的硬件模型
尽管图3中的情形在大多数情况下都适用,但这种实现仍然存在问题,即左边部分必须具有NIC功能,而右边部分必须同时具有HBA功能。在实际应用中解决该问题的方法将在下面进行讨论。
4. NAS和SAN的协议差异
关于接口适配器中多功能支持的讨论,会引发善于不同适配器设备驱动器所支持协议的讲座。图4对NAS和SAN的协议进行了分析。
图4左边是一个文件访问协议堆栈,建在TCP/IP的顶层。它包括一些支持文件或数据库访问的更高层协议的组合。该图的中间部分是一个操作系统。它的作用类似于图中两个堆栈之间的协议转换器。图右边显示了两个协议栈,它们被用于网络存储设备、网络子系统或服务器。其中一个堆栈是块访问协议,SCSI;另一个堆栈是文件访问协议栈,它和图中左边的栈功能相同,其区别在于右边的栈被用于传输存储I/O通信数据的专用存储网络。
1).一个适配器――两个协议
光纤路径被设计成为一种多协议技术。它可以支持SCSI协议和IP协议。尽管在1999年末,其预期的多协议特征还不能真正使用,但它们正处在开发过程中。其早期的测试已经开始,并希望到2000年能投入使用。这还意味着在一个服务器系统中,单个光纤路
径适配器可以作为NAS组件或SAN组件单独或同时使用。图5显示了一个多协议适配驱动器,它是为这种混合NIC/HBA产品专门设计的,能控制NAS和SAN的连接。NIC/HBA支持的两种协议交替访问网络,并轮流对其各自的请求做出应答。
数据库/文件
服务器 NFS
应用程序 CIFS
文件访问 TCP/IP
SAN 网络协议 以太网
NFS 应用程序 光纤路径
CIFS 文件访问 SAN
TCP/IP 网络协议 块访问 串行SCSI
以太网 路径协议 光纤路径
图4 SAN和NAS的协议模型
NIC功能
多元传输
TCP/IP
(NAS) TCP/IP传输 SCSI 3传输
SCSI (SAN)
(SAN)
多协议适配 HBA主机总线适配器功能
驱动器
图5 单个适配器中的多协议NAS和SAN连接
也有可能将SCSI-3映射到除了光纤路径以外网络中,如以太网和千兆以太网。这种映射允许它使用和光纤路径相同的方式进行访问。以太网已经支持多协议很多年,显然也能支持这种SCSI映射。这样,单个网瞳就能和光纤路径适配卡一样提供NAS或SAN两种功能。图6给出了一个可能的方案。其中,由一个100BaseT的四端口以太网适配卡分配其中两个网络端口进行TCP/IP网络通信,使用另外两个端口进行存储网络通信。注意该图中两种类型的网络通信是如何在独立的网络连接上进行传输的
TCP/IP网络数据传输(SAN)
100BaseT4端
口适配器
SCSI-3存储(路径)数据传输(SAN)
图6单个适配器中的多协议、多端口NAS和SAN
正如上文所述,支持IP协议的以太网网卡能在NAS和SAN中同时工作。尽管它们
并不被认为是典型的SAN连接,但一个由客户的系统通过专用存储网络连接到NAS存储服务器的IP通信符合SAN的基本要求。由于具有在各种不同层次工作的能力,两个不同的这种网能装在同一台服务器上,以同时提供SAN和NAS的功能。图7说明了这种结构。
2).深入讨论协议
大多数情况下,一个事务被认为是属于NAS还是SAN在实际应用中并不重要。但使
“每天”网络 存储网络
到工件站和其 服务器 到存储
他服务 系统
NAS SAN
主机I/O
总线
网络接口卡 网络接口卡
图7系统中隔离的IP NAS适配器
用正确的词汇来称呼这些通信系统中的思想、计划和结构,在进行交流时能节省很多时间,还可以减少不必要的混淆。和协议分析有助于描述数据网络的概念一样,清楚地描述存储网络地概念也能提高效率。作为一个网络中比较抽象的部分,协议可以用来进行与具体产品无关的系统分析。
通过块协议和文件协议访问存储数据
存储网络有它们自己的定义其功能和性能的协议集。1999年,存在两个主要的协议集:块访问协议集和网络文件协议集。事务处理协议代表了第三种协议。它还没有在存储网络圈中讨论过,但在创建新的网络存储技术和产品方面存在着巨大的潜力。
块访问协议以块的格式传输和接受数据。块协议几乎不传输任何善于数据内容的信息,面是携带关于被访问数据的信息。图8对此进行了说明。
“块“这个词被用于衡量数据的数量。它和存储设备的离散存储容量有关。块访问协议允许计算机、控制器和设备之间能进行快速大量的数据交换。
网络文件协议在它们各自的平台上使用不同的文件访问接口文件访问接口几乎没有任何关于存储设备或系统的信息。关于网络文件协议的一个普遍的看法是,它能为终端用户提供高层、易用的接口和应用程序,以访问网络上的数据。网络文件协议在文件内部以字节为单位对文件进行操作。图9说明了文件访问协议的要点。
5.存储网络中的多协议应用
图5-6和7说明了在存储网络中如何支持多个协议的功能。现在,我们来看多协议可能被使用范围。
1).使用IP通信扩展SAN功能
图5-6显示了一个具有多协议适配器的系统。该适配器可以用于NAS和SAN网络通信。和其他数据处理网络通信一样,NAS通信数据经常中相同的数据网上传输。它不需要为某个存储器所专有。当NAS为存储器所专有时,它本身就成为了SAN。
图10显示了一个扩展SAN。其中TCP/IP和SCSI-3类型的数据在网络上并行传输。
图10中的扩展SAN中有两个工作站、三个服务器和三个RAID系统。它们通过一个8端口交换机连接到一个光纤路径网络中。两个工作站和服务之间通过TCP/IP相互通信。每个服务器使用SCSI-3和自己的RAID子系统通信。两个工作站没有配置相应的SCSI-3协议,因此不能和RAID子系统直接建立会话。
3).SAN中的SNMP通信
如今大多数SAN产品使用SNMP来管理它们的活动,并对其错误进行报告。同时,这种管理以一咱“带外”的方式进行,即通过SAN以外的网络进行管理。然而,为了更好的管理SAN资源,“带内”或、SAN内的管理可能发展成为SAN中TCP/IP通信的主要管理应用方式。带内管理方式和SAN通信过程有着相同的性能特点,即它和网络通信有相同的速度,而不会比相应的数据传输慢。经比较,100Mb的带外以太网管理的SAN中事件的回应速度显得太慢。
图11中显示了一个具有带内SNMP管理的SAN。其中一个服务器和存储子系统通过
一光纤路径集线器连接,并使用SNMLP和网络管理控制台进行管理。
三、NAS和SAN的实现
本节介绍SAN和NAS的实现,并总结前面讨论过的关于SAN和NAS的概念。
最简单的NAS和SAN技术实现的版本是一个简单的、点对点的两节点网络。图12首先举出一个简单的数据网网络模型。其中,一个工作站访问NAS服务器上的某种类型的数据。
以太网集线吕器
NAS
服务器
客户机系统
图12数据网络模型
接下来是一个简单的点对点SAN。这个简单模型也是在1999年实际应用中最普遍使用的模型。图13对此进行了说明。
服务器系统 存储子系统
图13点对点SAN网络模型
为了对上面的例子进行扩展,可在SAN中使用哆个系统同时访问多个存储设备。其中所有的组成单元通过一个存储网络交换机或集线器进行连接。图14给出了一个由三个服务器通过一个存储网络交换机访问三个不同存储子系统的模型。
服务器1 子系统1
SAN交
服务器2 换机 子系统2 存储器
服务器3 子系统3
图14多存储子系统模型
图15说明,一个NAS服务器系统可以使它的存储设备通过任何合适的总线路径进行连接包括使用SAN存储网络。
以太网 SAN集
集线器 线器
客户机 NAS服
务器
NAS服务器
存储子系统
图15使用SAN的NAS服务器系统
在上面例子中,可以在以太网休线器和NAS服务器之间插入一个数据库服务器,从而得到图16的变化。
以太网集 数据库服 以太网交 SAN集
线器 务器 换机 线器
客户机 NAS服
务器
存储子系统
图16插入一数据库服务器的系统
图17说明了在一个大的网络环境中将不同存储网络相互连接到一起情况。
以太网 存储子系统
NAS服务
客户机
主机I/O控制器 SAN交换机
图17由SAN和NAS组件成的大型存储网络
四、术语SAN的使用
在本书的余下部分,SAN这个词通常用于指主要用于传输块访问协议的网络。尽管在描述这种网络是最好使用“专有”这个词,但为了适应不可避免的IP协议数据传输,实际应用中我们不这样用。虽然也可以使用“扩展SAN”来说明这咱情况,但让读者在每翻到新的一页都遇到新的名词显然是不合理的。
并不是说在本章中大量讨论的块访问协议网络是仅有的SAN实用类型。这 仅使用同一种例子的原因是显简洁――这样在讨论仅在光纤路径产品中实现的SAN时,就没有必要使用那些麻烦的特定术语,或考虑不计其数的可能情况。
“存储网络”这个词在本书中用于指主要用于处理存储I/O数据传输的网络。有时会提到某些协议,通常是为了描述一些主要用于存储I/O数据的传输,而不考虑它使用的协议、网络设备或其他变量。在不久的将来,肯定会出现许多相关协议。一个简单的事实是,将存储I/O的功能集成到网络的时代已经拉开序幕了。正如许多广泛使用的术的发展一样,存储技术的发展将会带来许多变化。和其他所有关于计算机和网络的事务一样,存储技术将面对的是永无休止的变革。读者不应当被现在遇到的各种新名词挡住了未来的视线。
|