云存储如今已经不是什么新鲜的概念。而且,实际上对于用户来说,也不需要理解这种概念的详细内容。从使用者的角度来看,其实际上就是一种提供存储业务的服务。不过,这却在某种程度上对云存储服务供应商提出了更高的要求。一方面,云存储服务供应商需要为每一名用户提供完善的支持,保证数百乃至上千用户的访问性能,按照服务级别协议(SLA)提供服务;另一方面,云存储服务供应商自己也要关注存储成本,以及管理的难易度,这在某种方面来说也是开源节流的方式之一。
如果说云存储是用户方便且低成本的存储选择,那么,这些存储难题也可以说是被转嫁到了云存储服务供应商身上。
在这种情形下,几乎所有的云存储供应商都将目光转到了集群NAS上。
什么是集群NAS?
一般来说,集群NAS是一种松散耦合的计算节点集合。这里所说的松散耦合,其实基本理念同软件工程里的概念有些相似。在集群NAS中,最小的单位个体是文件而非数据块,每个节点都是独立的实体且拥有无法被其它节点所访问的一个或者多个卷。当用户存储数据时,数据会以文件形式存放于某个节点之上。出于数据保护的考虑,同一集群的其它节点上可能会有文件副本,但是却无法以文件实例的形式提供给用户。也就是说,集群NAS对节点的相互依赖和顺序没有特殊要求。这同数据块方式操作的集群系统有着一定的区别。
这种工作方式对于大型的应用具有很高的实用价值,特别是连续的文件数据流。通过文件系统的调度算法,其可以将整个应用隔离成较小且并行的独立任务,并将文件数据分配到各个集群节点上。目前,我们常见到其被应用于大型的数据库查询搜索、 密集型的计算、生命科学、能源勘探以及动画制作等领域。
对于集群NAS来说,硬件只是其中的一个部件,文件系统以及应用同样是其有价值的组成部分。目前我们能够经常见到的集群NAS产品包括,BlueArc的Titan和Mercury系列、HP的Ibrix系列、IBM的SoNAS、Isilon的IQ系列、NetApp的Ontap GX等等。
集群NAS架构如何适应云存储需求?
今年的集群NAS市场一扫往日的低迷,看起来一片红火景象,这主要得益于一些大厂的切入,比如说戴尔,比如说HP,比如说IBM。
那么,这些大厂为什么会愿意同集群NAS扯上关系呢?我们可以从IBM对SoNAS的构想中得到一些答案。在同IBM系统与科技部大中华区存储产品经理金微的交流中,他首先就把SoNAS同云存储联系到了一起。他认为,在目前的存储形势下,一方面大量非结构化数据持续增长,对于存储系统的要求越来越高;另一方面,云存储大规模的数据访问也对存储系统提出了要求。此外,包括赛门铁克、Isilon等在内的其它厂商也都将集群NAS的应用领域提到了云存储的级别上。
在当前各类产品都同云计算、云存储扯上关系的时候,集群NAS应该是比较靠谱的应用选择之一。
我们以SoNAS举例,来看一下其在云存储环境下的架构模型。不同厂商的架构尽管会有差异,但是出入不会太大。
从上图可以看到,SoNAS在内 部数据交换方面采用了Infinband网络,包含Interface Node、Storage Node和Management Node三种处理节点,分别负责数据对外交换、数据存储以及数据管理工作。在这其中,Interface Node承担着数据交换的重任,最小为2个节点,最大为30个。
我们前面已经说过,集群NAS的主要部件之一就是其文件系统。 IBM在SoNAS上所采用的分布式文件系统叫做GPFS,用户可以通过常见的文件访问协议、TSM归档软件接口来操作数据。目前,市场上除了SoNAS 这类整合文件系统、x86硬件以及网络设备的产品外,还有单纯的文件系统产品,比如赛门铁克的FileStore。
由于系统的优势,集群 NAS系统可存储的文件数量一般都在亿级以上,对于实际应用来说,文件数量限制基本可以忽略不计。同时,全局命名空间的大小也都为数个PB以上,某些厂商 的全局空间容量甚至可以达到10PB。
目前,所有厂商的集群NAS设 备都可以实现同原有系统的完美过渡,用户实际上只需要进行本地或者远程迁移就可以将数据转移到集群NAS系统中。这种方便的新旧转换也使得很多CIO在构 建私有云时开始考虑利用集群NAS产品。可以说,云存储市场的被发掘,为集群NAS拓展出了一个更为广大的应用领域,这使得越来越多的厂商开始推出相应的 产品。这对于本来只是限制在专业领域的集群NAS来说无疑是一件好事。不过,其缺点也颇为致命:采购成本过高。一般来说,100TB的部署规模至少要在 100万人民币以上。因此,也许我们要在云存储真正大规模普及后,才能见到集群NAS的身影。