中国数据存储服务平台

重复数据删除进入横向扩展和高可用时代

当横向扩展、高可用在备份存储中开花

在上周的“2011存储Benchmark盘点,意义何在?”一文中,采用横向扩展(Scale-out)设计的集群NAS存储系统可以说出尽了风头。另一方面,横向扩展形式的EMC Symmetrix VMAX、惠普3PAR系列产品也在今天的高端SAN阵列市场中占据重要地位。那么下一步Scale-out将伸向企业存储中的哪块领域呢?数据保护设备?

提到磁盘备份,重复数据删除(Deduplication)技术在今天几乎成了一项标准功能。顾名思义,重复数据删除通过消除重复数据所占用的硬盘空间,从而大幅提高在单位容量中能够存储的原始数据量(在某种程度上类似于压缩,当然效果更好),这项功能对于动辄需要反复进行全备份的用户来说尤为实用。

在我们编译的重复数据删除创新竞赛并未结束中有这样一段话:“显然,EMC(Data Domain和Avamar)在今天定义了重复数据删除世界的规则。其他竞争者包括IBM的ProtecTIER、NetApp、昆腾(Quantum)、赛门铁克的 PureDisk、SEPATON和惠普(包括OEM SEPATON和自己的D2D系列)…”以目前占据优势的EMC Data Domain目标端重复数据删除磁盘备份设备来说,单一控制器节点使它们在性能和容量的扩展性上受到限制,尽管双节点的GDA(Global Deduplication Array,全局重复数据删除阵列)在一定程度上解决了这个问题,但它仍然无法避免单点故障。

据我们了解,IBM ProtecTIER虚拟磁带库去重系列产品也采用了双节点设计;昆腾一直在产品技术上试图与EMC DD一较高低,尽管他们在公司规模、销售渠道方面有差距,但昆腾相对更专注于数据管理和备份领域;SEPATON和飞康(FalconStor)有专业的多节点可扩展VTL解决方案,这2家厂商都以软件功能见长,特别是后者此前在国内主推自己的CDP(持续数据保护)设备,虚拟磁带库软件应该是主要通过OEM来销售。

重复数据删除进入横向扩展和高可用时代

上面的示意图,左半边为基本配置的HP B6200 StoreOnce 48TB备份系统,包括一对HA(高可用)配置的2U服务器和2个通过SAS与服务器连接的磁盘阵列(估计为StorageWorks P2000 MSA这一级别),每个阵列控制器单元上安装12个3.5英寸硬盘。而右边则是B6200 StoreOnce的1/4满配置系统(占用了半个机柜,最高配置为2个机柜),分别在2个阵列控制器的后面各自级连了3个JBOD存储扩展单元。

惠普早在2010年就宣布了自己的StorceOnce重复数据删除软件,并推出StorageWorks D2D磁盘备份系统,包括2500和4000系列,不过相对于EMC和昆腾的竞争产品,亮点不够突出。然而,在去年底发布的B6200 StoreOnce就不同了,因为它是最多可以扩展到8个节点的。

重复数据删除进入横向扩展和高可用时代

Symmetrix VMAXe虚拟矩阵连接示意图

我们为什么要在这里出示EMC Symmetrix VMAXe“引擎”之间的虚拟矩阵互连呢?就是希望能够简单形象的解释一下惠普B6200 StoreOnce的8节点(服务器)Scale-out横向扩展。当然EMC VMAX家族与HP B6200的用途不同,价格差距可能也不小。VMAX/VMAXe将高速RapidIO用于节点间互连,并通过FC-AL(光纤通道仲裁环路)连接后端的驱动器扩展柜;而惠普B6200在我们看到的资料中并没有说明节点间通信方式(很可能是以太网),后端则使用SAS连接磁盘阵列。

二者比较相似的一点在于高可用配置(EMC VMAX也有单引擎的型号),都是按照2、4、6、8的节点数来扩展,也就是说4对HA的方式。 任何一台服务器(引擎)故障都不会使整个存储系统设备停机,HP Autonomic Restart(自动重启)功能通过通过检测问题和将备份重定向至备用硬件,无需手动干预即可防止备份失败。另外,B6200 StoreOnce的数据存储也是通过双控制器各自2条链路分别连接到前端服务器。

OST支持、性能PK. EMC Data Domain

惠普B6200 StoreOnce产品规格

HP B6200 StoreOnce最多支持384个3.5英寸2TB 7.2K双端口SAS驱动器,这里的接口速率为“3G”而不是目前流行的6Gb/s SAS对于最终用户来说没有什么影响;768TB裸容量配置RAID 6之后最大可用容量为512TB;通过8Gb/s光纤通道和10GbE、千兆以太网主机接口分别提供VTL和NAS(CIFS/NFS协议)备份目标支持。前不久,笔者就自己关于B6200 StoreOnce新品的疑问,与中国惠普有限公司存储产品部产品经理张梅生女士进行了交流。

ChinaByte比特网:您提到VTL主要是针对FC SAN的环境,B6200也能够同时支持8Gb/s FC和万兆以太网两种接口。为什么这款产品没有支持赛门铁克的OST(Open Storage Technology)?我们知道,赛门铁克在备份软件市场上份额比较大,而且根据以前的经验,支持OST比单纯的NFS或者CIFS的性能会更好一些,那么,B6200的28TB/小时的性能是用光纤VTL还是以太网达到的?

张梅生:我们的D2D系列产品是已经支持OST的,在2012年上半年B6200也会宣布支持OST(D2D刚推出时也不支持,笔者注)。今天即便B6200不支持OST,它的性能依然要好于EMC DD在OST环境下的性能。

重复数据删除进入横向扩展和高可用时代

上图截自EMC官方网站,我们注意到Data Domain DD890以及由2个DD890节点组成的Global Deduplication Array,使用VTL接口和8Gb/s光纤通道实现的最大吞吐量分别为8.1TB/小时和10.7TB/小时。这种情况下不仅无法利用赛门铁克OST或者EMC DD Boost加速技术,而且GDA双节点集群的效率也降低了很多。

既然惠普宣称B6200 StoreOnce的性能超出竞争对手三倍以上,于是我们就列出了EMC Data Domain的公开数据简单做个对比。所谓“三倍”应该是指作为VTL设备使用,尽管EMC称其DD GDA(Global Deduplication Array,全局重复数据删除阵列)的备份接收率可以高达每小时26.3TB(带有OST Boost),不过DD Boost支持的备份软件只有赛门铁克Veritas NetBackup/Backup Exec、EMC NetWorker和Avamar 6.0,并且对版本有要求。另外该去重加速技术还建立在增加备份软件介质服务器运算量的前提下。

重复数据删除进入横向扩展和高可用时代

惠普B6200 StoreOnce性能与节点(对)之间的对应关系

Scale-out存储扩展方式的一大特点就是性能和容量随着控制单元的增加而同步提高。在上表中我们看到HP B6200 StoreOnce官方公布的速度完全是随着服务器(及其后端磁盘阵列)节点对的数量线性上升,不过这里的数字有点像是计算出来的理论性能,同时惠普也说明了实际性能与备份/恢复的数据集类型、压缩级别、数据流类型、仿真的设备数量和同时并发的任务数量相关。

B6200 StoreOnce&VLS:SEPATON合作价值?

ChinaByte比特网:SEPATON的产品实际上也是Scale-out的扩展形式,但它采用后处理(post-processing)重复数据删除,而惠普StoreOnce是线内(in-line)去重。SEPATON在数据接收的速度和和恢复最近一次备份的速度实际上还要更快一些。

张梅生:VLS所支持的最大物理容量比B6200要高,适合那些对物理容量要求非常高的用户。实际上,您的这个问题涉及到我们(StoreOnce)跟VLS之间的定位。首先,VLS是虚拟磁带库,它只能在FC SAN的环境下使用,只能以虚拟磁带库的方式来备份。但B6200可以支持光纤也可以支持万兆以太网,可以让备份软件将它以NAS的目标方式来做备份,或是以VTL的目标方式来做备份。Inline的重复数据删除技术大家已经接触很多了,它的管理流程会很简化。而且,StoreOnce跟VLS有一个非常大的区别,VLS只支持4个远程站点复制,但B6200可以同时支持384个设备复制到一台B6200设备上。所以,惠普在具体面向用户的环境上会有一些不同的产品。

重复数据删除进入横向扩展和高可用时代

SEPATON S2100-ES2系列全局重复数据删除磁盘备份系统主要规格

SEPATON S2100-ES2最大可扩展的1.6PB也是物理容量。上图中单节点VTL备份性能1200MB/s是在初始发布时的数据,据了解经过后来的进一步优化,也能提高到与双万兆以太网OST方式1500MB/s相同的水平。S2100-ES2可以从1个节点扩展到最多8个节点(比一对为单位增加更灵活些),性能同样可以线性提升。通过上面的数字推算,该产品的最高备份/恢复吞吐速度(后处理重复数据删除任务被延后执行)可达43.2TB/小时,而虚拟磁带库方式也有35.4TB/小时(现在应该也有提升)。

另外SEPATON S2100-ES2也是能够允许单点故障的,如果8个节点还不具备容错的话那可用性就太低了。当有一台S2100-ES2离线时,剩余的节点能够接替它的工作(类似于硬盘RAID那样的冗余保护方式),当然这种情况下性能是要受到影响的。

重复数据删除进入横向扩展和高可用时代

惠普的VLS(Virtual Library System)虚拟磁带库产品线OEM自SEPATON,而最新9200型号对应的正是S2100-ES2。不过VLS 9200的重复数据删除功能是一个单独选购的license。张梅生女士如此表示:“VLS虚拟磁带库主要是面向企业级的FC SAN环境,VLS是我们在FC SAN环境里产品组合的一部分。针对B6200我们更倾向于重复数据删除技术。”

也就是说,惠普在VLS上与SEPATON合作主要是为了 VTL,而现在既然有了自主研发的StoreOnce重复数据删除技术,自然优先推广后者。不过正如SEPATON中国技术支持经理王国明先生所说的“线内和后处理重复数据删除有各自适应的环境,这两种技术将并存发展;VTL设备主要针对的是中高端磁盘备份/归档用户。”如今,StoreOnce B6200通过横向扩展伸入高端市场,与VLS的竞争将不可避免。

需要说明的是,惠普与SEPATON之间的OEM合作其实是双向的,因为S2100-ES2也使用了ProLiant DL380 G7服务器。另一方面,HP VLS在“转销”SEPATON软件的同时,也对配置进行了一定的限制和调整。比如S2100-ES2可以选配的10GbE网卡VLS 9200就不提供,而据业内人士称,尽管OST备份协议有其特点和优势,但由于种种原因,现在国内也几乎没人使用OST备份协议。此外,SEPATON S2100-ES2后端的光纤通道磁盘阵列来自HDS(日立数据系统)AMS 2100,通过冗余的FC网络交换机与前端服务器节点连接;而惠普则使用了OEM DotHill的StorageWorks MSA(2000)系列盘阵。

未经允许不得转载:存储在线 » 重复数据删除进入横向扩展和高可用时代
分享到: 更多 (0)