中国数据存储服务平台

解读EMC闪存战略:商品硬件+软件定义

距离EMC发布Xtrem系列闪存产品已经有一个多月的时间,其实我早就想写点东西与大家分享。毕竟5月初的EMC World大会已经为期不远了,届时又会有新的关注点。

日前,EMC资深产品经理李君鹏先生与我们就该公司的闪存业务策略进行了交流。笔者将在本文中加入自己的观点,希望能够给读者提供更加全面的视角。

李君鹏:“EMC在3月5日对外发布了全新的Xtrem系列产品,包括三大类,第一类是XtremSF闪存卡,SF代表的是服务器闪存。这次推出了四款具备业界领先性能的PCIe卡。这次还推出了全新的XtremSW,全套的软件产品。其中第一个产品就是XtremSW Cache,这是我们以前叫VFCache,这次就把它重新划成了Xtrem系列产品。同时在这次发布会上也讲了一下XtremSW套件的信息。更为重要的是EMC推出了XtremIO全闪存阵列,XtremIO是EMC在去年5月份收购的一家公司,这家公司09年开始做全闪存阵列,它的产品现在是处于精选客户的交付使用阶段。这是我们这次要发布的三个重点。”

XtremSF闪存卡:MLC来自Virident,同质化竞争?

解读EMC闪存战略:商品硬件+软件定义

仔细看一下,这张图片上是不是有2个“水印”?在此我们不方便解释太多,总之EMC并没有正式公开XtremSF闪存卡现在获得了哪些客户。

从发布到现在,我们看到的XtremSF照片大多是背面,为什么呢?不希望人们一下都能看出它的供应商吧?记得去年EMC官方宣布VFCache的硬件OEM自美光,所以就是正面的照片。如今单独卖卡而不只是捆绑缓存软件的销售方式,可能有一些需要顾忌的地方。不过在下文中我们还有更多的图片能够证明XtremSF的来源。

解读EMC闪存战略:商品硬件+软件定义

这一次推出的闪存卡包括XtremSF 2200(2.2TB)、1400(1.4TB)、700(700GB)和550(550GB)四款型号,都是半高半长的尺寸和eMLC闪存。至于113万IOPS的性能只是个理论测试的数值,参见下表:

解读EMC闪存战略:商品硬件+软件定义

上表中的350GB和700GB SLC闪存卡应该就是去年推出的,来自美光的产品。我们看到,2.2TB eMLC那一款的4KB随机读写IOPS分别为34.3万和10.5万,性能大约只有700GB SLC的一半,而87μs和30μs的读/写延时也距离SLC版本有明显的差距。550GB eMLC与350GB SLC相比的情况与之类似。

李君鹏表示:“闪存卡性能是它的第一指标。EMC的XtremSF把逻辑地址与物理地址的映射、闪存管理等功能卸载到PCIe闪存卡上,所以对服务器的开销是F品牌的一半,这样让我们比较宝贵的服务器CPU资源用在应用程序上。

我们对比的是MLC的,对比的F品牌也是同等的MLC的,没有拿SLC跟MLC比,那就不合适了。”

解读EMC闪存战略:商品硬件+软件定义

EMC通过各种内部测试,来证明XtremSF在性能、CPU占用以及TCO等方面的表现优于“F”品牌的闪存卡。在《轻硬而必须重软:PCIe闪存的转型之路》一文中,我们进行了Host-based与Device-based的讨论,据了解XtremSF闪存卡的OEM来源同样是Host-based架构的,不过也曾有外电中表示它的FTL(闪存转换层)运行在卡上?这里似乎还有进一步讨论的余地。

有记者朋友提问:“现在从这些网站(互联网/电子商务)的用户来说,他们可能以后慢慢越来越习惯直接去找原始设备厂商采购。”

李君鹏:“我知道,他们购买的量级跟我们的量级肯定不一样,我们的价钱肯定比他们好。

(对于某家国内用户)因为他们用这种PCIe闪存卡用的时间比较长了,用的厂家也比较多了,对价格也比较敏感了。但是现在碰到很多问题,做卡的解决不了,因为这不是卡的问题。EMC有很多专家,能帮助他们解决这些问题,他们可能会额外加点钱,可能比竞争对手贵一点,也会采用我们的方案。比如他们绝对不会再采购F品牌的卡,跟我们合作。”XtremSW缓存软件:与FAST的协同仍在计划中

看到上图中的闪存卡,进一步使我想起了Virident,大家可以参考一下Google图片搜索的结果。

李君鹏:“XtremSW是EMC缓存方面的一套软件,其中第一个产品就是XtremSW Cache(未来还会有第二个、第三个?),现在是1.5版本(沿袭VFCache的版本号),它可以将服务器的闪存从直连存储——我们叫DAS,变成缓存。XtremSW Cache是直写(write-through)缓存,所谓的直写缓存是不会把(唯一的)数据写到缓存卡里,而是写到网络存储上面。XtremSW Cache是目前唯一的数据去重产品(提供重复数据删除的PCIe闪存缓存),这样我们可以使服务器的闪存卡提供额外至少20%的容量。再有一个,XtremSW Cache与EMC的网络存储,像EMC的VMAX实现了集成,从VMAX上面就可以看到XtremSW所管理的闪存卡的统计信息,看到哪一些卷使用了XtremSW的缓存,还有如果它有错误信息,可以通过VMAX的管理软件报警。”

ChinaByte比特网:我记得EMC以前说过XtremSW Cache(VFCache)会跟FAST(全自动存储分层,包括FAST Cache)做进一步的集成。

李君鹏:“跟FAST将来的集成,如果这个数据已经是在服务器的(闪存)缓存里边了,那就不要在混合阵列的缓存里了。还有一个,如果这个数据我们看到的是顺序的读取,那我们就可能预先把数据提取(预读)给服务器的闪存卡,这是跟FSAT的集成,现在还没到那个阶段,但是现在正朝那个方向走。”

一年多以前,我们曾提到过VFCache(即XtremSW Cache的前身)具备一种“split-card(切分卡)”功能,允许用户使用服务器闪存卡的一部分作为缓存,而另外一部分作为DAS存储资源来使用。

这张示例图右侧的DAS闪存中存放的是Temp DB(临时数据库),因为它不具备数据保护,可以说能够相对最大化读写IOPS性能并提供最小的延时。

我们还曾写道:“EMC最初宣称VFCache只支持自家的VNX和VMAX存储系统,但后来却放宽了这个限制,尽管他们不希望因此而促进其他厂商的阵列销售。”这一次李君鹏表示:“目前XtremSW Cache软件在所有的XtremSF卡上都可以用。在不久的将来,可以用在F品牌的闪存卡上,以后可以用在其他厂商的闪存卡上。我们看看它支持的操作系统,有物理操作系统和虚拟化环境,像VMware和Hyper-V等等,未来也会支持更多的操作系统(SUSE Linux等)。

笔者注:通过EMC缓存软件对第三方闪存卡的支持进度,从一个侧面反映出Fusion-io目前仍是该领域的老大?

李君鹏:“XtremSW Cache未来的方向,在不久的将来会支持Oracle RAC环境。也就是说未来在闪存方面的硬件越来越商品化,而最关键的功能全部是通过软件来实现。XtremSW套件未来的方向是,可以用这个软件把服务器闪存卡作为Cache,可以定义成直连存储,像内置盘一样,或者是作为内存的扩展。未来会提供更多的数据服务,这种数据服务比如在不同的两块卡之间做镜像,这两块卡可以在同一个服务器上,或者是在不同的服务器上。这些卡可以分布在很多台服务器上,XtremSW的软件套件会将所有的服务器闪存卡做成一个池,这个池可以服务给所有的运行在这些服务器上的应用。这都是未来这个软件的一些发展方向。”

与之相比,戴尔Fluid Cache(流动缓存)第一版的写操作加速特性,就有点类似于XtremSW计划中最基本的一步——“2个PCIe闪存在同一个服务器上做镜像”。

我们以前还讨论过服务器闪存缓存支持双活集群(共享存储)和vMotion等的挑战,如今随着VMware vSphere 5.1支持在没有共享存储的物理机之间迁移虚拟机,后者对于该领域的主要厂商而言已经不再是个大难题,更多的区别在于闪存缓存在vMotion过程中是否需要手动禁用等操作以及重新预热。另外,Oracle要求的是双活(Active-Active)而不是Active-Standby。

上图中XtremSW直连存储的高可用和池等发展方向,使我想起了Virident FlashMAX Fabric路线图中的四个版本,感觉上它们相当类似。既然闪存卡硬件很可能是相同的,接下来比拼的应该就是谁的软件做得好,谁能更早推出吧?

原文出自【比特网】,转载请保留原文链接:http://storage.chinabyte.com/137/12599137_2.shtml雷电计划:与Fusion ION一样需求不足?

在之前撰写的评论中,我曾经写道:“EMC打算用XtremSW Cache软件未来的池化、高速缓存一致性(分布式缓存)功能,来实现共享以替代Project Thunder(雷电计划)”。

上图我们曾经在《Fusion-io软件定义存储:全闪存阵列DIY时代?》一文中出示过

ChinaByte比特网:其实EMC以前还有一个雷电计划。

李君鹏:“是的,这个产品实际上都已经准备推向市场了,但是通过跟客户反复地沟通,发现这个产品完全可以用其他产品来替代,就不再出了。”

根据图片中的说明,Project Thunder可共享、可扩展,提供优化的延时和吞吐,定位在VFCache(XtremSW + XtremSF)和XtremIO全闪存阵列之间。针对的应用有高频率交易、HPC高性能计算和为扩展受限的刀片服务器提供直连闪存。下面我们看看这些应用需求都被哪些产品替代了,或者说分散到哪些产品?

点击放大

李君鹏:“服务器闪存、全闪存阵列和混合盘阵有不同的使用案例。我们来看混合阵列,它比较适合大数据集,VMAX 10K支持1.5PB的可用(容量),20K支持2.5PB,40K支持4PB。偏斜IO模式,它可以利用混合阵列平衡成本和性能,主要的应用有哪些呢?比如数据库里的应用,OLTP应用,像我们计费、帐务、银行的柜面业务都是这类。XtremIO提供了线内消重,提供随机IO,闪存盘最好的就是随机IO,闪存盘跟机械盘能够提供的(顺序访问)IOPS或者MB数差别不大。XtremIO典型应用是在VDI、虚拟服务器、数据库、决策支持。XtremSW Cache服务器闪存缓存,我们最主要提供的是性能,而且是跟后端网络存储联合在一起提供了保护,它也需要提供有一些偏斜的IO模式,它主要用在读密集IO的环境,因为本身是把写入操作直接写到了后端盘阵上。它可以用在OLTP、邮件、数据库类的应用里。服务器本地存储XtremSF有极高的性能,特别适合于像高性能计算、交易类应用程序,这种交易类比如股票交易、信用卡交易等,还有就是Web2.0应用和适合于金融分析、数据建模等,它适合这种高IO的工作负载,提供非常低的响应时间。

原文出自【比特网】,转载请保留原文链接:http://storage.chinabyte.com/137/12599137_3.shtmlXtremIO全闪存阵列:软件定义商品化硬件

解读EMC闪存战略:商品硬件+软件定义

李君鹏:“XtremIO在最初设计的时候,就基于以软件来定义闪存的功能。所用的硬件全部是现成的,没有一个硬件是特意为这个产品打造的,用的CPU、控制器板子以及里边的SSD盘,全部都是商用的,不一样的就是它的软件。它软件内置平衡、线性的横向扩展体系架构,还有一个是它在设计上要提供始终可用的数据服务。所谓始终可用的数据服务,我们常常看到有一个产品当提供远程复制的时候,不能做本地镜像等等,很多厂商的产品有这样那样的限制。而XtremIO在设计的时候,有一个理念就是它提供始终可用的数据服务,也就是说它在提供对应用IO的时候,其他数据服务,像快照、镜像、数据复制都是始终可用的。

全闪存阵列使用SAS还是PCIe SSD?

ChinaByte比特网:XtremIO将来会不会考虑把SSD模块换成PCIe的?

李君鹏:“XtremIO现在来讲一定是盘阵(驱动器)的形态,不会做成卡的形式。”

分析:无独有偶,据了解Kaminario上周刚宣布的第四代K2全闪存阵列,将存储介质从Fusion-io PCIe闪存卡,换成了热插拔SAS SSD驱动器。

在前不久的IDF2013系列报道中,我们提到了2.5英寸热插拔是PCIe SSD发展的趋势。现在我们了解到的,正式应用2.5英寸PCIe SSD的主要是戴尔Express Flash,在服务器上不需要双端口访问,另外由于不提供硬件RAID保护,只能说有限支持热插拔。

另外有业内人士称“相信PCIe双端口的SSD盘片今年会逐渐出现并应用,但由于PCIe特殊性我并不看好取代双端口SAS,在技术上不成熟。”

除了2.5英寸、热插拔和双端口之外,还有一点是SCSI协议的兼容。我们在“IDF2013:NVM Express目标SAN共享存储”中介绍的多路径I/O和命名空间共享,以及预约机制(和SCSI reserve机制的实现方式兼容)等,就是力图解决这方面的问题。而Fusion-io与STA(SCSI商业委员会)共同推动的SCSI Express标准,包括SCSI over PCIe(SOP)协议等,所做的也是类似的事情。

解读EMC闪存战略:商品硬件+软件定义

上图右侧的那颗芯片,是我在IDF2013大会上拍摄的IDT编号为89H48H12G3YC的48信道PCIe 3.0 Switch

除此之外我还想补充一点,那就是高信道(lane)数PCIe交换芯片的应用情况。我们知道SAS扩展器(Expander)拓扑扩展在企业存储后端连接中的重要性,一些情况下是可以支持级联多达上千个SAS设备的。目前主流的6Gb/s SAS扩展器端口数通常不超过36,而LSI和PMC宣布的12Gb/s SAS端口数分别达到了48和68个,尽管PCIe 3.0 Switch也有64 lane的(可拆分成16个x4),其总带宽与最先进的SAS Expander处于同一水平,不过它目前能够连接的SSD数量相对有限(SAS是每个link对一个设备,要是PCIe 3.0拆分成x1其带宽也能满足大部分需求),进一步级联扩展应该也是个问题。

解读EMC闪存战略:商品硬件+软件定义

李君鹏:“XtremIO结合了Isilon横向扩展的体系架构和Data Domain线内数据消重的功能。XtremIO目前来讲我们支持到8个Brick,再多能不能行?EMC现在没有时间来测。我们看到从横向可扩展的角度来讲,它的性能提升几乎是全线性的。一个Brick提供的4K随机读是25万IOPS,而两个就接近50万,四个达到了100万。我们来看一下4K的随机写,一个的时候是10万IOPS,两个和四个的时候分别是20万和40万。而在测试这些的时候,它的所有数据服务功能都是打开的,没有关闭任何数据服务功能,它的IO响应时间低于1毫秒。”

商品硬件Scale-out vs. 定制化闪存模块

如果看单个XtremIO Brick的性能,许多PCIe闪存卡一块就不比它差,当然前者提供的共享和高可用性是后者不具备的。XtremIO性能上的优势更多在于Scale-out,我们拿它作为使用SAS SSD全闪存阵列的一个代表;那么IBM收购TMS后重新推出的FlashSystem、Violin Memory,以及戴尔和WD参与投资的Skyera,则属于定制非标准闪存模块。源自TMS技术的FlashSystem和Violin也有支持高可用的型号,有点像双控制器全冗余组件的方式,并且单台设备的IOPS可达50万甚至上百万(如Violin Memory 6616),也不见得逊色于“商品硬件”的Scale-out扩展。

解读EMC闪存战略:商品硬件+软件定义

李君鹏:“XtremIO跟“N”品牌同类产品的比较。N品牌从横向体系架构扩展、线性的可扩展性、可预测的性能、线内消重、精简配置、空间高效RAID保护、快照、VAAI方面都不具备。而iSCSI N品牌是可选的。

我们来看下XtremIO提供了哪些数据服务。第一个是线内数据消重,XtremIO以4K的大小为单位,也就是当下一个页来的时候,它首先会比较跟前面的页有什么区别,如果有重复的,它就不会在阵列里边存这个重复的页,这个有什么好处呢?为什么要线内?线内(in-line)就是当IO进来的时候就消重,而不是等到存完了以后读出来再消重。线内消重有几个好处,最主要是我们讲闪存有一个耐用度,因为闪存某一个页如果要往上写的话,必须先把上面的内容给清掉,先擦写了以后再往上写。而擦写闪存的时候,要以块为单位来擦写。先把写进来的4K IO的一页,放在XtremIO的缓存里,等到消重了之后,再写到后端的SSD盘的页上,极大延长了SSD盘的寿命,SSD盘的磨损是均衡的,这是线内消重提供的重要好处。消重的效果怎么样?一般数据库类的应用,我们看到的效果至少是10:1以上,也就是说你需要60TB的容量,如果用XtremIO,你买6个TB就可以了。

精简配置是指没有必要先把容量全分出去,只有当写IO进来的时候,我再分配容量给你。精简配置和非精简配置相比好处是什么?是因为(传统上)每一个应用,你只要分给它,它就把这个容量给占有,即使它不用,你也不可能再用了。所以XtremIO全部用100%精简配置,这样可以使我们更充分的利用闪存的资源。

还有一个是数据保护,这种保护既不是RAID1,也不是RAID5,而是N+2的保护。保护所占的容量只是8%,所以它保护的效率是极高的,性能也是极高的。快照是可读写的——有的产品产生的是只读的快照,而XtremIO的快照是可读可写的。XtremIO从开始配置到提供服务,不用做任何的调整。它的配置极简单,不需要做规划,不需要做调优。”

解读EMC闪存战略:商品硬件+软件定义

N+2保护与RAID DP:为什么要等待FlashRay?

根据XtremIO的RAID规格,我们可以计算出它的保护方式是23+2,这也符合其产品图片中驱动器机箱的2U 25盘位。由上表,NetApp Data ONTAP 8.0.1默认和最大的SSD RAID组大小分别为21+2和26+2,也就是说RAID-DP技术支持固态盘不见得就逊色于XtremIO?只是FAS/V系列统一存储为磁盘优化的WAFL文件系统不适合闪存介质,所以才会有将E5400的驱动器“简单”换成SSD之后的EF540。未来的FlashRay还是值得期待的,只是它预计比XtremIO要晚大约一年,到时候看能否再现Data ONTAP的辉煌吧。

从EMC FAST到戴尔流动数据

解读EMC闪存战略:商品硬件+软件定义

如上图,EMC FAST最终的理想是在XtremSW(DAS或闪存缓存)、XtremIO全闪存阵列和传统的混合阵列之间进行全自动存储分层。如果将它与戴尔流动数据进行比较:左边对应Fluid Cache for DAS、右边Compellent(还有EqudlLogic?),据了解今年下半年戴尔将延伸Fluid Cache,它能够作为连接到PowerEdge 12G服务器Compellent阵列的前端;尽管当前戴尔还没有推出自己的全闪存阵列,但有消息他们将计划将Violin加入分层存储——即Compellent存储阵列将一个Violin全闪存阵列视为一个集成的存储层。那么两家公司的战略还是比较相似的,看来英雄所见略同啊。

未经允许不得转载:存储在线 » 解读EMC闪存战略:商品硬件+软件定义
分享到: 更多 (0)