中国数据存储服务平台

Memblaze PBlaze4企业级NVMe SSD评测

产品介绍和规格

Memblaze位于中国数据中心技术发展最快的北京,公司规模虽小但是一直致力在全球PCIe SSD市场上做出自己的成绩。此外,中国数据中心领域的领导者们也在加强对闪存技术的支持,并且愿意采用更为高效和低成本的新架构,这也使得中国闪存市场的竞争力得到了增强。
中国新型的数据中心呈现出极高的增长速度,这与线上用户数据的激增有很大关系,Memblaze的成功也是源于中国互联网超大规模数据中心的发展。中国数据中心解决了很多现有基础架构存在的问题,因而到了一个前沿的水平,而在当前全球的企业存储领域,一个先进的基础架构均对闪存有着非常大的需求。中国Top 50的超大规模数据中心均采用了Memblaze的产品,其客户数已突破200家,其中包括百度、腾讯及优酷等公司。

Memblaze上一代产品PBlaze3L和Pblaze3H拥有一项琴键技术,每隔25GB就会有一个新的容量版本供用户选择。这一设计使得用户可以根据自己的业务需求进行细致的定制,避免存储资源的浪费。当然,我们也看到不断下降的闪存成本以及集群架构都降低了闪存资源的浪费。

最新的Memblaze PBlaze4 SSD从FPGA和私有驱动转移到了支持NVMe标准的PMC Flashtec ASIC芯片。ASIC具有低功耗的优势,并且支持NVMe 1.2协议。

很多第三方SSD控制器设计没有给厂商留下发挥的控件,造成很多厂商的固件雷同而僵硬,PMC控制器优势就是比较灵活,允许厂商根据自己的容量和性能特点进行设计。这个观点在我们的测试中得以印证,HGST的SN150使用了和PBlaze4一样的控制器,但是在性能上却有着不同的表现。

PBlaze4和SN150最基本的不同在于前者使用了15nm的东芝NAND,这也是我们实验室接受的第一个使用这种NAND芯片的企业级SSD。东芝的15nm NAND具有较高的成本优势,并且适用于严苛的数据中心环境。

产品规格

Memblaze将控制器转向PMC的直接效果就是性能的提升,PBlaze4可以提供3GB/s连续读带宽和2GB/s连续写带宽。半高半长的板卡版本拥有780000/180000 4K随机读/写IOPS性能,这个版本的PBlaze4使用PCIe3.0x4接口,容量从800GB到3.2TB不等。此外,PBlaze4还有一个全高半长的版本,可用容量6.4TB,功耗35w,使用PCIe3.0x8接口,连续读/写带宽可以达到3.4/2.5GB/s,4K随机读/写IOPS可以达到800000/250000.

另外一个关键的改变是Memblaze推出了2.5英寸U.2(之前的SFF-8639)接口的版本。2.5英寸版本与半高半长的卡版本有相同的容量和性能,并且使用相同的NAND芯片,寿命为3DWPD。

PBlaze4通过MemSolid2.0技术保障产品具有企业级的可靠性,这一技术集合中包括增强的断电保护、高温保护、pSLC、flash-aware奇偶校验方案以及5年的质保。而另一项技术集合MemSpeed2.0主要包括全局FTL等技术提高产品性能。

架构和管理功能

Memblaze PBlaze4拥有半高半长和全高半长两种板卡外形和2.5英寸U.2接口的硬盘外形。产品通过内部的风道设计加速内部空气流通,以达到降低控制器和其他组件温度的效果,此外,还有两颗电容用于意外掉电时将数据从内存转移到闪存上。



PBlaze4使用东芝15nm MLC NAND,相比PBlaze3L使用的东芝24nm NAND成本更低。另外还有9颗美光4Gb DDR3-1600 DRAM,HGST SN150也装了相同的PMC控制器和DRAM,但是使用了32 packages的东芝A19nm的eMLC新品,这种芯片的耐擦写性高于15nm MLC,但是成本也相对较高。Memblaze上一代的PBlaze3L使用了Kintex-7 FPGA新品,而板卡和2.5寸盘形态的PBlaze4均使用了16通道的PMC FlashTec PCIe3.0x8 ASIC是PMC最新的NVMe控制器(他可以兼容数种NAND)。其中2.5寸盘支持热插拔。PBlaze4提供200万小时MTBF及10-17 UBER特性。

功能设置

PMC Flashtec控制器允许厂商根据客户需求对固件进行深度的定制化开发,Memblaze也是讲MemSolid和MemSpeed两大核心技术集合从PBlaze3系列转移到了PBlaze4上,并且将版本升级到了2.0版。

MemSolid 2.0

MemSolid2.0提供强化的断电保护功能,在PBlaze4有两颗电容,能够在断电之后为设备提供电量一遍将设备内存上的数据刷到闪存上,避免意外掉电带来的数据丢失。此外PBlaze4一个关键的升级在于pSLC技术的采用,pSLC在软件层面使得标准的MLC NAND只存1bit数据,以此来提高介质的耐擦写性和性能,而这块MLC NAND就被称为pSLC。显然使用pSLC存储普通的用户数据会造成资源的浪费,所以Memblaze的pSLC主要用于存储元数据,这点在我们的测试中得到了证实。pSLC会结合多副本技术进一步提高元数据的安全,此外还有在NAND层面做的类似RAID5的数据保护技术(RAIN)。

PBlaze4有一个高温保护技术,SSD温度到达70C,设备就会通过降低性能减少控制器等组件的负载,当温度超过100C,程序会被关闭直到温度恢复正常水平。MemSolid2.0中还有增强的ECC校验技术,ECC将来会进化到LDPC。

MemSpeed 2.0

一直以来SSD注重性能的提升,但是却很少顾及应用的实际需求,即对性能持续性的需求。MemSpeed2.0是Memblaze为了让PBlaze4能够长时间提供稳定的高性能以及QoS特性而研发的多项技术的集合。

Memblaze PBlaze4 设计并采用了全局FTL的映射算法,所谓全局映射是指任何LBA 都可以和PBA 一一映射。全局映射提高IO 的QoS,优化了对flash 的磨损均衡,提高整体SSD 寿命。

NVMe一个最大的优势在于支持64000独立的IO 提交/完成队列,而AHCI只支持1个。PBlaze4 可以支持129 个队列(1 个管理队列,128 个提交队列和128 个完成队列)。硬件多队列在SSD 内部通过队列引擎实现,同主机端的队列组一样,硬件队列引擎同样有一个提交队列引擎和完成队列引擎。提交队列引擎可以以极高的速率从主机端提交队列中抓取指令,并分发给相应的处理单元。处理单元将处理结果返回并提交到完成队列引擎,再分发给主机端的完成队列,极大提高了对指令的并发处理。(我们测试中有一个是针对于QoS和性能持续性的,我们将分析Memblaze技术对于设备性能和可靠性提升的效果)。

4K随机读写测试

我们这次测试了多个容量点和不同预留容量的SSD,因为容量是采购过程中一个非常重要的参考指标。我们也强烈要求客户将不同容量点的具体数据进行对比。我们此次测试的SSD产品有3.2TB的Memblaze PBlaze4,3.2TB的HGST Ultrastar SN150以及1.6TB的英特尔DC P3700,以上三款产品均使用了一颗ASIC作为控制器。此外还有使用1个FPGA作为控制器的1.2TB 的PBlaze3L,使用了多颗控制器的1.6TB的英特尔DC P3608。值得一提的是DC P3608在加个以及耐擦写能力上较其他送测产品具有一定的优势。














Memblaze PBlaze4在预处理阶段,IOPS性能上有比较大的优势,在256OIO重负载条件下其性能超过了英特尔的DC P3608,此外在32OIO以及更高OIO条件下,PBlaze4都保持着性能优势。而在1和2OIO条件下,其IOPS性能和HGST 的SN150处于同一水平(两者使用了同一颗控制器和同样的测试环境)。

延迟-IOPS子图可以看到在IOPS较低时PBlaze4并没有优势,但是随着性能的提升,其延迟提升速度明显慢于其他几个送测产品。我们同样对PBlaze3做了这样的测试,可以看出PBlaze4的表现较PBlaze3有了质的提升。

QoS-IOPS图揭示了几个SSD在不同的工作负荷下提供QoS的变化,可以看出在120000 IOPS之前,除了PBlaze3,几个SSD的性能表现相当,但是在之后几款产品陆续出现了延迟快速增大的点,而PBlaze4这一临界点在170000 IOPS左右(此时PBlaze4的延迟为5ms)。在QoS 32 OIO图表中是对于轻量负载下产品的QoS有一个对比。

PBlaze4的功耗要比英特尔DC P3608外的几款产品高,但是随机写性能也比其他几个产品高,可以说在IOPS和功耗之间取得了一个均衡。SN150和PBlaze4在这轮测试中表现相当,对于相同架构的两款产品,得到这样的结果我们并不惊讶。

图片331~3310










使用PMC控制器的SSD在随机读测试上表现相当,分别排在DC P3608之后的第二位和第三位(256OIO),DC P3608能够取得最好成绩令人惊讶,因为单颗PMC控制器比两颗控制器的英特尔SSD要更为灵活。此外,在32OIO测试中,PBlaze3L取得了最高成绩,这也令人感到意外,PBlaze4和SN150在1和2OIO随机读测试中表现较好。

QoS-IOPS一图中,PMC支持的两款SSD在随机读上都表现非常好,而DC P3608则是表现最为平稳的一个,但是需要指出的是整个测试中大部分时间PBlaze4的成绩都要比P3608好。在QoS 32OIO一图中,Memblaze和HGST的4k随机读延迟始终没有超过0.5ms。

图片341~348





混合读写成绩是我们评判一个SSD产品最高性能的重要指标,PBlaze4和Sn150在一次获得了比较好的成绩。特别是在比较极端的测试条件下,在100%读中PBlaze3L和SN150分列第一和第二名,而在100%写中,PBlaze4则表现最为突出。需要指出的是PBlaze3L虽然在100%读中表现较好,但是在读写负载混合的场景中表现不如其他产品,这在于一些老款SSD中比较常见。

在混合负载QoS图表中,随着压力模型中随着写IO比例的提高,PMC支持的两款SSD表现都不是很好,256OIO和32OIO有着相同的测试结果。令人意外的是在32OIO  4k混合读写测试中,PBlaze3L表现是最好的。

8K随机读写测试

图片411~4114














 

PBlaze4在预处理过程中的随机写速度令人印象深刻,但是在8K 随机负载中,在1OIO和2OIO测试条件下表现不如其他产品,而在32OIO至256OIO测试条件下成绩都处于领先,只是性能波动略高于其他几个产品。

在标准差子图中性能变化曲线更为清晰,可以看到PBlaze4延迟快速增长发生在75000IOPS之后,这一结果要好于其他几个参与测试的SSD,在32OIO条件下PBlaze4表现也不错,曲线和英特尔的DC P3608类似。

英特尔 DC P3700(一个非常通用而低调的设备)总是能顺畅的完成测试而不需要过得干预,但是能产生比较稳定的测试结果。但是DC P3700在我们的功耗效率测试中表现非常突出。

图片421~4210

DC P3608得益于两个控制器,在256OIO条件下4K随机写预处理中每IOPS的功耗是最低的,但是出乎意料的是DC P3608在4K和8K随机读的标准差结果上表现比较差。而SN150和PBlaze4在32和256OIO条件下功耗都比较稳定,PMC Flashtec支持的两个SSD轻松地在QoS相关的指标上取得了比较好的成绩,在读上的优势也比较明显。

图片431~438

在混合负载测试结果中,读写比例在70/30至20/80之间时,PBlaze4、DC P3700和SN150表现相当。在线形图上,性能一致性的结果中,英特尔DC P3700在QoS 32OIO图表中处于一个领先的位置。

QoS图表中,在写负载设置为最坏的方案中,PBlaze4和SN150在32OIO测试中随机写的QoS有些降低,在256OIO测试中表现同样较差。

128K连续读写测试

图片511~5114

Memblaze的PBlaze4在连续写预处理过程中处于领先地位,并且比起其他同类竞争产品具有更大 灵活性。PBlaze3L在达到稳定状态前可提供一种独特的模式,但是无论如何,它的测试结果都大大超过了其他测试产品。

Memblaze很好地按照连续写负载要求调整了PBlaze4的设计,令其成为32至256 OIO测试中表现最好的设备。在1和2 OIO轻量级写负载条件下,英特尔的产品表现较好,这点从“延迟与IOPS的关系”的子图表可以看出。

有趣的是,在对 “QoS与MB/s的关系”的图表中,PBlaze4和SN150的表现有着比较大的差别。在低负载条件下,它们都有不错的表现(异常值均持续较短)。但是随着带宽升高,PBlaze4表现要好于SN150。遗憾的是,它在QoS 32 OIO断点图中显示的结果却不大令人满意。大量SN150和PBlaze4(第1到第30OIO)的测试结果都高于英特尔产品的结果,这表示尽管异常值持续时间不长。

连续工作负载会分离出最大SSD能耗指数,这一轮的测试也不例外。正如我们所料,DC P3608在预处理阶段功耗最大。PBlaze4在测试阶段的功耗也相当大,但当我们考虑到“MB/s每瓦”图中显示的性能,我们发现所有的单控制器SSD的效率变化趋势都非常接近。

图片521~529

我们收到过少数对HGST的SN150的投诉,客户指出该产品在128K连续读负载状态下的性能变化有异常情况,即产品在256 OIO时性能达到峰值,而在大部分低负载运行状态下,性能处于低谷。PBlaze4的连续性能变化趋势则与传统产品相似。任何一款单控制器SSD与高性能的双控制器DC P3608在连续工作负载方面都是无法比较的,但是SN150在16-32 OIO条件下的性能具有相当高的竞争力。

除了在最小工作负载(1、2 OIO)状态下,PBlaze4在其他方面都与令人印象深刻的DC P3700产品不相上下,“延迟与MB/s的关系”子图表的数据证明了这一点。

图片531~538

混合工作负载测试强调了Memblaze的PBlaze 4和HGST的SN150独特的固件定制特点。PBlaze 4更注重承担以读为主的连续工作,而SN150更擅长连续纯写入的工作。在256 OIO条件下,SN150在处于90/10~70/30的读/写工作负载时,QoS表现略差,但在大部分其他测试条件下,该产品都较其他同类产品更具有竞争力。

令人惊讶的是,PBlaze4在32 OIO混合连续测试中表现惊人。尽管DC P3608的评分最高,但PBlaze 4是单控制器SSD中表现最好的。

OLTP,电子邮件,文件和网络服务器工作负载

图片611~6112

在预处理阶段,Memblaze的PBlaze4与HGST的SN150表现相当,并且在OIO测试期间,两种产品在性能方面的差别也不大。在256 OIO条件下,SN150和PBlaze4相较其他产品,都具有领先的性能, 而PBlaze4的性能略超过SN150。在32 OIO条件下,两款产品均领先于其他同类产品,紧随其后的是英特尔的DC P3700。

DC P3700产品表现出与以上两款产品类似的“延迟与IOPS的关系”图,但在“QoS与IOPS的关系”图中,其QoS值略低。在能效测试中,DC P3700领先于其他SSD产品。

图片621~6212

而在电子邮件测试中,Memblaze的PBlaze4在预处理阶段性能超过其他产品,并在不同的OIO压力测试中,超过大部分产品。PBlaze4和SN150显然更擅长以写为主的随机负载。同时,DC P3700与PBlaze4和SN150有着相似的延迟曲线,但在“QoS与IOPS的关系”图表中,其“最差性能指数”略高于其他两款产品,并具有更好的标准差中值。

图片631~6312

而HGST的SN150在文档服务器工作负载测试中优势较大,PBlaze4和英特尔的DC P3608也相差不多。在高负载下,SN150显然更具优势,但PBlaze4和DC P3608在256 OIO条件下也不甘落后。在较低OIO条件下,DC P3700性能超过了SN150和PBlaze4。并且从QoS 32 OIO断点分布可见,DC P3700具有略好的一致性指数。值得一提的是PBlaze4不仅价格远低于英特尔的同类竞争产品,还具有良好的性能指数和更好的节能效果。

图片641~6412

Web服务器测试中采用的均为随机读取测试,读取量少却不尽相同。DC P3608的双控制器架构令其在这项测试中大幅领先,远远甩开了SN150,以及紧随其后的PBlaze4。在这一方面,DC P3700超过了PBlaze3L,这说明对于后者来说,随机读的工作负载是其一大弱点,这以结果是没有预测到的。

直观来看,DC P3608在这一轮测试中取得了最好的成绩,但是SN150作为一个更加主流的方案,获得了第二名的好成绩也很不错。

结论

Memblaze在其新产品中转使用最新的PMC Flashtec控制器。我们将这批产品与其上一代FPGA驱动的PBlaze3L相比较,发现这一代产品为公司取得了重要的发展。PMC控制器已在更大市场上投放多年,因此其总体架构是牢靠、成熟的。

当一家公司使用第三方制造的SSD控制器时,经常会遇到的一个问题就是缺乏市场时效性。并且,如果出现问题,公司就会随时受到控制器制造商的牵制,这种情况在客户空间中已屡见不鲜。然而,PMC为其用户提供了广泛的控制器选择空间,其可编程的特性令控制器制造商可以根据客户的需要进行产品定制。

不同产品具有相近性能也是有可能的。比如,我们注意到HGST的SN150和Memblaze的PBlaze4都使用了Flashtec控制器。在低负载(1或2 OIO)条件下,两款产品以写为主的工作性能非常接近,这是它们之间最直接的相似之处之一。虽然PBlaze4在低工作负载下的写入工作负载不如同类竞争产品,但在重要的混合工作负载中却明显具有更佳的性能。很明显,供应商会为混合工作负载同时安装这两种SSD,也正因如此,这样的产品可以在这方面具备更可靠的性能。

尽管在性能方面有部分类似之处,这两款SSD在固件和NAND方面却不尽相同。两款SSD的预留容量和DRAM相等,但PBlaze4采用了东芝的15nm MLC NAND来替代HGST的SN150所安装的东芝A19nm eMLC。

Memblaze通过其最新产品开辟出了一条新的道路。PBlaze4是我们实验室采用的第一款15nm MLC企业级SSD。15nm NAND比大制程NAND的耐擦写性和性能要低,更适合追求成本客户。Memblaze仅使用标准的15nm MLC NAND就生产出这样一款具有竞争优势的产品,非常不错。更重要的是,Memblaze保持了产品的竞争力,并且在某些情况下,PBlaze4比A19nm eMLC的运行速度还要快。19nm eMLC NAND本身的耐擦写性很高,但是Memblaze仅用15nm NAND就达到了同样的3 DWPD(17.3 PBW)评级。鉴于这两款同类竞争产品的预留容量是相等的,这样的成就非同小可。

英特尔的DC P3700虽然一直是Pblaze4顽强的竞争者,但这款产品在4K和8K高负载状态下的性能却比不上Pblaze4。PBlaze4性能卓越,尤其是在随机读取时,其QoS值也非常出色。

PBlaze4在许多方面都优于DC P3700,并且可以与HGST的SN150媲美,甚至超过它。Pblaze4在性能方面非常具有吸引力,它一定会为Memblaze赢得更多市场竞争力。同时,它也面临来自同行业企业顽强的竞争,这些企业的优势在于全球销售和支持渠道。

Memblaze开发2.5英寸盘和全高半长(大容量卡)版本是一项明智之举。尽管它的尺寸(大容量板卡)更大,但这种设计将最大容量提升至6.4TB,超过了英特尔和HGST的SSD的最大容量。我们在实验室中测试的3.2TB半高半长版本与SN150具有相同的容量,而后者曾是单控制器半高半长SSD中容量最高的产品。

根据Memblaze与其战略经销商达成的合作协议,Memblaze并未披露相关价格信息,但一位该公司的代表曾表示Memblaze的产品与同类竞争产品相比,具有极高的竞争力。

我们习惯看到供应商每次推出的新产品在性能和一致性方面都超过上一代产品,但是PBlaze4为Memblaze带来了全方位的重大进步,这种进步将推动公司在激烈的竞争中继续前进。

未经允许不得转载:存储在线 » Memblaze PBlaze4企业级NVMe SSD评测
分享到: 更多 (0)