中国数据存储服务平台

性能与稳定性都想要?Crucial英睿达DDR5:Pro超频版值得关注

朱 朋博

前不久,英睿达发布了Crucial DDR5 Pro内存:超频版,它具有高达 6000 的DDR5内存频率,更低的36-38-38-80 时序。

作为一款强调超频的内存,它在性能指标上有了进一步提升,差不多是目前英睿达内存家族里性能最强的台式机内存,适合对极致性能有追求的游戏爱好者和专业用户。

性能更高的DDR5内存

这次手里拿到的是2X16GB的版本,官网上显示还有更大的24GB的版本,也支持6000MT/s。如果想要更大单条32GB的话,就只有5600MT/s可选了。

Crucial DDR5 Pro:超频版采用了铝制散热器,据说外观设计灵感源自折纸艺术。质感摸上去凉凉的,沉甸甸的。整体外观低调内敛,没有RGB灯条,适合喜欢低调,不喜欢光污染的朋友。

如今常见的DDR5的CL值都比较高,经常在40左右。相比之下,Crucial DDR5 Pro:超频版的CL数据更低。不过,在 6000频率下运行时,电压从原来的1.1V提高到了1.35V。

如果按照纳秒为单位来计算真实内存延迟,按照计算公式:真实内存延迟(纳秒)= (2000 / RAM速度) (纳秒) × CAS延迟。

DDR5 5600 CL46的延迟为16.43 ns,DDR5 6000 CL48为16ns,而新的超频版内存,DDR5 6000 CL36的延迟为12ns。这种延迟表现已经跟很多后期的DDR4一个水平了。

Crucial DDR5 Pro:超频版兼容 Intel XMP 3.0 和 AMD EXPO 超频配置文件。通常来说,使用XMP和EXPO都能相对安全地提升内存速度和时序,这些都是经过主板厂商和内存厂商测试之后才放出的,一般也不会影响CPU的保修。

超频请慎重

但是要注意的是,这款内存虽说是超频版的,但这里“超频”需要用XMP/EXPO配置文件来完成,所谓超频只是超过了 JEDEC 标准而已。所以,不要看见超频两个字就脑袋一热,疯狂超频,把参数调的过高的话,万一出问题是没法保修的。

Crucial DDR5 Pro:超频版产品介绍页里提到了内存保修相关条款,条款中说,如果时钟频率超过6000,或电压超出额定值1.35V,可能会损坏计算机组件,并使保修失效,美光不会对此类损坏承担任何责任。

从上方图表可见,Crucial DDR5 Pro:超频版推荐在三种模式下工作:

第一种是不超频,直接使用JEDEC默认的5600MT/s和默认的时序;第二种则是把它超到6000MT/s,同时获得更好的时序表现;第三种则是保持在5600MT/s,同样有更好的时序表现。

所以,为了整体的稳定性,还有硬件的安全性,我们也不会尝试这三种设置以外的配置,特别有探索欲的朋友也可以尝试进一步降低时序数据,提升一下频率什么的。

不过,国外有超频爱好者试了试,但发现超频的空间不大,提高电压带来的提升并不明显。

上机上电测试:

测试环境:

主板:华硕TUF GAMING X670E-PLUS WIF

CPU:AMD Ryzen 7600

显卡:技嘉3070魔鹰

系统盘SSD:Solidigm P41 Plus 2TB

电源:振华金牌全模850瓦

内存:Crucial Pro DDR5 6000 16 X 4

上机通电,在BIOS里设置为EXPO I 也就是DDR5 6000 36-38-38-80,此时的电压为1.35V。

如果设置为5600的话,电压则为1.25V。如果按照JEDEC的默认值,应该就是1.1V了。

正常开机运行后,运行CPU-Z查看基本的硬件配置信息,如下图:

跑分测试对比

接下来,我们用AIDA64的跑分工具简单进行一下性能测试。

上图左侧展示的是在内存频率为6000时的跑分测试情况,右侧展示的是在内存频率为5600时的跑分测试情况。

Read: 读取速度,即内存在单位时间内可以读取的数据量,这里是62149MB/s vs 61870 MB/s/。

Write: 写入速度,即内存在单位时间内可以写入的数据量,这里是88348 MB/s vs 82820 MB/s。

Copy: 复制速度,即内存执行内部数据复制操作的速度,这里是63258 MB/s vs 62533 MB/s。

Latency: 延迟时间,指完成一次读取操作所需的平均时间,这里是71.8纳秒 vs 76.9纳秒。

在我们的测试中,当频率从5600MH提升到6000MH时,各项性能指标都有所改善,特别是写入速度和延迟,这表示这款英睿达 Pro在6000MHz的频率下确实表现更佳。这对于确保系统在处理高负载任务时保持流畅是很有帮助的。

当然,内存频率高并不总是意味着实际性能就一定会提高,因为内存性能也受到其他因素的影响,比如时序和延迟等。

而当各项参数提升时,意味着内存可以更快地处理数据,这对于那些对内存速度敏感的应用,比如大型游戏、视频处理软件、以及需要大量数据读取和写入的科学计算等,都有明显的好处。

做个简单的对比,当使用4条英睿达5600MH/s,时序数据为46-45-45-90内存,运行在5600MH时,跑分情况如上图这样(多跑了几次,取了个相对稳定的中间值)。

对比之下,其内存频率稍低,不到2800MHH,这可能会对读写速度和复制速度略有影响。

实际跑分显示,内存读取、写入速度以及复制速度都稍微下降,延迟也从76.9 ns增加到80.4 ns,内存响应速度也略有降低。

这也能看出来,将内存频率提升到6000MH/s之后带来的提升。

成本分析与购买建议

截止到2024年4月,Crucial英睿达Pro 6000MH(CL36),32GB(16GB×2)的售价大约为899元,而Crucial英睿达Pro 5600MH,32GB(16GB×2)的售价大约为699元。

对于普通个人非生产力用户而言,从性价比的角度来看,目前,还是Crucial英睿达Pro 5600MH的性价比更高。

对于专业玩家和电竞选手、专业内容创造者、科学和工程应用研发人员、超频的爱好者,更高性能的内存,提供了更多的超频空间和更好的稳定性则更重要一些。

Crucial英睿达Pro 6000MH,这是目前英睿达性能最高的DDR5台式机电脑内存,当然,市场上还有性能更高,超频能力更强的内存。

但对于那些,对于性能和稳定性要求都很高的用户而言,通常倾向于使用直接生产内存颗粒的大厂的产品,比如背后有美光的,来自英睿达的内存,比如Crucial英睿达Pro 6000MH这种。

正文结束,最后提一个个人发现的小知识点:

在了解Crucial英睿达Pro 6000MH内存时,发现现在台式机的DDR5内存自带的On-die ECC与服务器内存ECC是有区别的,前者可以检测并纠正单比特错误,而后者可以纠正更多的错误类型,例如双比特错误。

相关内容推荐:DDR4用得好好的,为什么要搞DDR5呢?

官网地址:https://www.crucial.com/memory/ddr5/cp2k16g60c36u5b

2024数据存储力量第三期:大道云行,全闪软件定义存储领导者

朱 朋博

引言部分:

随着云计算、大数据和人工智能技术的不断进步,数据存储作为技术革新的核心,其重要性日益凸显。在这一背景下,DOIT传媒推出《2024数据存储力量》专题系列文章,旨在深入探索数据存储领域的最新发展,分享行业领军企业的创新实践以及市场前沿动态。

《2024数据存储力量》专题第三期,我们将为大家介绍被称为新一代全闪软件定义存储领导者的大道云行TaoCloud。

图来自:大道云行

公司历史和背景:

公司介绍:

大道云行是新一代全闪软件定义存储领域的代表厂商,这是一家坚持长期主义理念的全闪存企业,手中掌握全自研、高性能、容量型、低碳型全类产品,其产品线包括高性能分布式全闪存块存储产品FASS、海量对象数据存储系统FOSS,以及高性能分布式文件存储产品FAFS,可分别满足云计算、智能制造、AI/HPC等高性能业务场景的存储需求。

成立时间:2015

创始人:刘爱贵

创始人简介:大道云行CEO刘爱贵,中科院博士、中国计算机协会( CCF )存储专委会专家,深耕存储领域二十余年,拥有存储相关发明专利十余项,发表学术论文10余篇。

公司发展历程与重要里程碑:

2015——大道云行创立,启动SDS1.0研发。

2016——TaoCloud正式发布XDFS产品,致力为用户提供更专业的存储产品。

2017——发布第一代信创产品,获得国家高新企业认证。

2018——启动SDS2.0研发,团队成功构建创新产品技术壁垒。

2019——加入工信部信创委员会,跻身SDS存储第一梯队。

2020——全闪FASS产品首发,引领全闪存储新篇章。

2021——启动全闪文件系统研发,持续加码全闪SDS3.0技术研发。

2022——重庆大道云行总部成立,TaoCloud获国家“专精特新”小巨人奖项。

2023——TaoCloud正式发布FOSS新品,安徽大道云行总部成立。

产品和服务概况:

主要产品和服务类型:

大道云行主要提供分布式存储软件、分布式存储一体机、以及相应解决方案与技术咨询支持服务。大道云行的分布式存储产品线已从SDS 1.0全面转向SDS 2.0(全闪存分布式存储),产品线包括高性能分布式全闪存块存储产品FASS、海量对象数据存储系统FOSS,以及高性能分布式文件存储产品FAFS,可分别满足云计算、智能制造、AI/HPC等高性能业务场景的存储需求。

产品的技术特点和优势:

早在2019年,大道云行就开始了对全闪存分布式技术的研究与产品布局,并陆续推出基于全闪存分布式技术的块存储、对象存储以及文件存储产品。他们针对闪存介质的特性设计,结合多核CPU处理能力与无损网络技术,可以提供远高于传统分布式存储的IO处理能力,满足众多新兴业务场景越来越高的存储性能需求。

图来自:大道云行

1、FASS全闪分布式块存储:FASS是SDS 2.0的代表产品,支持弹性扩展和标准网络访问,在原生分布式架构基础上,采用kernel_bypass、并行流水线、微控制器、端到端NVMe、裸盘管理等技术。可轻松实现千万级IOPS性能和百微秒级延迟,为企业提供弹性可扩、高性能的块存储服务,满足云计算等业务的苛刻性能和动态增长需求。

2、FOSS全闪分布式对象存储:这是一款分布式对象存储产品,适用于海量数据存储以及新兴业务场景,它采用先进的分布式全闪架构,以数据的长期、可靠、绿色低碳、高性能存取为目标,支持超大规模数据的弹性存储。FOSS软件栈采用弹性微计算流水线架构,提供高OPS和高带宽存储服务,支持海量文件数据的高并发吞吐,有效将非结构化数据高效存取使用转变为企业的核心生产力和竞争力。

3、FAFS全闪分布式文件存储:在人工智能技术推动下,AI/大模型、生命科学、自动驾驶、视觉特效、科研仿真等技术应用越来越广泛,新兴业务不仅要求超高算力,对存储系统的存力也提出了更严苛的需求,企业存储系统开始朝着高并发、低延迟、海量文件、云/容器化方向发展。FAFS是针对以上场景IO特性自主研发的高性能全闪文件存储系统,它基于原生分布式架构及NVMe介质,可以提供高带宽、高OPS、低延迟的高性能文件存储服务,适用于各类AI应用、EDA、HPDA以及云计算等业态场景,助力用户发掘新的数据价值。

针对的市场、场景或者行业用户群体:

1、FASS分布式全闪块存储可以提供高IOPS、低延迟、弹性扩展的块存储服务,适用于虚拟化、裸金属云、云桌面、数据库等业务场景,满足政企、航天航空、互联网、金融、科研、广电等行业的高速数据处理需求。

2、FOSS分布式全闪对象存储可广泛应用于广电媒体、卫星/气象/地质数据、工业互联网、大数据采集、数据湖、视频监控、备份归档等业务场景,满足政企、航天航空、互联网、金融、科研、制造等行业的数据存储和处理需求。

3、XDFS分布式统一存储弹性的Scale-out集群架构能够迅速响应用户不断增长的容量及性能需求。可广泛应用于安防、云计算、融媒体、人工智能、HPC、大数据等场景,满足交通、广电、医疗、科研、政府军工等行业的需求。

4、FAFS提供的高性能文件存储服务可以同时满足新兴业务场景的弹性扩展、并发小文件访问需要,可广泛应用于AI/大模型、EDA、HPC/HPDA、科研仿真、融媒体、高清非编大数据等场景,满足金融服务、泛互联网、科研高校等各类需求。

合作伙伴和客户案例:

主要的合作伙伴和供应商:海思、宝德、超聚变、金山云、航天壹进制等国内知名IT厂商;

信创认证:与飞腾、鲲鹏、海光、龙芯、兆芯、申威等主流国产CPU,银河麒麟、统信等主流国产操作系统,金山云、EasyStack、ZStack、安超云等国产主流云计算系统均通过兼容性互认证。

成功的客户案例或合作项目:

成功案例:央视网、中科院空天院、清华、北大、新华社、北医三院、复旦大学医学院、广州电信、山西电信、云从、商汤、中国人寿、中国电科、长沙超算中心、航天科工

未来规划和发展方向:

公司的长期战略和未来发展计划:

大道云行将秉承“全闪存储,自主研发”战略理念,致力于推动技术创新和产业革新。深度拓展人工智能、金融信创等领域应用,提升业务处理效率。响应国家信创战略,积极推进信创替换目标。同步将实施“出海计划”,以全球视野带动企业建设,不断提升国际竞争力,实现跨国经营与资源共享。

Q&A环节

1,做好分布式企业存储的关键技术有哪些?可结合贵司产品展开介绍一下。

分布式存储相较于集中式存储,其核心优势在于分散式存储带来的高可靠性、可扩展性和性能优化。然而,这种架构也带来了数据一致性、容错性、性能和管理等多重挑战。大道云行自2015年起专注分布式存储研发,推出的XDFS、FASS、FOSS产品均采用分布式架构,深谙技术细节的重要性。

在分布式存储中,元数据管理至关重要。我们采用分布式元数据管理架构,配备定制的分布式KV数据库,确保原子性、一致性和轻锁特性,提升系统可扩展性和可靠性。

数据一致性是另一关键。我们融合强一致性协议Raft与MVCC技术,确保并发读写数据的一致性和跨节点操作的原子性。

在数据冗余策略上,我们平衡数据冗余、存取效率与性价比。通过优化编码算法与并行计算,提升计算效率,实现90%以上的空间利用率。

性能优化是分布式存储的关键。我们采用灵活分片、负载均衡、计算与缓存优化等技术,确保系统性能最优。特别地,FASS采用XPE加速引擎、Kernel Bypass,虚拟内存管理等技术,充分挖掘和利用基础硬件的性能潜力。

此外,我们重视数据安全性与隐私保护,采用加密、认证、授权等技术,结合WORM、多版本、快照等功能,确保数据的安全可靠。

2,FASS全闪分布式存储、FOSS全闪对象存储、FAFS全闪文件存储产品设计背后有哪些思考?三个产品之间的关系是怎样的?

随着闪存的不断成熟和普及、成本日益下降,SSD闪存盘取代HDD机械硬盘是大势所趋,基于HDD的分布式存储(SDS1.0)也在朝全闪存分布式存储(SDS2.0)转变。然而,全闪存的分布式存储并非简单的介质替换,真正意义上的全闪存储必须对软硬件架构进行重新设计:硬件上增加CPU处理能力、拓宽通道带宽,利用无损网络;软件上采用新的存储协议、规避系统开销、优化IO路径、增加磨损平衡与垃圾回收机制,才能实现真正意义上的分布式全闪存存储系统。

在硬件上充分利用多核CPU、高速PCIE总线和无损网络的能力,在软件上针对全闪存介质的特性进行深度优化与打磨,大道云行分布推出了FASS全闪分布式存储、FOSS全闪对象存储、FAFS全闪文件存储产品,分别提供高性能块存储、对象存储、文件存储服务。

这三个产品都是典型的SDS 2.0品,针对全闪存介质优化与设计,采用原生分布式存储架构,不依赖特定硬件,有强大的弹性扩展能力,能够整合多个服务器节点的硬件资源并对外提供高性能存储服务。FASS、FOSS、FAFS都有很好的SSD亲和性和硬件利用效率,结合多核CPU、无损网络以及NVMe等技术,能够真正发挥出全闪存的性能,满足苛刻场景的需求。

FASS是大道最早的全闪存分布式存储产品,主要提供弹性的高性能块存储服务,可轻松达到千万级IOPS以及微秒级延迟,支持iSCSI、NVMeoF、Cinder、CSI等存储接口,适用于对存储性能要求较高的虚拟化、云计算、数据库等场景。

FOSS是面向海量文件场景设计的全闪存对象存储产品,他借鉴了FASS的高性能全闪存架构,并在其基础上开发了对象接口,可以满足智能制造、金融双录、AI/AIGC等新兴场景对高性能对象访问的需求,同时也可以支持传统的企业静态数据、备份归档的经典对象应用场景。

FAFS面向高并发吞吐、海量小文件高速访问等场景,采用全闪存架构的高性能文件存储产品,可以提供高OPS和低延迟的文件存储服务,适用于HPC/HPDA、EDA、AI、高清非编等高性能文件应用场景,可以取代高性能国外传统存储,通过SDS方案提供高性能文件访问。

3、FOSS全闪对象存储,用户接受度如何?会不会担心成本问题?是否会继续推出更冷的存储层级产品?

FOSS作为基于SDS 2.0新一代软件架构的对象存储产品,凭借卓越的高性能与可扩展性优势,在企业IT系统建设中脱颖而出,赢得了众多客户的青睐。目前,FOSS已成功应用于智能制造、金融保险、档案备份及人工智能等多个领域,其出色的性能与极高的性价比获得了客户的高度认可。随着数据湖、机器学习(ML)、人工智能(AI)、深度机器学习(DML)、生成式人工智能(AIGC)以及大型语言模型(LLM)等多样化数据需求的涌现,企业越来越认识到可操作数据的信息价值。这一趋势正推动FOSS市场快速增长,并使其受到越来越多数据企业的信赖与青睐。

FOSS在设计上显著提升了系统性能的上限,却并未增加客户的使用成本。它实现了卓越的性能加速,有效缩短了应用响应时间,从而助力企业实现更高的生产力、更迅速的洞察、更快捷的决策、更短的上市时间以及更快的独特收入/利润增长。同时,FOSS在设计之初就深入考虑了高性价比的需求,通过提供分层、压缩等功能,不仅满足了业务系统的支撑需求,更在价格上做到了极致优化。

目前市场上主流的存储介质包括SSD、HDD、磁带和蓝光光盘。FOSS已经支持SSD和HDD的分层存储,从而覆盖了当前主流的热温数据存储需求。至于剩余的存储介质,如磁带和蓝光光盘,它们主要被用作归档备份应用来存储冷数据,更适合与归档备份软件配合使用。在目前的方案层面,我们支持FOSS向更冷的数据层级进行数据迁移。然而,在产品层面,我们目前并没有将冷存介质嵌入的计划。但请放心,我们会密切关注市场需求,并根据实际情况灵活调整产品策略。

4、近几年以来,贵司主打的产品或者市场是哪些?

产品:FASS全闪分布式块存储、FOSS全闪分布式对象存储、FAFS全闪分布式文件存储。

行业及场景:AI人工智能、信创、金融科技、超算智算、数据要素、智能制造、军工等行业

AI:通过全线产品及解决方案满足AI工作流程不同阶段对存储的需求,包括学习训练阶端容器/云支撑底座,大规模训练阶段的高性能全闪文件存储解决方案,数据采集阶段的对象存储需求,以及推理、归档阶段的高性价比文件存储系统。

信创:全面适配国产化平台,满足用户不同场景下的信创需求,主要包含金融、政企信创替换,金融开发测试平台信创环境的构建,信创环境下的政务云等场景。

5、对于存储市场的趋势,特别是对于全闪的发展前景有哪些判断?

首先,中国缺少专业的存储厂商、内需市场大。

随着闪存技术的不断进步,未来全闪存储SDS的性能和容量将持续提升。新一代闪存设备、存储介质和存储架构的出现将推动全闪SDS实现更高的性能和更大的存储容量。

而随着全闪介质技术的不断成熟,成本则趋于不断下降趋势,大多数应用场景对于全闪SDS的需求也越来越旺盛,因此全闪SDS市场在不断地扩大。

而在国内SDS厂商中,大多数厂商都是基于开源开发的全闪存储系统,无论从性能还是自主可控方面都难以满足用户的需求,因此,自主研发的全闪SDS产品将会有很大的竞争优势和市场份额。大道云行作为新一代全闪软件定义存储领导者,拥有自主研发全系列分布式存储产品,手握行业高性能存储解决方案,为广大用户提供专业技术服务。

未来,SDS领域定会朝着全闪方向发展,全闪SDS将会继续向高性能、智能化、多云集成、容器化和安全性等方向发展,以满足用户在数字化转型和数据驱动业务中的存储需求。

Solidigm倪锦峰:闪存如何帮助企业应对GenAI带来的存储挑战?

朱 朋博

提起生成式AI,多数人首先想到的都是算力芯片,少数人会注意到闪存存储在其中的重要性。这其中,又有多数人只能模糊地意识到SSD是有价值的,但并不清楚SSD的具体作用。

2024年3月20,Solidigm亚太区销售副总裁倪锦峰做了一番系统性的介绍,让我们看到AI给存储带来的挑战,以及SSD固态盘在应对部分挑战时有重要作用。

AI给存储带来的挑战

首先是AI带来的数据规模挑战。生成式AI模型的参数规模通常非常庞大,为了提高模型的实际表现,经常需要需要准备大量训练数据。因此,存储系统要处理的数据量会越来越多,需要存储系统有足够的扩展性。

与此同时,如今高性能GPU不仅价格昂贵而且供应有限,如果不能将大量数据及时快速地传输给GPU,则会浪费宝贵的GPU资源,这对存储性能有了更高要求。当有了高性能的存储后,训练期间创建Ckeckpoint和从Ckeckpoint的速度也会大幅提高,也很有价值。

此外,AI还带来的功耗和空间管理挑战。来自Meta和斯坦福大学的研究表明,存储组件可能占服务器总能耗的35%,而高密度存储解决方案不仅能减少所需的服务器数量和机架空间,同时,还能直接减少了维持设备运行所需的能源以及散热供电。

AI在边缘场景中落地的挑战。在去中心化的趋势下,如果全把数据传回数据中心处理则会带来很高的成本,所以,数据的处理需要在更靠近数据源的复杂环境中进行,需要用尽可能少的空间和电力资源进行处理。

理论上来讲,闪存因为有非常高的性能表现,更少的空间占用,较高的存储密度和较低的功耗需求,在应对上述挑战中有不小优势。

在Solidigm看来,对于人工智能全流程场景,从数据摄取、数据准备、模型训练、Checkpoint创建和恢复,以及推理场景,SSD相较于传统的磁盘存储都有明显优势,充分可以证明SSD对于AI的重要性。

Solidigm可以帮助企业构建具有大型数据集的AI存储解决方案

过去几年以来,Solidigm继承自英特尔以来在企业级市场的积累,在市场上打造具有密度优势的SSD产品。作为最早在市场上力推QLC SSD的厂商,Solidigm在去年发布了61.44TB超大容量的SSD——D5-P5336,将业内存储密度提高到了新的水平。

Solidigm并非一味让客户接受QLC SSD,而是积极用CSAL让QLC发挥容量、密度和成本优势,配合高性能的SLC SSD作为写入缓冲区,将写入负载转换为对QLC更友好的顺序写入,减少写放大的同时,也优化了存储性能,最后提供高密度、高容量和高性能的存储。

值得注意的是,CSAL(云存储加速层)是Solidigm与Intel等合作伙伴联合开发的。最早是收费的产品方案,现在是开源的免费方案。据倪锦峰介绍,CSAL目前已经被成百上千家客户所使用,甚至一些第三方SSD厂商也在使用这一方案。

如今,CSAL在AI场景也派上了用场。

Solidigm D7-5810是去年新发布的SLC固态盘,Solidigm D5-P5336是刚才提到的基于QLC的最高61.44TB的固态盘,两者搭配构建的CSAL方案在顺序写和随机读上的性能非常有优势,可以最大化XPU的利用率。

当然,用户也可以选择性能和成本比较平衡的方案,选择采用TLC介质的D7-P5520或者D5-P5430,虽然在提高XPU利用率方面不如此前的方案,但在p99随机读延迟上的表现有明显提升。

如果用户最在意的是成本,则可以索性选择单盘最大容量高达61.44TB的D5-P5336,5年TCO成本表现最佳,但在提高XPU利用率方面的表现会比较差。

Solidigm在企业级SSD市场有非常完备的布局,既有强调性能和耐久性的SLC固态盘,也有强调大容量高密度优势的QLC固态盘,也有中间态的TLC,这使得用户可以根据需求灵活选择,构建适合大型数据集AI的存储解决方案。

AI正在推动QLC闪存存储普及

倪锦峰注意到,QLC在AI场景中的应用越来越多。过去几年中,倪锦峰的团队一直在打造用SSD替代磁盘的方案,但一直进展缓慢。这倒不是因为担心QLC耐久性的问题,因为QLC固态盘的大容量可以弥补擦写次数上的不足。现在随着AI技术浪潮的到来,QLC的方案备受青睐,很多用户都在积极采用大容量QLC SSD,特别是在北美市场上。

相比之下,国内用户目前主要的关注点还在于GPU上。一方面是因为一些人还没意识到SSD的重要性。另一方面,因为实际的软件和硬件环境缺少对于大容量SSD的支持,使得国内整体对于大容量存储方案的采用相对落后。

之所以北美市场先知先觉地采用大容量QLC SSD,说到底还是应用需求在推动的。随着如今GPU性能越来越高,单台服务器的功耗上限迅速攀升,为了减少功耗压力,很多用户都会积极尝试功耗更低的闪存方案。倪锦峰预计,中国用户在未来一段时间也会逐渐意识到这一点。

从2023年年底到2024年年初,SSD涨价的趋势已经越发明显。业内专家表示,结合当前公开信息可以预测,在未来几个季度,SSD还会继续涨价,未来甚至会面临供应不足的情况。随着越来越多用户意识到SSD在AI场景中的作用,这一情况可能更甚。

在国内市场,Solidigm也接触到了一些因为AI场景而升级闪存存储的案例,比如金山云用SSD加速金山云对象存储的案例。

金山办公在WPS办公软件中加入了一些AI功能,为了提高响应速度,金山云对对象存储进行了升级。在Solidigm的帮助下,金山云对象存储从原本的硬盘加Cache的方案升级为纯QLC SSD的配置,升级后,将加载40TB原始数据集的时间从535分钟(约9小时)缩短到了11分钟。

随着AI应用越来越多,企业会面临数据存储方面的挑战,而这些挑战大多都可以选择用闪存方案来应对,也讲推动QLC闪存的普及。

AMD Zen5曝光:标准版128核,小核心版192核

朱 朋博

AMD下一代Turin处理器最近被意外曝光,可能意味着不久即将正式发布。

一年多以前,AMD发布数据中心Zen4处理器,代号为Genoa(热那亚),现在轮到下一代处理器了。

有媒体注意到,外国社交媒体上有网友(@yuuki_ans)发布了疑似下一代EPYC霄龙处理器的照片。

随着AMD转向全新的Zen5架构,核心数还将继续增加。

虽然目前还不清楚这些CPU会在什么时候推出,但由于有了这样的曝光,想来不需要很久就能看到正式发布。

这位网友(@Yuuki_ans)发布了新的CPU的实物图,以及架构方面的框图。

从曝光的情况来看,预计Zen5会跟Zen4一样,也会有两个版本。

一个是标准版本的大核芯片,是数据中心主流的x86处理器。第二个则是小核心版本的,强调低功耗优势的Zen5c核心,优势是核心密度特别高。

据报道,标准版的处理器将配备128个核心和256个线程,比上一代的96个核心和192个线程又有了很大的提高。

与此同时,Zen 5c版本将拥有192个核心和384个线程,比Bergamo的128个核心和256个线程有了惊人的增长。

新一代处理器将支持DDR5-6000内存,高于Zen 4支持的DDR5-4800内存。同时,新一代还将支持PCle Gen 5和CXL 2.0,并将与现有的SP5插槽兼容。

泄露的示意图显示,标准版的Zen5有一个IO Die和16个CCD,而小核心版本的Zen 5c则有12个CCD和一个IO Die。

图中还可以看到,下一代Epyc具有32MB的三级缓存,所以,16个CCD加起来就是512MB,Zen5c与则有384MB的三级缓存。

AMD的这一代CPU将与英特尔的下一代至强展开竞争,第五代英特尔至强可扩展处理器在12月15日刚刚发布,相较于年初发布的第四代有较小幅度的提升,核心数最高从60提高到了64核,三级缓存也翻了近三倍。

英特尔计划在2024年推出更有突破性的芯片,新一代处理器将使用Intel 3工艺,将推出代号为SierraForest的能效核处理器,该芯片将提供最高288个核,直接与AMD的Zen 5c竞争。

在能效核的至强发布完成后,还将发布性能核的传统至强。目前,下一代性能核的至强公布的信息还比较少,随着新制程技术的采用,预计还会有较大幅度的提升。

带和不带散热片的英睿达T500 SSD,温度相差多少?

朱 朋博

2023年上半年,英睿达发布了高端消费级SSD,它就是基于PCIe 5.0的T700,作为T系列里的第一款产品,它的读写速度最高分别为12400MB/s和11800MB/s。

T700豪华散热片,高度达到了20.5毫米

T700的高性能表现令我印象深刻,它搭配的豪华散热片更让我过目难忘,实际使用中的温度情况也比我预想中要好很多。

T500散热片,高度为9.7毫米

现在,英睿达的T系列又迎来了一款次旗舰——T500,考虑到需要适配 PS5 主机的拓展硬盘空间,T500 的散热片设计并没有像 T700 那样夸张,但一番把玩下来,发现它压制温度的效果还是很不错的。

所以,预算充足的话,优先选择有马甲的版本。

次旗舰T500,更适合大多数人的4.0 SSD

2023年10月下旬,英睿达又发布为玩家和内容创作者准备的T500,这是T系列的第一款PCIe 4.0 SSD,它最大的亮点是在有高性能表现的同时,功耗还更低。官方宣称,T500的能效相比较之前的P5 Plus提高了40%。

同时,与之前基于PCIe 3.0的P3相比,性能翻倍。其中,顺序读写速度最高分别为7400MB/s和7000MB/s,4K随机读写IOPS分别为118万和144万。

英睿达官方介绍中提到,T500 在内容创建应用上最多可带来42% 的性能提升,帮助生产力用户更好地工作。

T500能将游戏加载速度提高最多16%,通过支持微软的DirectStorage,能减少CPU的占用,同时提高游戏纹理渲染速度。

T500可以作为PS5游戏机扩容的存储方案,考虑PS5官方要求连续读速度至少要5500MB/s以上,所以,T500所有版本都可以满足要求。

T500有两个版本,一个带有散热片,一个不带散热片(512G的都不带)。带散热片的是给PS5主机准备的,不带散热片的是给笔记本电脑准备的,台式机和工作站随意。

当然,预算充足,空间充足的,最好还是选带散热片的。

T500提供512GB、1TB和2TB的容量可选,2TB版本非常适合给PS5当扩展硬盘。毕竟,512GB和1TB的都有点小,4TB版本(如果未来有的话)都跟一台数字版PS5的价格差不多了。

拿4TB的SSD给PS5当扩容硬盘,总感觉会有点怪。

T500 采用了美光232层TLC 3D NAND颗粒,美光宣称,这一代颗粒拥有业界领先的 NAND I/O 速度(每秒 2.4 GB/s),能带来更强的性能表现。

2022年7月下旬,美光宣布232层3D TLC NAND量产的消息。新的介质通常需要新的控制器的支持,此前的T700采用的是E26。

这次T500使用的是PS5025-E25控制器,E25的FTL需要DRAM来配合,所以,T500都配备了美光LPDDR4 DRAM内存专门做缓存,每 1TB NAND 闪存配上了1GB的缓存。

带不带散热片的T500,温度表现有多大差异

T500延续了黑色的设计色调,从PCB板到散热片都是黑色的,这也是英睿达所有强调性能的SSD都惯用的配色。

与T700的豪华散热器不同,T500看起来就显得很比较低调。看做工和手感的话,完全秒杀第三方配备的散热片。

所以,自带散热片的SSD,其颜值往往更有吸引力,有金属的硬朗外外壳总好过一张纸贴在芯片上的感觉吧。

接下来,将两块SSD安装到电脑上,看看两块盘在待机状态和工作时的温度表现,测试使用的电脑主要配置如下图:

CPU:AMD Ryzen 5 7600

主板:华硕TUF GAMING X670E-PLUS WIFI

内存:英睿达Crucial DDR5 5600 16 x4

显卡:RTX 3070

电源:振华 850W 金牌全模

操作系统:Windows 11 专业版 22H2

室内温度:23摄氏度

这套板U组合可以支持同时安装4块M.2固态盘:

其中Gen 5.0的插槽插的是T700,另外一个PCIe 3.0的插的是Solidigm P41 Plus做系统盘,最后两个都是支持PCIe 4.0的,放的是两块T500。

两块T500在机箱中的位置如上图,之所以这样安排是想看看带散热片和不带散热片的T500的温度表现。

用CrystalDiskInfo查看一下传感器给的温度数据:不带散热片的T500一直稳定在34度,带散热片的则一直稳定在37度。

带散热片的温度反而高?

这里应该是因为,不带散热片的T500会被风扇直接吹到,散热状况会更好。而左侧的带散热片的T500吹到的风就比较少,所以温度略高。

接下来一边用常见的SSD跑分软件做测试一边看看温度表现如何。

性能例行跑分与温度监测

由于T500也是支持自适应热保护功能的,所以,可以放心大胆地跑分并手动检测温度,不用担心安全问题。

以下所有测试都是对全新的固态盘进行测试,没有任何预处理的操作,能代表普通用户拿到硬盘之后会看到的性能表现。

AS SSD Benchmark 2.0.7

我们以默认设置来跑分,由于AS SSD Benchmark 的测试压力比较小,所以,这里每块盘都连续跑分三四次,试着多给点压力来看看温度情况。

实测的跑分数据如上图所示,性能方面,AS SSD Benchmark看来没能很好地压榨出T500的性能,顺序读写性能与标称的数值相差较大。

用CrystalDiskInfo软件检测到的温度情况方面,不带散热片T500的,最高温度是55度,而带了散热片的T500,最高温度不超过48度。

整体压力不大,温度不是很高,还是能明显看出来散热片的作用的。

CrystalDiskMark 8.04c

同样是以默认设置来跑分,由于CrystalDiskMark给到的压力比较大,所以,其顺序读写性能与英睿达官方标称的数值非常接近。

温度方面,不带散热片的T500,温度一度达到了66度报警温度,而带有散热片的T500温度最高为58度。

在压力比较大的情况下,散热片的作用更明显一点。

ATTO DiskBebchmark 4.01

继续以默认配置来跑分,由于ATTO DiskBebchmark的压力也非常大,所以,这次看到的温度也都非常高。

其中,没带散热片的T500最高温度检测到了78度。而带有散热片的T500温度也来到了最高56度。

可见,散热片在SSD温度控制方面的作用还是非常明显的。

带散热片的T500没有发挥全部性能?

细心的朋友注意到,带散热片的T500的性能表现,反而不如不带散热片的版本。性能更高,通常温度自然也会更高,这对于不带散热片的T500来说,不太公平。

查了查主板信息,发现这是由于不带散热片的T500占用的是CPU提供的Gen 4.0(上图中的D插口),性能会更高,而带散热片的占用的是芯片集提供的Gen 4.0(上图中的B插口),性能会相对低一些。

我把两块T500的位置对调,再来看看两块盘的性能,还有温度表现。

AS SSD Benchmark 2.0.7

用AS SSD Benchmark 连续测试带散热片的T500的最高温度是44度。回顾刚才测试中,不带散热片T500的最高温度是55度。

CrystalDiskMark 8.04c

用CrystalDiskMark8.04c测试带散热片的T500的最高温度是52。回顾刚才测试中,不带散热片T500的最高温度是66度。

ATTO DiskBebchmark 4.01

用ATTO DiskBebchmark 4.01测试的最高温度是49度。回顾刚才测试中,不带散热片T500的最高温度是78度。

当然,在把不带散热片的T500插在主板芯片集提供的Gen 4.0接口之后,在大的负载下,温度也还是非常高,最高见到过80度。

看来,不带散热片的T500的温度都可以飚到很高的水平,带散热片则能很好地压制温度,各位可以根据需求和安装环境决定是否选带散热片的版本。

结束语:

目前来说,PCIe 5.0 SSD才刚刚开始,主流用户的硬件还都不支持PCIe 5.0,特别是英特尔平台现在对于PCIe 5.0 SSD的支持还远远不够,只有少数高端主板才支持,对于很多主流用户来说,上5.0可能还需再等等。

眼下,PCIe 4.0更容易被接受,不仅大部分新的主板都支持,而且性价比也容易让大多数人接受,目前是大多数人的选择。

2023年,整体闪存的价格比较低,闪存颗粒大厂都不开心。但好处是可以让用户买到价格更友好的SSD,对于SSD的普及和用户习惯的培养是有明显好处的。

三位一体,戴尔科技帮助企业从网络攻击中恢复关键业务

朱 朋博

电影里的英雄并不总是不可战胜的,但他们总能在困境中重新站起,展现出令人敬仰的韧性。同理,在网络安全领域,从网络攻击中恢复的能力也同样至关重要。

数字化时代,遭受网络攻击几乎已成为企业的必然经历,随着黑客手段的日益多样,即便拥有最先进的安全防护措施,也难以独善其身。因此,网络安全的工作重点不仅在于如何防止攻击,更在于当攻击发生时,如何有效地恢复和减少损失。

这也是为什么说“从网络攻击中恢复”的能力变得越来越重要。戴尔科技集团有备份、容灾和Cyber Recovery数据避风港三位一体的解决方案,可以帮助企业构建多重恢复能力。

为什么完全避免网络攻击几乎是不可能的?

在ISACA 发布的《2023 年网络安全状况报告》中提到,有 48% 的组织表示今年遭受的网络攻击比去年有所增加。另有数据显示,2023年至今,已经发生了838起数据泄露事件,泄露了大约45亿条记录。其中,仅9月份,就发生了71起数据泄露事件,泄露了38亿条记录。

网络安全威胁不断增多,可见的未来里甚至看不见扭转的趋势,对于很多企业来说,想要完全防止网络攻击几乎是不可能的,原因大致有两点。

第一点,技术总是在不断地进步,包括黑客使用的攻击手段。当你觉得自己已经采取了足够的防护措施,可能就在下一秒,新的漏洞,新的攻击手段就出现了。攻防双方进行着一场永无休止的“道高一尺 魔高一丈”的较量,安全防护永远在追赶攻击技术的脚步。

第二点,人为因素也是一大难题。即便有了最先进的防火墙和安全系统,一个员工不小心点击了可疑的链接,或者使用了弱密码,都可能导致整个网络安全体系的崩溃。人为失误很难预防,也成为了网络安全中的一个不稳定因素。

可以说,要完全防止网络攻击是一项非常艰巨,甚至几乎不可能完成的任务。因此,企业要有完善的应急响应和恢复机制,建立网络攻击后的恢复流程就显得非常重要。

因为,攻击后的恢复流程是防止进一步损失和影响的关键环节。一旦受到攻击,数据和应用处于危险之中。此时,恰当的恢复流程能够让企业尽快恢复正常运营,减小经济损失和声誉影响。

从网络攻击中恢复:一步步走出困境

2023年11月是戴尔科技的网络安全意识宣传月,戴尔科技提到了从网络攻击中恢复过程的一些个流程,包括但不限于以下步骤:

首先,我们要做的是“事件遏制”。简单说,就是看见着火了就要把火扑灭,避免它蔓延。安全人员可以断开受影响的系统和网络连接,锁住被黑客入侵的账户,阻止攻击进一步扩散。

接下来是“系统或设备还原”。类似于电脑中了病毒,比较彻底的方法是重置到出厂设置,然后再安装需要的软件和更新。同理,这一步就是让受损的系统恢复到一个安全的状态。自动化工具在这一环节能发挥大作用,能帮企业快速恢复正常运营。

再说“数据恢复”。在遭受攻击时,你可能丢失了,或者被加密了重要的文件或数据。能否从备份中还原这些数据很是关键,恢复的速度也很重要。所以,专业的数据恢复技术方案就显得非常重要了。

还有一步很重要,那就是“取证分析”。这是反思的时候,需要了解这次攻击是如何发生的,哪里出了问题。有了这些信息,能帮助企业查漏补缺,下次就可以更好地应对安全问题。

最后,“事件响应评估”和“专业服务”。评估这次应对的效果,看看哪里还需要改进。同时,专业的网络安全服务提供商能给你提供很多有用的建议和资源。

总的来说,从网络攻击中恢复,就像走出一场战争。你需要清点损失,修复装备,然后吸取教训,为下一场战争做好准备,为提高网络防护水平打下基础。

三位一体,戴尔科技构建了数据恢复的多重防线

事实上,戴尔科技构建了备份、容灾和数据避风港Cyber Recovery“三位一体”多重数据恢复防线。

在三位一体的架构里,企业在核心数据中心、云上以及边缘里的所有数据都要做备份,备份是数据和应用能恢复的基础,是从网络攻击中恢复的关键技术手段。

戴尔科技旗下有多个数据备份与恢复解决方案,既有PowerProtect Data Manager、PowerProtect DD这种软件定义的方案,也有PowerProtect DP和PowerProtect DD系列软硬一体的解决方案,可为不同规模用户在核心、边缘和多云环境中提供高效的数据备份和恢复服务。

但是,只有备份仍存在很多风险,如果备份不可使用怎么办?

戴尔科技建议对更重要的数据做异地备份容灾,异地备份容灾能应对风火水电等各种自然灾害,当企业在遭受重大的备份系统设备乃至数据中心灾难时,恢复数据会有奇效。戴尔科技利用高效的备份去重复制和压缩加密,实现广域网窄带宽条件下的备份数据传输,将备份数据安全复制到远端容灾站点或者云上。

戴尔科技利用SRDF远程复制技术快速将数据复制到远端站点或者云上,在发生故障或者遭受黑客攻击后,可在RTO目标下将数据和业务系统恢复到正常状态,戴尔科技提供全面的恢复策略降低或消除数据丢失的风险,从而提高业务的连续性。

但戴尔科技认为这还是不够的,由于备份本就是很多黑客的攻击目标,特别是日益猖獗的勒索攻击。所以,戴尔科技认为最核心的数据应该被重点保护,要放到数据避风港解决方案Cyber Recovery里。

戴尔科技的数据避风港解决方案PowerProtect Cyber Recovery可以用来保护企业关键业务的核心数据。Cyber Recovery采用了物理隔离的方式,并创建不可变的备份来保护数据不被加密或删除。同时,还利用人工智能来保障数据的可恢复。在如今勒索软件猖獗的时代,在删库跑路事件频发的时代,Cyber Recovery获得了越来越多客户的认可。

目前,全球有2000多家企业,中国有100多家企业部署了戴尔科技的Cyber Recovery解决方案。自从Cyber Recovery发布以来,数据存储和数据保护领域的多家厂商也都推出了类似的Air-Gap解决方案,Cyber Recovery这样的方案已成为帮企业从网络攻击中恢复的重要手段。

为简化数据保护部署复杂度,戴尔科技推出了多款软硬一体的解决方案。

PowerProtect  DP4400是戴尔科技推出的入门级数据保护一体机,自发布以来一直深受广大企业用户的喜爱。它将备份和恢复技术融合在一个2U的PowerEdge服务器中。DP4400虽然身躯较小,但有全面的功能,还有很高的易用性。它提供较小的起步容量,适用于中等规模的企业,以及大型企业的分支机构。同时,它也支持利用云上的存储空间来长期保存数据或者用于灾难恢复,还支持平滑地扩展到更大规模。

最新推出的备份一体机是DM5500,它基于PowerProtect Data Manager备份软件而打造,提供了更自动化的方式来保护传统和现代化工作负载,甚至可以在30分钟内轻松完成部署。同时,从12TB到96TB的扩展容量范围可更好地满足中小企业的数据保护需求。

通过与VMware vSphere的深度集成,DM5500支持透明快照(Transparent Snapshots)功能,该功能不仅支持无中断地备份VMware虚拟机,还能大幅加快备份和恢复虚拟机的速度。同时,DM5500也延续了戴尔科技数据保护产品线一贯的高重删压缩比的优势,不仅可以减少数据存储空间占用,还能减少数据传输占用的网络带宽。在中国市场上,Dell PowerProtect DD及备份一体机产品获得中国网络关键设备和网络安全专用产品安全认证、中国国家信息安全产品认证,网络安全专用产品安全检测证书等多方权威认证,是广大中国企业在构建恢复能力时的优选解决方案。

结束语

在数字时代,网络安全已成为企业不容忽视的议题。面对日益严峻的网络威胁,企业不仅要注重预防措施,更应加强恢复能力的构建。

戴尔科技的备份、容灾和Cyber Recovery数据避风港三位一体解决方案,正是针对当前网络安全态势,为企业提供的一个全面、多层次的保护方案。通过强化恢复能力,企业能更有信心地面对未来的网络安全挑战,从而在数字化的浪潮中稳步前行。

手握AI,数据保护简而不凡

谢 世诚

面对杂乱的数据和频繁的报错,你有没有一瞬间想过,要是所有工作都能自动完成就好了。在混合场景中管理云规模的分布式环境并非易事,资源和预算的限制更是为此增添了难度。事实上,借助AI和机器学习技术驱动的先进平台,企业可以简化监控、推进大规模自动化操作、提升操作就绪状态,从而更好地应对网络事件。本篇文章将深入探讨Commvault如何利用AI和机器学习来简化和自动化数据平台操作,实现更具弹性的数据保护环境。

自动化操作:省心、省力

随着企业部署的应用增多,数据量也不断扩张。然而,一天只有24个小时,每天可以用于保护这些数据的时间仍然是相对固定的。传统的备份计划依赖于静态的规则和计划,往往会造成复杂的配置或效率低下,包括作业运行时间不理想、作业等待时间过长、备份窗口超时等等。Commvault的数据平台采用更高效、更智能的算法来应对该挑战。它使用基于时间序列的机器学习来预测作业运行时间,从而调整排序,优化作业日程。根据业务需求,该平台可以计算所需的RPO,确保每个工作负载都能够获得适合的优先级排序,尽可能减少数据保护窗口。整个过程无需用户付出精力进行人工决策。

面对数据量增长或业务需求变动,数据保护环境也必须进行相应调整,这要求数据保护基础设施具备一定的灵活性来适应不同的环境和需求。企业可以自动化该适应过程,避免决策延迟导致的基础设施成本增多。Commvault的数据平台采用机器学习技术实时评估数据保护需求,分析数据随时间变化的增长趋势,预测所需的计算资源以满足设定的服务水平协议,并根据需要自动做出增加或减少计算资源的决策。

简化监控:AI帮你“划重点”

在大型企业环境中,仅仅是日常运营活动的监控就可能让人手忙脚乱。在这种复杂莫测的环境中,错误的出现在所难免,其中一部分可能是暂时性的错误,无需立即进行人工干预就可以解决,另一部分则不然。如果不将这两种错误区分开来,我们可能无法及时对后者进行干预。Commvault的平台使用机器学习分析日常备份操作行为,学习什么是常见操作,然后在出现异常高的故障率或作业完成延迟时触发智能警报,从而降低操作开销和干扰,让管理员能够专注在关键问题上。

除了日常运营活动,Commvault的这项能力还可以应用在数据保护环境中。在典型的数据保护环境中,每天都会发生成百上千起事件,同样,这些事件并非全部都需要人工检查。企业可以借助Commvault平台识别这些事件和事件时间线中的模式,并根据类型、来源和特性对其进行分类,确定哪些事件有必要进行人工检查。它还可以生成“重点事件”视图,过滤掉常见错误,突出显示异常事件,简化监控流程,让管理员能够迅速处理关键任务。

操作就绪:及时告警、提前规划

为了满足业务恢复或勒索软件恢复需求,企业需要确保数据保护环境的健康和就绪性。Commvault的用户可以设定符合自己需求的RPO、RTO的SLA,并可以在出现影响这些SLA实现的偏差时收到警报。这种积极主动的自动化方法可以尽量降低SLA违规风险,帮助企业为关键情况做好准备。

Commvault也可以通过使用机器学习技术分析企业的历史消费模式,再结合当下变化,预测企业未来的存储需求。这可以简化企业的规划工作,帮助企业提前做好调整存储容量的准备。在如今的混合环境中,企业可能会面临意想不到的硬件交付供应链挑战,这种存储基础设施的就绪状态对恢复就绪的实现来说非常重要。

AI和机器学习不仅仅是“装点”产品的一项“门面”,而是能够提供实用功能,并真正推动现代化平台实现的先进技术。Commvault对AI和机器学习持续投入,采取全面的方法来创建一套具有凝聚力的产品和功能。如今,这些功能已经成功应用,帮助Commvault的客户打造弹性的数据保护环境,在未来,Commvault还将继续推进这些能力的创新,助力企业守护数据安全。

忆联再次与 OpenCloudOS 完成产品兼容性互认证

朱 朋博

近日,忆联数据中心级SSD UH711a与OpenCloudOS 完成相互兼容认证,测试期间,整体运行稳定,在功能、性能及兼容性方面表现良好。

兼容认证证书

作为国产开源操作系统社区,OpenCloudOS 沉淀了腾讯及多家厂商在软件和开源生态的优势,在云原生、稳定性、性能、硬件支持等方面均有坚实支撑,可以平等全面地支持所有硬件平台。目前,OpenCloudOS 已支持 X86_64、ARM64、RISC-V 架构,可适配国内主流CPU厂商。同时提供支持全栈国密和机密计算,已有 300 余家企业产品与 OpenCloudOS 操作系统完成适配。

此前,忆联企业级固态硬盘UH811a/UH831a与OpenCloudOS 已完成相互兼容认证。本次,忆联数据中心级固态硬盘UH711a经过多项严格测试,也全部满足OpenCloudOS 8 的硬件兼容性测试的各项内容,满足OpenCloudOS 8 的运行要求,这将为数据中心等用户提供更稳定可靠的使用体验。同时,也为双方进一步合作奠定了坚实基础,为相关的关键业务和平台架构选型增添了更多选择。

此次双方互认证的完成,不仅是基于产品功能和性能的测试与认证,更是双方携手助推国产化稳健发展的见证。未来,双方将充分发挥在各自领域的专业优势,坚持以客户实际需求为导向,共同推进国产信息化生态建设,为用户提供安全可靠的产品服务,助推国产云计算核心技术产业化的发展与繁荣。

忆联SSD通过极端压力中子实验,为数字中国建设提质增速

朱 朋博

中国数字经济的快速发展离不开算力的支撑,为提升国家整体的算力水平,从2022年起我国正式启动了“东数西算”工程。随着工程逐步开展,许多大中型数据中心落地高海拔地区,然而高海拔会对数据中心的电子设备造成散热、绝缘性能等方面的影响外,还会因为中子通量较大,造成电子设备故障,如比特翻转、宕机等情况的发生,甚至还有数据错误或丢失的风险。

一、中子试验

大气中的中子是初级宇宙射线与地球大气中的氧、氮等原子核发生核反应产生的,中子通量随着海拔高度的增长而呈现指数增长,大气中子特别是中高能中子的单粒子效应(SEE)已成为地面大型计算系统,如高性能计算机等可靠性不可忽视的威胁。

为帮助高海拔数据中心避免受到中子的影响,忆联与国内知名实验室联合展开中子试验,以满足数据中心对 SSD 高可靠的需求,助力“东数西算”工程顺利进行。

二、试验环境基本信息

本次试验配置如下:

1、服务器配置:

·CPU:Intel 5218 *2

·内存:8*32G

·网卡:2*10GE+2*GE

2、试验 SSD 数量

本次试验产品主要为忆联自研的企业级 UH8 系产品,试验 SSD 数量共为 12 块。涵盖了 UH810a、UH830a、UH811a、UH831a 等企业级固态硬盘。

3、中子注量率

本次试验中子注量率为 2.67*105 n/( cm2 ·s)。

在国内地面条件下,阿里地区作为中子量最多的地区之一,中子注量率约为 509n/ (cm2 ·h) (En≥1MeV)。在不间断接受中子辐照的条件下,SSD 在本次试验条件下接受到的累计中子注量远超国内地面可接收的最大累计中子注量(对比示例如图 2)。

图 1:试验场景下中子发生设备——靶站
图 2:累计中子注量对比图

三、试验过程及结果

图 3:试验环境整体示意图
图 4:试验现场监测图

1、试验过程

·所有盘片均在同一中子注量率下进行辐照,以中子辐照注量率达到试验要求为开始,以盘片功能失效为结束,通过自动化试验脚本记录运行时间;

·5 块 SSD 为一组,本次试验一共完成 3 组;

·试验人员在监测室实时监测 SSD 运行状况,并进行统计。

2、试验结果

部分单盘实测结果

图 5:UH810a/UH830a 单盘实测情况-1
图 6:UH811a/UH831a 单盘实测情况-1
图 7:UH810a/UH830a 单盘实测情况-2
图 8:UH811a/UH831a 单盘实测情况-2

详细运行时间统计

从试验结果可知,UH8 系产品在同一中子注量照射下,最低平均运行时间为 6.5 分钟,总平均运行时间为 11.7 分钟。

三、 试验数据分析

忆联 SSD 的寿命一般为 5 年,以阿里地区中子注量率为基准,并以忆联 SSD 在 5 年内累计中子注量达2.23E+07 n/ cm2为计算条件,忆联 SSD 为满足 5 年寿命,试验中需在 2.67*105 n/( cm2 ·s) 中子注量率下,运行时间达到 83s。

试验结果表明,忆联 UH8 系 SSD 平均运行时间达 11.7 分钟,充分验证了忆联 UH8 系 SSD 在较高的中子通量自然环境条件下,具备可抵抗一定中子辐照的高可靠性,自带的 ECC、RAID 数据恢复、重读等功能,能够及时纠正中子带来的比特翻转等问题,能保证在 SSD 使用寿命范围内正常运行,可为高海拔数据中心提供高可靠的 SSD 产品。

“东数西算”是平衡算力增长与节能减排的重要支撑,其成果将在多个方面对未来中国的数字经济发展产生深远影响。数据中心则是“东数西算”工程落地的载体,忆联将凭借高可靠、高稳定的SSD产品助力西部地区建造更强、更安全的数据中心,为中国腾飞插上“数字翅膀”。

ACP在中国市场发布,戴尔科技在多云战略上又迈出重要一步

朱 朋博

十多年前,公有云作为全新的技术服务体系横空出世,打破传统本地IT技术架构的单一格局,为IT市场带来了很多新气象。

起初,公有云新势力对传统IT厂商“喊打喊杀”,凭借低成本、高效率和弹性伸缩等特点吸引了很多人,使得很多企业能够以较低的成本快速启动和扩展业务。

与此同时,传统IT厂商也在不断进行技术升级和模式创新,凭借其安全稳定、可定制、数据私密等特点,仍然受到许多大型企业和政府机构的青睐。

于是,便逐渐形成了与公有云服务相辅相成的市场格局,将公有云和私有云的优势结合起来的混合多云逐渐被市场接受。

如今,传统IT厂商和云服务商之间通过合作和竞争,共同推动云计算技术的进步和市场的发展,为用户提供更多的选择和可能。这其中,非常具有代表性的就是戴尔科技的APEX服务。

Dell APEX服务升级,构建趋于完整的多云架构图谱

戴尔科技是非常具有代表性的企业级IT厂商,通过APEX服务与包括亚马逊AWS、微软Azure、谷歌云(GCP)、阿里云四个公有云平台以及VMware和Red Hat混合云厂商的合作构建混合云架构。

大型传统本地IT厂商与大型公有云的合作,似乎意味着着两股力量的合作和竞争达到了一个新的平衡点,也预示着混合多云市场也将迎来新的发展阶段。

戴尔科技集团大中华区信息基础架构解决方案事业部存储业务总经理刘志洪表示,多云最符合企业数字化转型的实际需求,所以,戴尔科技是多云的坚定“信仰者”和“实践者”。

刘志洪还提到,戴尔科技在多云战略的实践当中,不只考虑了自身最擅长的底层架构,而是从多云战略层面上考虑云上云下基础设施的一致性。

为此,戴尔科技除了与四家主流的公有云服务商合作,还与Red Hat、VMware两家私有云、混合云厂商深入合作,构建了一幅比较完整的多云架构。

如上图所示,左侧A部分是从本地到公有云的技术方案,戴尔科技将广泛被部署的本地企业存储软件放到了公有云上,将块存储、文件存储以及数据保护方案放到了公有云上,这使得戴尔科技存储的用户在云上也能使用到与本地存储一致的存储服务。

而右侧B部分则是将公有云的技术方案引入到企业本地,比如,与微软Azure的合作是将Azure云服务延展到企业本地,与VMware的合作是用虚拟化技术解决方案消除云上云下的差异,与Red Hat的合作则是用容器技术保持云上云下的灵活迁移和一致特性。

中间的C类则是原来APEX即服务产品线的一次扩充,原来的APEX主要以存储和数据保护方案为主,今年新增了包括APEX Compute在内的多个新服务。C类最主要是提供了一种新型的消费模式,不再是一次性采购硬件方案的方式,而是按需以付费的灵活的消费模式。

Dell ACP开始在中国市场落地,四大组成部分汇集戴尔科技的产品线优势

9月27日,戴尔科技在国内市场发布首款APEX Cloud Platform(以下简称ACP)服务——ACP for Azure,它属于B类,它将微软的Azure Stack混合云进一步引入到企业本地和边缘侧,使得企业可以在公有云、本地数据中心以及边缘侧多种环境中运行和管理程序。

从戴尔科技集团企业级超融合及云计算产品经理任效严的介绍中了解到,ACP是深度集成的交钥匙的系统,它是包含完整生态的深度集成系统方案。它利用了戴尔科技在HCI和SDS方面的技术优势,并且与包括微软、红帽(Red Hat)、VMware等生态伙伴协作而构建。

从任效严的介绍中了解到,整个ACP解决方案包含四个重要的组成部分:

第一个重要的组成部分是自动化平台运维的管理软件。这是戴尔科技混合云战略当中一个重要的组成部分,它在整个ACP平台的部署、生命周期管理、自动化运维方面都提供了很大便利。它由戴尔科技中国研发集团带头开发的,开发过程中与合作伙伴的方案进行了深度集成。

第二大组成部分则是戴尔科技的软件定义存储方案,它可以在本地基础架构和云平台之间打造一个通用的数据存储的平台。

值得注意的是,ACP业务主要是存储业务部门来引领的。戴尔科技集团大中华区信息基础架构解决方案事业部企业技术架构总监许良谋解释说,之所以由存储部门来引领,是因为混合云架构需要构建应用层和数据层的迁移能力,需要强大的存储实力构建跨云上云下的通用存储层,这需要借助戴尔软件定义存储的力量。

第三大部分就是戴尔科技最新一代的PowerEdge服务器平台,它负责运行软件定义存储方案和自动化平台运维的管理软件,作为整个ACP方案的基座。

戴尔科技除了在存储市场上有优势地位以外,在服务器市场上,戴尔科技提供多种多样的硬件解决方案,在性能,稳定性,兼容性,安全性等方面均为业内头部水平,用PowerEdge服务器平台作为ACP方案的基座再合适不过了。

第四大部分指的是,与微软、Red Hat和VMware三家的紧密合作,这三家在云平台服务领域都非常具有代表性,而且,这三家合作伙伴的能力在ACP方案中进行了深度集成。这给用户提供了多样化的选择。

打破技术隔离,ACP的优势源于与合作伙伴的长期深度合作

在此之前,公有云和私有云虽然也在逐步融合,但在很多用户面前,两者仍是相互隔离的技术体系,需要用户自行对接两大技术体系,或者依靠第三方平台来管理混合多云架构,总之需要额外的很多操作。

而现在,随着戴尔科技与微软、VMware以及Red Hat的深入合作,ACP的混合架构进一步打破了两者之间的隔离,混合架构的复杂度则进一步降低,原本需要的很多额外操作也越来越少了,这种将公有云和私有云架构深度融合的方案在市场上并不多见。

之所以有这样的深度融合,都源于戴尔科技与微软、与VMware以及Red Hat三家多年合作的经验,以微软为例,之所以能看到戴尔科技和微软落地ACP方案,是因为两家此前在混合云领域就有多年合作经历。

从微软亚洲区Azure云事业部高级产品经理王路的介绍中了解到,微软在混合云上有持续投入,与戴尔科技合作过包括Azure Stack HCI、Azure Stack Hub等混合云方案;尤其是在Azure Stack HCI的合作方面,推出了认证节点和集成系统,而后又合作推出了更高级的Premium solutions。

王路表示,ACP正好对应了双方在Premium Solution方面的合作,能使得微软混合云上的服务和HCI的优化形成了更紧密的合作,把Azure平台上的能力,例如对虚拟机的承载能力、对容器的承载能力都带到了ACP的平台上,使得ACP能够在本地数据中心承载更多的Azure混合云服务能力。

微软在ACP的合作上也颇有诚意,助力Dell的研发团队将优化基础架构的技术Azure Arc也纳入其中,使ACP平台上承载的工作负荷获得了部分Azure公有云的创新能力,此外还有运维能力的提升,包括对虚拟机的监控、安全更新以及亚健康维护等操作。随着Azure Arc加入ACP,使得企业用户避免了在本地数据中心在运维管理方面做重复投资。

ACP不仅打破了公有云和私有云的技术隔离,还有很多自动化操作,可以大幅降低部署和运维负担,帮助企业降低了多云架构的落地门槛。同时,多样化的软件生态也给了用户根据需求灵活选择的空间。

ACP将云运营的模式扩展到本地和边缘。它可以帮助企业改变多云运营和管理的方式,非常具有战略价值和意义。此次ACP for Microsoft Azure在中国市场的发布,让在我们看到戴尔科技在多云战略上迈出了重要一步,也看到了私有云和公有云互通有无的和谐画面。