最近跟几位IBM存储的负责人聊了一圈,IBM大中华区存储事业部总经理吴磊说,一些客户最近去下单20T、24T的硬盘时,发现交付周期普遍是52到72 周,也就是得等一年到一年半时间。哪怕用户手里拿着钱,也只能排队等着。

事实上,如今DRAM、NAND颗粒缺货涨价最为明显,机械硬盘还在其次,磁带存储面临的压力相对温和。吴磊表示,这一轮缺货涨价跟过去都不太一样,主要是因为叠加了AI训练推理的真实需求,还有撞到了产线的供应瓶颈。
扩产并非易事,一座晶圆厂固定资产投入需要几十亿美金,还需要三到四年的建设周期。况且,主流的NAND厂商和HDD厂商对扩产都非常谨慎。所以,业内普遍预计缺货涨价的现状至少会持续到2027年,短时间内根本不能靠扩产来缓解。
企业CIO们现在压力是真的大。一边要在AI上增加投入,一边是预算被存储介质涨价吞噬了很多。IBM中国区存储业务销售总经理金鑫走访了几十家客户,发现AI创新焦虑和成本高是非常普遍的问题。

在这种特殊的市场环境下,IBM的存储专家们则站了出来,说可以帮客户省下真金白银。这里有我当天了解到的几个案例,他们都是用了FlashSystem来提供性能保障,然后用磁带存储来控制成本。
闪存加磁带,让产线产能爬坡提高了20%
第一个案例中,金鑫提到了华东一家半导体企业。这家企业当时正处在产能爬坡期,最头疼的是内部数据竖井太多,光存储就有4个不同品牌的产品在跑。数据量大、管理调度混乱,产线之间数据流转效率低。
IBM的方案是用FlashSystem加磁带库做了一套整合方案,把整套系统IOPS翻倍的同时,还实现了双活,RPO和RTO均为零,顺便还把数据长期数据保存这个痛点也一并解决了。
这家企业在生产线中部署了这套存储,做完这个项目后,那条产线产能爬坡上升了20%。通过数据存储方案的更新提升了产能,在当今半导体涨价的时代,实实在在给企业带来了真金白银的回报。
三甲医院的CT数据,从闪存到磁带的两段式分层
第二个我觉得特别能说明问题的是江苏一家三甲医院。这家医院有几十台CT机连轴转,一张片子大概2GB左右,数据量很大。这边患者刚拍完片子,那边医生还没拿到打印片子就已经在调数据看了,医生终端很多,对存储性能要求很高。
同时,在AI兴起之后,医院又多了一个新需求,CT、核磁、X光这些数据都需要留存,得为未来的科研做储备。这么多的数据,如果全用闪存,成本显然太高了,医院根本扛不住,那要怎么办呢?
这家医院的解法是做数据分层。把热数据放在FlashSystem上,以此来保证多终端同时调用时候的高并发,医生随调随有。长时间不访问的数据会自动下沉到磁带库,以极低的成本长期保存数据。
吴磊提到一个细节,即使是大型磁盘柜矩阵,从最远位置抓取一盘磁带的时间大约是一分五十几秒。如果一个数据三个月、半年才被访问一次,两分钟拿到完全可以接受,应用层基本无感,而账单上会节省出很大一笔支出。
制造业用户也在用全闪加磁带存储的方案
制造企业最怕ERP中断,生产线连续运转,物料、工单、库存全靠ERP在撑,系统一断,整条产线就跟着停。某制造业企业选择FlashSystem来负责生产系统的稳定性,同时,利用磁带库负责以极低的成本把离线数据长期存下去。
为什么很多制造业客户最后选IBM?金鑫的回答称,制造业的IT团队人手普遍紧张,大量工作需要靠产品本身和厂商的服务来兜底。选择IBM FlashSystem和磁带库方案,省下的是后面几年的运维成本和事故风险。
说白了,重型制造这种行业,只有把该花的硬件钱花到位,后面才有底气只用很小的运维团队去管整个盘子。这个账算下来,比一开始为了便宜买了不稳定的方案,后面三天两头救火要划算得多。
吴磊也表示,在晶圆厂这种高端制造行业更是如此,这些企业经常7×24小时运转,负责存储的人很少,存储一旦出现问题,生产停滞1分钟可能造成几千万的损失,一套成熟可靠的存储系统方案是非常划算的选择。
磁带存储,反而成了AI时代最有成本优势的存储方案
我发现很多人对磁带存储有偏见,觉得这是个上世纪的东西。但听完吴磊讲完,我觉得,很多人得修正一下自己的看法了。磁带不仅不过时,而且安全可靠可以长期存储数据,在存储涨价的大背景下,更是降低存储成本的一把利器。
去年,业内发布了LTO10E,单盘磁带未压缩容量高达40TB,压缩后能达到100TB。而且,磁带技术后续还会继续提升容量,IBM实验室2020年就做到了单盘580TB的原型产品,说明后续磁带的容量提升空间还很大。
更关键的是磁带长期存储的可靠性非常高。美国国家航空航天局(NASA)在“阿波罗登月计划”期间,在3次任务中用173卷磁带收集了大量数据,但一直没有分析过。几十年后想用这些数据,把它从普通仓库(只是相对干燥)里拿出来,数据居然还能100%恢复。
如果NASA的故事还有点遥远,那么百度网盘国内朋友就很熟悉了,百度网盘有大量的冷数据底层就跑在IBM的磁带库上,规模是EB级,这个合作六七年了,它可以大幅降低企业和消费者使用存储的成本。
为什么这事在AI时代变得越来越重要?当企业想要用AI技术时,就得存储大量可能有用的专有数据,这些数据单纯靠硬盘或者闪存都不显示,公有云冷归档成本也很高,最经济的解法就是磁带。
FlashSystem全闪存储也能帮用户省下真金白银
上文提到的几个案例,除了说磁带成本低,还都提到了FlashSystem闪存存储系统,它是如何在原材料涨价的大环境下给客户省钱的呢?

这次采访中,几位嘉宾都重点提到的是一个叫 FCM(FlashCore Module)的东西,这是IBM自研的专有闪存模块,用在IBM的全闪存存储系统FlashSystem系统中,目前已经进化到第五代了。
早在2012年,业内还是以HDD为主时,IBM收购Texas Memory Systems(TMS),拿到了通往全闪存时代的门票,基于这些技术打造了FlashSystem,构建FCM模块,在NVMe标准出现之前,就给IBM闪存系统在技术上带来了很大优势。
随着技术的发展,FCM也采用了NVMe协议,现在的FCM在每一块NVMe盘上集成了一颗自研芯片。这颗芯片把传统上要消耗控制器CPU的工作,包括压缩、去重、加密工作全部搬到盘上做了。
2026年年初,IBM发布新一代的FlashSystem 5600/7600/7600三个型号,采用的第五代FCM最关键的一个数据是支持1:5的压缩比例。在合适的数据类型中,一块100GB的空间压缩后等效可以存储500GB的数据。
吴磊给的答案比较坦诚,他说这个压缩比是针对可压缩数据来说的。如果你存的是已经压缩过的JPEG或者H.264/H.265格式,效果并不好。但数据库这种结构化、半结构化数据,1:3的比例肯定没问题,最高能达到到1:5。
金鑫现场算了一笔账,按现在的市场价,即使是涨完价之后的闪存,把FCM的硬压缩比开到最高,算下来每TB的实际成本比涨价之前还要低。因为实际可用容量提升5倍之后,还能摊薄机头的成本。
FlashSystem新加入了一个运维智能体,可以降低运维负担
如果说FCM能省硬件成本,那这次FlashSystem新加入的智能体——FlashSystem.ai则能帮助用户省运维负担。它采用了用CPU就能在本地推理的小参数规模的模型,而且支持容器部署,意味着国内用户也能轻松用起来。

它能干什么?金鑫说它是永不休息的存储管理员。部署后,大概两个小时左右就能熟悉企业存储的内容和应用,它可以给你推荐配置建议,可以介绍你的系统信息,你可以用自然语言跟它对话,帮你创建资源,比如,“给我创建一个卷”。
很多用户会担心AI幻觉造成的误操作,吴磊介绍说,所有对用户数据有伤害的操作(比如删卷、删节点、缩容)系统内部是禁止AI执行的。也就是说它只能做加法,不能做减法。这个设计很克制,真正可能造成数据丢失的动作还是要人来确认。
很多国内客户最担心数据流出自己的数据中心。吴磊明确说,与一些基于云上大模型的服务不同,这个智能体可以直接部署在客户的数据中心离线部署,IBM看不到客户的任何数据。
存储管理员的工作非常依赖经验和技术,日常工作压力比较大,FlashSystem.ai的出现,意味着管理员可以成把一些重复性高的活全交给智能体,而且它永远在线,不下班不休假,也不会因为凌晨三点被叫起来迷迷糊糊敲错命令,可以降低运维负担。
写在最后
在缺货涨价的特殊时期,存储圈里大家现在拼的不是谁的盘更快,而是谁更懂怎么帮客户在有限的预算里,把数据存储这件事做好。IBM用一系列操作帮客户省钱,这个思路,比单纯卖货要更有价值。
