从大模型训练到推理部署,从数据湖扩容到外部知识库、长上下文调用,存储成为AI基础设施讨论的重要议题。随着数据规模持续膨胀、热数据和温冷数据的边界日益模糊、企业面临的成本与能耗压力不断上升,HDD在AI基础设施中的作用也有了新的定义。
西部数据(WD)对此的判断很明确——没有HDD,就没有AI。这句话背后意味着什么?HDD为什么没有在AI时代退场,而是成为规模化部署的重要底座?围绕这些问题,DOIT资深编辑崔欢欢采访了西部数据全球销售与市场营销副总裁Stefan Mandl,以及西部数据中国区高级销售总监文芳。

西部数据全球销售与市场营销副总裁Stefan Mandl

西部数据中国区高级销售总监文芳
崔欢欢:西部数据如何理解AI数据基础设施的定义变化?西部数据在其中承担怎样的角色?
Stefan Mandl:随着AI的普及带动,全球数据量持续激增,我们正面临一个全新的复杂时代。在AI时代,容量、性能、规模和信任度成为不可妥协的核心要素。基础设施还必须保持长期的性能和耐用性,同时控制成本和能耗。HDD(机械硬盘)非常契合AI工作负载的需求,并将持续作为AI驱动型数据经济的支柱。
根据IDC的数据,到2029年,也就是未来三年内,云端近80%的存储仍将驻留在HDD上1。
关于第二个问题,西部数据在这样变化的环境中所发挥的角色。西部数据作为一家AI/云企业,正在推进转型。
我们已实现从供应商思维向客户思维的根本转变。我们的组织协同不再局限于内部的产品路线图,而是围绕超大规模数据中心、企业级用户以及新兴云服务提供商如何实际构建和扩展其业务展开。
我们致力于与客户建立更为深厚的战略合作伙伴关系,以前所未有的速度驱动技术创新,持续提升运营与财务维度的执行力。正是这些举措,使得西部数据真正转型为AI 驱动型数据经济的核心存储基础设施提供商。
崔欢欢:现在AI应用越来越多,数据使用频率也在变化。之前我们可能更多的了解是数据存储通常是冷数据使用HDD。现在偏冷的数据也会由于AI需求被更频繁调用,冷热温数据边界是在变模糊还是清晰?数据分层有没有什么样的变化?
Stefan Mandl:传统的数据分层模式正受到现代AI工作负载实际状况的严峻挑战,因为AI不仅消化信息,更使信息的数量与价值倍增。推理日志、遥测数据流、模型检查点以及合成数据集会形成复合的反馈循环——每一次模型的迭代与微调,都会催生出比以往更庞大的数据量。
这就引出了所谓的“冷数据悖论”。企业正在囤积前所未有的海量数据,这些数据或许在当下并无活跃访问的需求,但在未来却有可能转化为核心的战略竞争优势。
AI训练与推理正在产生海量的、富有价值的数据湖以及温冷数据。这些数据依然需要在秒级而非小时级内被随时唤醒并访问,这对于磁带而言过于活跃,对传统容量硬盘来说成本又太高。
为了有效应对这种数据的流动性,企业必须彻底重新审视其基础设施设计,采用战略性的分层架构,在大规模部署时兼顾性能与成本效益。即在以经济效益和数据吞吐量为主要诉求的环节,部署可扩展大容量HDD,发挥其优势,而在对延迟较为敏感的场景中,部署高性能闪存。
西部数据在2026年创新日上发布了一系列以客户为中心的创新成果,从需要快速响应的性能数据层,到温数据层,再到专为长期留存优化的冷归档层。这些创新将帮助超大规模数据中心和企业用户缩短业务上市时间,降低运营风险,并优化大规模部署下的经济效益。
崔欢欢:过去全球更多是以算力为中心,但随着推理需求上升,需要存储与算力协同,推理和训练场景两者并重。放到中国的实际市场,对存储基础设施的需求是怎样的?
文芳:AI在中国及亚太地区,其实已经从技术测试走向重点核心的应用。在全球大的AI环境下,中国的应用落地也呈现出独有的深度和规模。中国AI核心产业规模从2024年的9000亿人民币2,迅速增长到2025年的1.2万亿人民币以上规模3。
这对基础设施提出了更具体和严苛的要求。我们的客户需要产品的可预测性、可延展性,能支持现在的严苛环境。对于HDD而言,过去客户更强调大容量,现在不只是容量,还包括性能和能耗表现,这些都已经成为直接落在HDD上的需求。
在这样大的规模下,其实我们的基础建设并不能一蹴而就,而是要逐步提升。因此,客户更需要我们的产品能有可见度,完整预测到下一步如何规划,尤其是在整体容量的需求上。刚才Stefan也说,到2029年,云端近80%的存储仍将驻留在HDD上。我们可以说“没有HDD,就没有AI”。
崔欢欢:AI越来越强调实时计算和高性能访问,这对HDD提出了哪些新的要求?如文芳刚才所说,不仅是对容量方向有要求,在AI的场景中,用户在实际部署中的容量、性能和成本之间,要怎样取舍?
Stefan Mandl:AI流程中会生成热数据、温数据和冷数据,仅依靠闪存无法实现经济高效的管理和可持续性。HDD是实现大规模AI部署不可或缺的基石,并与闪存协同工作。(容量型企业级或近线)HDD相比闪存有显著的成本优势,通常每TB的成本优势在6至10倍。
在大规模环境下,如超大规模数据中心,这种经济效应会产生复合增益,HDD将继续为各种云及AI工作负载提供出色的规模化经济性,在数据中心发挥核心作用。
为满足客户需求,我们于今年早些时候发布了以客户为中心的全新存储路线图。全球容量新高的40TB UltraSMR ePMR HDD现已进入客户认证阶段;HAMR HDD容量迈向100TB+,并持续推进与超大规模客户的HAMR技术认证;ePMR(能量辅助垂直磁记录)和 HAMR(热辅助磁记录) 两种技术路径并行发展,支持客户实现平滑过渡。
性能方面,西部数据发布了高带宽硬盘(High Bandwidth Drive Technology)与双枢轴技术(Dual Pivot Technology)提供2倍的带宽(未来可达8倍)以及高达2倍的IO性能增益。这些新技术,以HDD的经济性支持AI工作负载,降低了对闪存的依赖。
功耗方面,新的功耗优化型HDD可降低20%的功耗,缩小了温存储与冷存储之间的差距,助力客户降低总体拥有成本,提升AI规模化数据存储的可持续性。
崔欢欢:现在企业不仅关注产品,也关注整体的部署架构。西部数据在帮助用户设计和验证存储方案上,具体可以做些什么?
Stefan Mandl:我们以客户为中心的创新,旨在关注产出结果,而非单纯的功能特性或内部产品路线图。(在开发存储技术时)我们将五项关键客户需求置于首位——应对数据指数级增长的容量、适用于所有目标工作负载的可靠性、突破瓶颈的性能、以更优能效降低运营成本,以及贯穿基础设施全生命周期的总体拥有成本(TCO)优化。
我们的目标是基于客户当前的实际情况,帮助简化技术复杂性、降低认证风险并加速部署进程。最终,我们提供一条清晰的扩展路径,在缩短客户价值实现周期的同时,保持超大规模数据中心、企业及新兴云供应商所需的运营可预测性。我们的角色不只是组件供应商,而是参与客户架构决策的战略合作伙伴。
崔欢欢:在落地AI应用的时候,中国客户面临哪些挑战?西部数据如何帮助这些企业用户的?
文芳:AI带来的快速增长,对基础设施提出了更高要求,对于中国客户也不例外。随着数据中心建设持续推进,客户也在从传统技术逐步向前演进。现在,整体容量需求显著上升,传统技术需要通过新的技术路径,把容量推向更高水平。
针对这一变化,西部数据将继续遵循双路径策略满足市场需求。目前,行业正处于从成熟磁记录技术向HAMR转型的过程中。西部数据希望为客户提供一个稳定的过渡期,让客户根据自身产品节奏和成本效益边界,选择合适的时间切换到HAMR。
我们的ePMR和HAMR产品基于同一个模型架构,有助于提升制造效率和良率,也能帮助客户更平滑地从ePMR过渡到HAMR。西部数据既希望推动这项技术的规模化落地,也希望让客户在成本、效益和稳定性之间做出更适合自己的选择。
崔欢欢:您说的从成熟磁记录往HAMR过度,用户平滑迁移的时间大概多久?伴随规模化会有变化吗?
文芳:西部数据正在继续推高容量。当前,40TB UltraSMR ePMR HDD已与两家超大规模客户展开验证,计划于2026年下半年实现量产。
通过引入HAMR技术,西部数据还计划在不增加功耗的前提下,将ePMR硬盘容量进一步扩展至60TB。与此同时,西部数据的HAMR HDD也已与两家超大规模客户展开验证,预计于2027年进入量产爬坡阶段,并计划在2029年实现100TB+容量突破。

对客户而言,何时转向HAMR,取决于自身设备条件、应用场景以及成本效益边界。西部数据想强调的是希望通过自身技术路线缩短客户的转型周期,并让客户能够更平滑地从现有技术过渡到HAMR。
崔欢欢:在西部数据2026年创新日中提到平台业务扩展,具体指什么?这种平台能力是要帮助用户更方便使用硬盘?还是要往数据管理和调度这一层走?
Stefan Mandl:西部数据扩展平台业务,核心是把超大规模存储的效率和经济性,延伸到更广泛的客户群体、更多中等规模企业和新兴云服务商。为此,西部数据计划开发基于开放API的智能软件层,预计于2027年推出,帮助数据规模在200PB以上的企业提升存储效率与经济性。
软件层还将加速UltraSMR、ePMR、HAMR HDD及闪存平台上的存储创新应用,同时显著缩短投产周期并降低各存储层级的认证风险。通过简化存储基础设施部署,西部数据将在无需改动现有架构的前提下,加快客户的价值实现。
崔欢欢:目前业内在探索一些不同的技术路线,西部数据在提升硬盘容量方面的侧重点是什么?
Stefan Mandl:西部数据正利用其以客户为中心的创新技术,提供AI时代下的确定性。侧重点一是通过ePMR和HAMR双技术路径提升容量,刚刚文芳也提到过。二是通过性能优化技术提升HDD带宽和IO能力。
为了弥合与 QLC 闪存之间的差距,西部数据推出了两项创新,就是我此前提到的高带宽硬盘技术(High Bandwidth Drive Technology)和双枢轴技术(Dual Pivot Technology)。详细介绍一下这两项技术:高带宽硬盘技术通过多磁头在多个磁道同时进行读写,能在不增加功耗的前提下提供高达传统HDD 2倍的带宽。未来可实现高达8倍的带宽增益,目前已交付客户验证。
双枢轴技术是在独立枢轴上增加了第二组独立运行的执行器,可(在3.5英寸硬盘内)提供高达2倍的顺序IO性能增益。此外双枢轴技术通过缩小磁碟间距,在单个硬盘中搭载更多磁碟,从而提升整体容量。
通过两项技术结合,西部数据将使硬盘顺序IO性能整体提升至4倍,在实现100TB HDD的同时,仍能保持客户当前拥有的每TB相对IO速率。有效减少了客户在容量扩展过程中增加SSD部署或重构服务架构的需求。
崔欢欢:回到具体AI应用场景,比如大规模模型推理方面,您观察目前国内企业用户在硬盘部署和方案思路上有哪些共性的考量?
文芳:大语言模型的训练和推理需要海量数据支撑,因此客户通常会对整个存储体系进行分层管理。热数据仍更多放在高性能介质上,而温数据和冷数据目前仍主要运行在HDD上。像大模型文件、向量嵌入和历史数据这类内容,都要依托具备大容量和规模化经济性的存储介质。
随着推理负载快速增长,客户开始更加关注吞吐量、数据局部性(Data Locality)和预取技术(Pre-fetching),提升推理数据的暂存和调度效率。这也说明,AI基础设施正在朝着更具成本效益和能效比的方向发展。
在这一背景下,经过分层管理后,那些需要大容量、高可靠性、高效率和低能耗的数据,仍会更多放在HDD上。从这个意义上说,“没有HDD就没有AI”并不夸张。
最后
从这次采访可以看出,西部数据对AI时代存储基础设施的判断明确——一方面,随着训练、推理、数据湖和长期数据调用需求同步增长,HDD仍将凭借容量、能效、规模化成本效益等优势,继续承担AI规模化部署的基础角色。
另一方面,AI对存储提出的要求从容量延伸到性能、可靠性、可预测性和分层协同能力。对此西部数据正在通过ePMR与HAMR双路径推进容量升级,并通过高带宽硬盘、双枢轴技术和平台化能力扩展等方式,回应客户过渡周期、部署效率和架构演进上的现实需求。其重点,是希望从组件供应商转向更深入参与客户AI数据基础设施规划的战略合作伙伴。
- IDC来源:Worldwide Global StorageSphere Forecast, 2025-2029, Doc #US53561425
- 数据来源:中国信通院,https://www.caict.ac.cn/kxyj/qwfb/bps/202602/t20260202_712679.htm
- 数据来源:新华社,https://www.news.cn/politics/20260305/e8d78b5a77c844da984d5ec442dbfa9f/c.html
