“西部数据的策略:从11碟HDD出发,重塑AI存储底座。
让我们来试想这样一个场景:凌晨3点,某大模型云服务平台的日志系统依然在高速写入。
用户刚刚在一个智能体平台上发起了一次多轮对话请求——表面上只是一个简单的金融问询,但背后,调度了3个子模型、20多次跨服务交互、超2万token的上下文流转。模型的响应不过几百毫秒,但系统中每一轮交互、每一次召回、每一段中间推理路径,都被如实记录下来,写入归档。
问题是,每天都有TB级的推理日志、对话记录、embedding缓存、agent调用历史等“温冷数据”生成,怎么存?存在哪儿?存多久?成本能不能承受?
西部数据在2024年10月推出的UltrastarTM DC HC690数据中心硬盘是一项适合的选择。这是全球首款商用11碟UltraSMR HDD,在标准3.5英寸结构下,实现了32TB超高容量,融合了经市场验证的成熟设计与前沿创新技术,助力数据中心在现有基础设施内实现更高存储密度。
那么,在AI时代,HDD将扮演什么样的角色,西部数据的技术产品又有什么不一样?为了回答这些问题,数据猿采访了西部数据的高级销售总监文芳。
如果说算力决定了AI跑多快,数据就决定了它跑多远。
但这个“跑远”的代价,正在变得越来越沉重。
2025年,大模型和智能体进入商用部署的新阶段,“一企一模型”“一行一垂类”的趋势拉开,随之而来的,是以PB乃至EB为单位的数据暴涨。从训练数据、微调数据,到推理日志、模型版本、Agent调用记录,数据不只是多了,还存在结构性特征。
1.数据爆炸,热温冷分层成为常态
根据国家数据局数据,2024年中国AI企业数量同比增长36%,高质量数据集增长27.4%,数据中心对更高强度AI应用的支持需求正在迅速攀升。
这背后,是企业在构建自己专属知识库、Agent能力池、领域微调集时,对数据的深度依赖——而且,这些数据的生命周期越来越复杂。
“热温冷”三层数据结构,已经成为AI业务系统的事实标准。这些数据分别都是什么呢?
·热数据:实时调用、频繁读写,典型如token缓存、任务队列、模型权重更新;
·温数据:中频访问、周期性分析,如推理中间结果、Embedding向量库、用户行为日志;
·冷数据:归档、合规、历史记录,如原始训练集、版本历史、监管审计记录。
在AI工作负载中,“温冷数据”的占比越来越高,它们既不够热,也不能彻底冰封;既要求长周期保存,又不能牺牲访问可用性。
这使得数据分层策略不再只是“性能-价格”之间的折中权衡,而是事关业务架构稳定性与成本可控性的“战略设计”。
2.TCO(总体拥有成本),成为重要的决策标准
与以往“按性能买硬件”的时代不同,AI时代的数据中心在做存储决策时,关注的问题变了。
除了追求“速度有多快”,还要考虑“容量单价是多少?”“扩展之后会不会不兼容?”“这笔钱值不值得花在这批温数据上?”
这正是TCO(Total Cost of Ownership)概念成为核心指标的原因。
从存储容量单价、能源效率、空间密度,到可预测的扩展性与维护成本,AI系统的底层架构越来越倾向于做“长期账”,而非只做“性能账”。
比如,同样是部署一个2PB的数据系统,如果能够降低20%的能耗、减少25%的服务器数量,那么哪怕读写速度略有差距,这笔投资依然是值得的。
这就是“总体拥有成本”导向下的存储观——“能长期用、用得起、未来还能升级”。
文芳提及,这正是大容量机械硬盘(HDD)发挥战略作用的关键所在——它们能提供具有规模化成本效益的存储容量,为PB/EB级AI存储环境带来卓越的总体拥有成本(TCO)优势。
既然HDD这么重要,那么,下一个问题就变成——谁能把HDD这张牌打好,谁能把它做得更大、更强、更节能?
编者认为,AI时代对HDD提出了两个新要求:更大的容量,更长的周期。这不仅仅是一次性的性能突破,更是一次关于“长期信赖”关系的重构。
在这个背景下,西部数据以UltrastarTM DC HC690数据中心硬盘为代表的新一代大容量HDD的重要性愈发凸显。
1.数据底座:更优TCO+长期信赖
在AI驱动的数据中心架构中,HDD是不可替代的底座。因为它能带来规模化成本效益。尤其是在温、冷数据归档这类场景中,HDD的高存储密度和具有优势的每TB成本,构成了AI规模化部署的现实基础。
在今天的超大规模云平台中,HDD承担着绝大多数温冷数据的存储任务,占据了整个数据中心大部分的物理存储空间和主要数据留存容量。而随着AI的深入落地,这一比例还在持续提升。
可以说,HDD已经成为AI时代的数据基础设施支柱。西部数据在保证可靠性的基础上,让客户能够“预测成本、信任扩展、安心使用”。
2.产品亮点:UltrastarTM DC HC690
据文芳介绍,UltrastarTM DC HC690这款产品上采用了多项关键技术,具备以下优势:
·32TB容量,全球首款商用11碟UltraSMR HDD,封装于标准3.5英寸结构中;
·协同技术加持:包括ePMR(能量辅助垂直磁记录)、UltraSMR、HelioSealTM、OptiNANDTM;
·功耗表现优秀:即使磁碟数量增加,单位容量能效依旧维持在与10碟产品几乎相当水平。
每一项技术是为了实现一件事,在不增加占用空间的前提下,提升容量密度,同时保持稳定与节能。
如何在3.5英寸的空间内放下11碟磁盘,而不牺牲稳定性和散热?这并不是简单的堆叠问题,而是一次结构性的优化。
在UltrastarTM DC HC690的设计中,工程团队围绕以下关键点进行多项创新:
·缩小磁碟间距:在保持碟片厚度以保障制造效率的同时,提升单位硬盘容量;
·微调磁头悬挂装置构:确保磁头在高密度条件下依然精准定位;
·PCB板避让设计:通过重新布局电路板走线,为碟片结构让出空间;
这些细节的集合,构成了“不升尺寸而升容量”的技术解法——让HDD真正成为数据中心架构中可持续演进的一部分,而不是“一次性采购品”。
需要指出的是,西部数据的目标不仅是32TB,而是一个更长周期的路线图——同步推进ePMR/UltraSMR的商业化与HAMR的工程验证。预计2027年,西部数据将实现HAMR产品的量产,同时保持与现有产品的兼容演进。2030年后,西部数据计划按路线图发展50TB+级别的HDD(说明:关于未来产品规划和技术路线的表述均为前瞻性陈述,可能因技术、市场或供应链等因素发生调整)。
而且,西部数据旨在构建一条“可预测、可平滑迁移、可长期信赖”的技术路径,致力于降低系统演进过程中的架构调整与风险评估复杂度。这是对客户的长期关系战略——构建“存储信赖路径”,帮助客户把其数据底座变成护城河。
真正的技术护城河,从来不是某个指标的领先,而是能不能在长期系统里反复证明自己:稳定、可扩展、可信赖。
对企业而言,这种价值是写在每一张电费账单、每一台服务器、每一次扩容的采购周期中。
以西部数据的HC690为例,在部署同样2PB容量的场景下,相比传统24TB HDD,客户可以减少约25%的服务器数量,节省机架空间;降低约20%的整体能耗,同时降低基础设施与维护成本。
从资源利用角度看,这是一种“结构性节省”。大规模部署下单位TB的成本更低,帮助客户更快达成可持续目标。系统扩容路径更可预测,无须大幅调整部署架构。对于AI推理数据、归档数据、训练历史数据等体量巨大的“冷/温数据”,这类大容量HDD,正是当前可规模化落地的经济可行方案。
此外,在落地路径上,西部数据显然也不是“只卖设备”这么简单。他们在本地化方面,也进行了诸多努力。比如,其在亚太设有SIT实验室(Storage Integration Test),为本地客户提供产品开发规划与部署、新产品测试验证、产品认证与导入等服务。他们还与超大规模客户进行联合开发,在早期就参与战略协同,降低部署风险,并提供贯穿产品全生命周期的持续工程支持。对于中国本地客户,这意味着更快的支持响应、更稳的产品迭代、更长的生命周期保障。
展望未来,数据的爆炸性增长,正重塑“存储”的产业角色。
根据中国信通院数据显示,2024年中国云计算市场已达8288亿元,同比增长34.4%。预计到2030年,该市场将突破3万亿,成为AI、工业互联网、视频流平台等数据密集型行业的底层依托。
这不是一个线性增长市场,而是一个“被AI放大的广阔空间”。每一个多模态模型的推理调用、每一个Agent系统的上下文记录,每一次大语言模型的“记忆保存”,都是对存储底座的“微小索取”。
而当这些“微小索取”累计到PB/EB级规模时,编者认为,谁能成为高规模化经济效益、低功耗、高可扩展的数据承载方,谁就将在未来云基础设施中具备更强的话语权。
这正是HDD发挥重要作用的底层逻辑——AI不仅改变了数据量,更改变了对“存储”的定义。