Jason Feist

Perspective

08 12月, 2025

云端

正确的数据、正确的地点、正确的时间

Jason Feist

Perspective

规模化之后,分层设计能带来多重优势。

人工智能正在改变构建高效数据系统的意义。

三分之二的企业预计 GenAI 将增加存储的数据量。但只有大约三分之一的人表示他们的基础设施“完全针对 GenAI 进行了优化”。设计能够支持人工智能工作负载及其所需不断增长的数据量的数据中心架构至关重要。

每个训练的模型、每个分析的视频和每个改进的模拟都会产生大量数据,这些数据必须存储和重用。架构和商业模式能否跟上数据创建的步伐?是的,这要归功于分级定价。

数据分层如何优化 AI 性能和规模

数据分层确保信息在正确的时间出现在正确的位置。这就是基础设施如何在无需不断手动调整的情况下平衡性能、规模和成本的方式。

  • 实时访问层处理活跃的、读取密集型突发操作,内存和闪存通常支持这些操作。
  • 频繁访问层服务于混合活动,硬盘存储集群可以大规模地高效地支持它们。
  • 大容量层保留大型数据集,以便它们可以继续被重用和分析,而大容量硬盘则为这些数据集提供锚定,以实现每TB最低成本和最佳性能。

分层不是为了等级制度,而是为了和谐。每一层都发挥着独特的作用,它们共同使系统更快、更高效、更具可扩展性和可持续性。

人工智能驱动的应用程序产生的数据不会走直线——它会经过多个层级,被捕获、处理、训练、提炼和重新训练,以释放其真正的价值。分层存储可以将无限的数据流转化为优势:它可以让你更多的数据保持高效利用,而不是闲置。它能确保有价值的研究成果不会被埋没。团队通过策略部署、生命周期标签和遥测技术对数据进行编码。目标:保持工作集靠近计算,并保持深层集价格合理、经久耐用,且随时可用。

分层存储如何保证 AI 训练的快速高效

只有当GPU能够快速接收海量数据并保持高效运行时,它们才能真正发挥作用。现代硬盘系统可提供毫秒级的响应速度——足以保证人工智能训练和推理的顺利进行。内存和闪存负责缓存,而硬盘提供深度数据。这就是为什么大约 85% 的云数据仍然存储在硬盘上1:规模取决于容量,而容量又必须高且价格合理。

分层技术使得 PB 级的输出数据能够避免占用高成本的基础设施,或者在训练下一个模型之前丢失。它使重用成为可能:同一个数据库今天可以用于训练,明天可以用于微调,将来还可以用于治理审计。产能规划不再是制约因素,而成为一种杠杆。

效率是新的绩效

分层架构有助于企业优化利用现有基础设施。它可以防止过度配置,减少空闲功耗,延长资产寿命。从系统层面来看,基于硬盘驱动器的分层架构具有显著的总体拥有成本优势。

更高的面密度——专为数据密集型应用而设计的硬盘——意味着每个主轴可存储更多TB的数据,需要供电和冷却的机架数量更少,每TB的能耗更低。其结果是在不牺牲速度或韧性的前提下,实现了更高的效率。

分层储能如何降低能源消耗并支持可持续人工智能

从规模上看,效率往往等同于可持续性。将不常用的数据迁移到节能、高容量的存储层,可以减少运营排放。

最近的系统级建模证实了这一点:与同等容量的固态硬盘机架相比,硬盘机架的功耗大约低四倍,隐含碳排放量大约低十倍。2

循环利用实践——例如翻新和重新部署驱动器或将稀土元素重新部署到供应链中——可以减少隐含碳排放并延长使用寿命。

更少的驱动器、更长的使用寿命和更少的浪费:这些都是分层存储带来的切实收益3

企业如何成功

人工智能的数据足迹只会不断扩大。分层架构是企业保持领先的方式,在需要的地方提供速度,在需要的地方提供规模,并在整个过程中保持可持续性。

从大规模应用的角度来看,硬盘仍然是这种平衡的支柱:它能够同时实现性能、价格和效率。

这就是分层如何实现规模化优势的原理。它能在正确的时间将正确的数据存储在正确的位置。

人工智能的全部潜力需要数据——以及存储这些数据的存储系统。


脚注

  1. Seagate 对多份行业分析师报告的分析。
  2. HotCarbon 2024,“呼吁开展储能排放研究。
  3. 2024财年:超过180万块硬盘重新投入使用(Seagate Circularity);2023财年:119 万个硬盘恢复使用(Seagate Planet 页面,“循环经济”)。

 

相关话题:

Cloud
Black and white headshot photo of Jason Feist, Senior Vice President, Cloud Marketing, is shown.
Jason Feist

云营销高级副总裁