企业如何做好准备才能最大化 AI 投资效益?
13 10月, 2025
AI 的成功离不开海量数据,
而海量数据的存储则依赖于高效、充足的存储解决方案。
数据是 AI 的基础,而大容量硬盘则是数据存储的支柱。
这一观点在研究机构 Recon Analytics 于 2025 年开展的一项调查中得到了进一步印证。
该全球调查由 Seagate 委托开展,涵盖 1,062 名受访者,他们均为 IT 存储采购人员或决策者,负责企业的存储基础设施。这些企业的年收入超过 1,000 万美元,当前存储使用量超过 50TB,已采用或计划在未来三年内采用 AI,且来自美国、中国、英国、韩国、新加坡、法国、印度、日本、台湾和德国。
调查重点关注 AI 采用对基础设施优先级、数据保留及数据管理的影响,其结果揭示了 AI 在未来三年内对基础设施需求的深远影响。
首先,调查表明,AI 的广泛应用正在推动数据存储需求呈指数级增长,并预计这一趋势将持续到 2028 年。
图 1:在主要使用云存储进行 AI 数据管理的受访企业中,61% 预计未来三年内存储需求将增长 100% 以上。
随着 AI 应用带来前所未有的数据增长,企业保存的数据越多,就越能验证 AI 是否按照预期运行。通过访问行为数据(如训练数据集、模型检查点、提示和答案),企业可以深入分析算法,更好地理解和优化 AI 的决策过程。如果没有数据中心的规模化和高效存储,AI 的潜力将受到限制,因为存储和检索海量数据的能力是 AI 成功的关键。
影响 AI 成效的不仅是存储容量,数据存储时长同样重要。
图 2:在当前已采用 AI 的企业中,90% 认为保留更多历史数据有助于提升模型的准确性。
这一调查结果表明,长期保存数据与更可靠的 AI 洞察之间存在一定关联。这一现象可能由多个因素驱动:首先,AI 算法依赖于持续的迭代处理。内容输出会反馈至模型,不断提升其准确性,并支持新模型的开发。原始数据集及其分析结果也会成为后续优化和新工作流的基础。
此外,长期存储数据还具有重要的业务价值,比如保护企业的知识产权。这相当于保留了模型最初使用的数据集和处理过程,在需要时(例如法律诉讼中)可用于解释 AI 结果。这些数据记录建立了清晰的数据沿袭,确保数据从输入到输出的全过程可追溯。数据沿袭让企业能够验证数据的来源和使用方式,确保 AI 模型基于准确的数据运行。这样还能使 AI 系统具备可审计性,并支持企业满足合规要求及内部管理需求。
此外,企业可能会选择更长时间地存储更多数据,因为他们意识到,当前无法预见未来的算法可能会从过去的数据中挖掘出新的有价值的见解。长期存储数据使尚未开发的 AI 模型能够处理历史数据。因此,延长数据存储时间能够提升 AI 为企业带来的业务价值。
相关调查还显示,基础设施决策者认为,延长数据存储时间对于建立信任至关重要,而没有信任作为基础,AI 洞察的价值将大打折扣。
Seagate 将“可信赖 AI”定义为:基于可靠数据流程和模型,使用可信输入并生成可靠见解的 AI。“可信赖 AI”建立在以下数据标准之上:
图 3:在当前已采用 AI 的企业中,88% 表示要建立“可信赖 AI”,需要存储更多数据,并延长数据保存时间。
可扩展的存储基础设施对于构建“可信赖 AI”至关重要,这样可确保 AI 系统所依赖的大量数据得到妥善管理、存储和保护。
检查点是指在 AI 模型训练过程中,以较短的时间间隔保存模型状态的过程。AI 模型需要在大规模数据集上进行迭代训练,整个过程可能持续数分钟到数月,具体时间取决于模型的复杂性、数据集的规模以及可用的计算能力。在此期间,模型不断接收数据、调整参数,并学习如何根据输入信息进行预测。
检查点相当于模型在训练过程中不同阶段的快照,记录了其数据、参数和设置信息。这些快照通常每隔几分钟就会存储到存储设备中,使开发人员能够保留模型训练的进展记录,并在遇到意外中断时避免丢失关键工作。
调查显示,使用 100PB 以上存储的企业通常会每天至每周进行检查点存储和备份,其中 87% 的企业选择将这些检查点存储在云端,或采用机械硬盘与固态硬盘混合存储的方式。
在 AI 发展趋势的讨论中,计算能力和能源消耗是常见话题。但 Recon Analytics 的调查强调,存储才是推动 AI 发展的核心要素。
图 4:66% 的基础架构决策者将存储列为四大 AI 关键驱动因素中排名第二的因素,同时也将其视为 AI 部署的第四大挑战。
Recon Analytics 创始人兼首席分析师 Roger Entner 指出:
“调查结果普遍显示,数据存储需求即将迎来新一轮增长,而硬盘无疑是这一趋势的最大受益者。考虑到受访企业计划在云端存储越来越多的 AI 相关数据,可以预见,云服务即将迎来第二波增长浪潮。”
要充分发挥 AI 的价值,企业必须提前规划,构建可扩展且高效的数据存储。无论是本地部署还是云服务,AI 对数据的依赖都离不开硬盘——它以高容量、成本效益以及可持续性的优势成为“可信赖 AI”的中坚力量。