Jason Feist

Perspective

08 12月, 2025

クラウド

適切なデータを、適切な場所に、適切なタイミングで

Jason Feist

Perspective

大規模な運用においては、階層化が多層的な利点をもたらす

AIは、効率的なデータ・システムを構築することの意味を変えつつあります。

企業の約3分の2は、生成AIによって保存データ量が増加すると予測しています。一方で、インフラストラクチャが「生成AIに完全に最適化されている」と回答したのは、約3分の1に過ぎません。AIワークロードとそれに必要となるかつてないほど膨大なデータに対応可能なデータ・センター・アーキテクチャを設計することが、極めて重要です。

トレーニングされるモデル、分析される動画、精緻化されるシミュレーションのそれぞれが新たなデータの波を生み出し、そのデータは、保存され、再利用されなければなりません。ではアーキテクチャやビジネス・モデルは、データ生成のスピードについていくことが可能なのでしょうか?階層化なら、可能です。

データ階層化がAIのパフォーマンスと拡張性を最適化する仕組み

データ階層化は、情報を適切な場所に、適切なタイミングで保持します。それにより、インフラストラクチャはパフォーマンス、拡張性、コストのバランスを実現できます。絶えず手動でチューニングする必要はありません。

  • リアルタイム・アクセス層は、読み込みが多くアクティブなデータ・バーストを処理し、通常、メモリやフラッシュ・ストレージがこの層を支えます。
  • 頻繁アクセス層は、混在したアクティビティを処理し、ハードディスク・ドライブ・ストレージ・クラスタが大規模かつ効率的にこの層を支えます。
  • 大容量層は、大規模データセットを常に再利用および分析できるよう保持します。この層では大容量ハードディスク・ドライブが、テラバイトあたりのコストを最小化しつつ、最適なパフォーマンスを実現します。

階層化とは、優劣をつけることではなく、調和を図ることです。各層がそれぞれ異なる役割を果たし、全体としてより高速で効率的、スケーラブルかつ持続可能なシステムを実現します。

AI駆動型アプリケーションによって生成されるデータは、直線的な経路をたどるわけではありません。収集、処理、トレーニング、精緻化、再トレーニングの過程で複数の階層を流れるように移動し、真の価値を引き出していくのです。階層化は、この果てしないデータの流れを強みに変えます。それによって、より多くのデータを休眠状態ではなく生産的な状態に保つことができます。価値ある成果が取り残されることもありません。チームはポリシー配置、ライフサイクル・タグ、テレメトリを用いてデータを体系化します。その目的は、アクティブなデータセットをコンピューティング環境の近くに置きながら、深層のデータセットを手頃で耐久性があり、なおかつ必要なときすぐに利用可能な状態に保つことです。

階層型ストレージがAIトレーニングを高速かつ効率的に保つ仕組み

GPUが性能を発揮するには、大量のデータを十分な速度で供給される必要があります。現代のハードディスク・ドライブ・システムはミリ秒単位という速度の応答を実現しており、AIのトレーニングや推論を円滑に進めることができます。メモリやフラッシュ・ストレージがキャッシュとして機能し、ハードディスク・ドライブが深層の記憶領域を提供します。そのため、クラウド・データの約85%は依然としてハードディスク・ドライブ上に保存されています1。拡張性は、大容量かつ手頃な価格のストレージに依存しているのです。

階層化により、ペタバイト規模の出力データが、高コストのインフラストラクチャを圧迫したり、次のモデルのトレーニング前に消失してしまったりする事態を防げます。再利用も現実的になります。同じデータベースが、今日のトレーニング、明日のファインチューニング、そして将来のガバナンス監査に活用できるのです。容量計画は制約ではなく、活用すべき手段へと変わります。

効率こそが新たなパフォーマンス

階層化は、企業が既存のインフラストラクチャを最適に活用するのに役立ちます。過剰なプロビジョニングを防ぎ、アイドル時消費電力を削減し、アセットの寿命を延ばすことができます。システム・レベルでは、ハードディスク・ドライブベースの階層により、総所有コストの点で大きな優位性が得られます。

面記録密度が高い、つまりデータ集約型アプリケーション向けに設計されたドライブは、スピンドルあたりのテラバイト数を増やし、電力供給および冷却が必要なラック数を減らし、テラバイトあたりの消費電力を抑えます。その結果、速度や回復力を犠牲にすることなく、効率が向上します。

階層型ストレージが消費電力を削減し、持続可能なAIを支える仕組み

規模が大きくなると、効率性は、しばしば持続可能性と同義になります。アクセス頻度の低いデータを、電力効率に優れた大容量の階層へ移行することで、運用時の排出量を削減できます。

その裏付けとなるのが、最近のシステム・レベルのモデリングです。それによると、同容量のSSDラックと比較して、ハードディスク・ドライブ・ラックは消費電力が約4分の1、エンボディード・カーボン(製造過程で排出される炭素)は約10分の1に留まるといいます。2

ドライブの再整備・再展開や、レア・アースなどの希少資源をサプライ・チェーンに再投入するといった循環型の取り組みは、エンボディード・カーボンを削減し、製品寿命を延ばします。

ドライブ数の削減、ライフサイクルの延長、廃棄物の削減。これらは階層型ストレージ3によって実現される明らかな利点です。

企業が成功するための手段

AIによるデータ・フットプリントは、今後も拡大し続けます。階層化こそが、企業が優位性を保ち続けるための手段です。必要な場所にスピードを、求められる場所に拡張性を、そして至る所に持続可能性をもたらします。

大規模な環境においては、この3点のバランスを支える基盤は今なおハードディスク・ドライブであり、パフォーマンス、手頃な価格、効率性を同時に実現します。

このようにして、階層化は大規模環境における優位性をもたらします。適切なデータを、適切な場所に、適切なタイミングで保持するのです。

AIの可能性を最大限に引き出すには、データとそれを支えるストレージが必要です。


脚注

  1. 複数の業界アナリスト・レポートに基づくSeagateの分析。
  2. HotCarbon 2024、『『A Call for Research on Storage Emissions
  3. 2024年度:180万台以上のドライブが再稼働 (Seagate Circularity)、2023年度:119万台のドライブが寿命延長で再稼働 (Seagate Planetページ、"Circularity")。

 

関連トピック:

Cloud
Black and white headshot photo of Jason Feist, Senior Vice President, Cloud Marketing, is shown.
Jason Feist

クラウド・マーケティング担当上席副社長