Open

Jason Feist

Perspective

08 déc., 2025

CLOUD

Les bonnes données, au bon endroit, au bon moment

Jason Feist

Perspective

À grande échelle, le stockage par niveaux apporte divers avantages

L’IA redéfinit la manière de concevoir des systèmes de données efficaces.

Deux tiers des entreprises estiment que l’utilisation de l’IA générative va accroître les volumes de données stockés. Elles sont pourtant seulement un tiers environ à affirmer que leur infrastructure est « entièrement optimisée pour l’IA générative ». Il est impératif de concevoir des architectures de centres de données capables de gérer les charges de travail de l’IA et le volume de données exponentiel qu’elles nécessitent.

Chaque modèle entraîné, chaque vidéo analysée et chaque simulation affinée génèrent des données en masse qui doivent être stockées et réutilisées. Les architectures et les modèles économiques peuvent-ils suivre le rythme effréné de cette création de données ? Grâce au stockage par niveaux, c’est possible.

Comment le stockage des données par niveaux optimise-t-il les performances de l’IA et s’adapte-t-il à son évolutivité ?

Le stockage par niveaux permet de conserver les informations au bon endroit et au bon moment ; c’est ce qui permet aux infrastructures d’équilibrer performances, évolutivité et coûts, sans réglage manuel constant.

  • Les niveaux d’accès en temps réel gèrent les pics d’activité en lecture, généralement pris en charge par la mémoire vive et le stockage Flash.
  • Les niveaux d’accès fréquents répondent à un usage mixte et sont pris en charge efficacement à grande échelle par les clusters de stockage sur disques durs.
  • Les niveaux à très grande capacité conservent des ensembles de données volumineux, afin qu’ils restent disponibles pour la réutilisation et l’analyse, tandis que les disques durs à capacité élevée constituent la base de ces niveaux, offrant le coût par téraoctet le plus bas et des performances optimales.

Le stockage par niveaux n’est pas une question de hiérarchie, mais d’harmonie. Chaque couche remplit un rôle spécifique et, ensemble, elles rendent le système plus rapide, plus efficace, évolutif et durable.

Les données créées par les applications optimisées par l’IA ne suivent pas un chemin linéaire : elles transitent par plusieurs niveaux au fil des captures, des traitements, des entraînements, des affinements et des réentraînements afin de révéler leur plein potentiel. Le stockage par niveaux transforme ce flux infini de données en un avantage : exploiter une plus grande partie de vos données au lieu de les laisser inactives, évitant ainsi la perte de résultats précieux. Les équipes codifient les données à l’aide de politiques de placement, d’étiquettes de cycle de vie et de la télémétrie. L’objectif est de maintenir les données exploitables au plus près des unités de calcul, tout en conservant les données profondes dans une infrastructure économique, durable et accessible à tout moment.

Comment le stockage par niveau accélère et optimise-t-il l’entraînement de l’IA ?

Les GPU ne sont rentables que lorsqu’ils sont alimentés en données de manière massive et suffisamment rapidement pour rester constamment occupés. Les systèmes de disques durs modernes offrent un temps de réponse de l’ordre de la milliseconde, suffisamment court pour assurer en continu l’entraînement et l’inférence de l’IA. La mémoire vive et le stockage Flash gèrent le cache, tandis que les disques durs fournissent la capacité. C’est pourquoi environ 85 % des données du cloud résident encore sur des disques durs1 : adapter le volume de stockage repose sur une capacité qui doit être à la fois massive et financièrement accessible.

Le stockage par niveaux permet d’éviter que les pétaoctets de données de sortie surchargent une infrastructure coûteuse ou disparaissent avant d’avoir pu entraîner le modèle suivant. La réutilisation offre alors un réel atout : la même base de données peut alimenter l’entraînement aujourd’hui, les ajustements demain et les audits de gouvernance à l’avenir. La planification de la capacité devient un levier, et non une contrainte.

L’efficacité : la nouvelle performance

Le stockage par niveaux permet aux entreprises d’optimiser leur infrastructure existante. Ce modèle évite le surdimensionnement, réduit la consommation au repos et prolonge la durée de vie des équipements. À l’échelle des systèmes, les niveaux de stockage basés sur des disques durs offrent un avantage significatif en termes de coût total de possession.

Avec des densités surfaciques plus élevées, grâce à des disques conçus pour les applications gourmandes en données, il est possible de stocker plus de téraoctets par plateau, de réduire le nombre de racks à alimenter et à refroidir, et de diminuer la consommation d’énergie par téraoctet. Résultat : une efficacité accrue sans compromis sur la vitesse ni la résilience.

Comment le stockage par niveau réduit-il la consommation d’énergie et favorise-t-il une IA durable ?

À grande échelle, l’efficacité devient synonyme de durabilité. Le déplacement des données rarement consultées vers des niveaux de stockage à capacité élevée et à faible consommation d’énergie contribue à réduire les émissions opérationnelles.

De récentes modélisations à l’échelle des systèmes le confirment : les racks de disques durs consomment environ quatre fois moins d’énergie et émettent environ dix fois moins de carbone incorporé que les racks de SSD de capacité équivalente2.

Les pratiques d’économie circulaire, comme le reconditionnement et le redéploiement des disques durs ou la réintégration des terres rares dans la chaîne d’approvisionnement, réduisent l’empreinte carbone et prolongent la durée de vie utile des équipements.

Moins de disques durs, des cycles de vie plus longs et moins de déchets : des bénéfices concrets que le stockage par niveaux3 rend possibles.

Comment les entreprises réussissent-elles ?

L’empreinte numérique de l’IA ne cessera de s’étendre. Grâce au stockage par niveaux, les entreprises gardent une longueur d’avance, en garantissant la rapidité là où elle est nécessaire, l’évolutivité là où elle est requise et la durabilité à tous les niveaux.

À très grande échelle, les disques durs restent la pierre angulaire de cet équilibre, alliant performances, accessibilité et efficacité.

C’est ainsi que ce modèle crée un avantage à grande échelle : un stockage des bonnes données au bon endroit, au bon moment.

Tout le potentiel de l’IA repose sur les données, sans oublier l’infrastructure de stockage associée.


Notes de bas de page

  1. Analyse Seagate de plusieurs rapports d’analystes du secteur.
  2. HotCarbon 2024, « A Call for Research on Storage Emissions ».
  3. Exercice 2024 : plus de 1,8 million de disques remis en service (Seagate Circularity) ; exercice 2023 : 1,19 million de disques reconditionnés (Page Planet, « Circularité » de Seagate).

 

Rubriques connexes :

Cloud
Black and white headshot photo of Jason Feist, Senior Vice President, Cloud Marketing, is shown.
Jason Feist

Vice-président directeur, division du marketing cloud