Par Praveen Viraraghavan

03 mars, 2025

IA

L’évolution des besoins de stockage pour l’infrastructure IA.

PraveenViraraghavan

Les solutions de stockage IA doivent évoluer pour gérer la croissance exponentielle des données. Des innovations telles que les disques à actionneur double, le stockage NVMe et les solutions à faible consommation d’énergie façonnent l’avenir de l’infrastructure IA.

Table des matières

À mesure que l’intelligence artificielle (IA) continue de s’améliorer, l’infrastructure sur laquelle elle repose doit évoluer pour gérer les demandes croissantes en matière de stockage et de traitement des données. Le stockage des données joue un rôle essentiel dans le cycle de vie d’une infrastructure IA, et les solutions doivent être capables de relever les défis actuels et futurs liés à l’IA.

La quantité de données générées quotidiennement est colossale. Que ce soit pour les villes intelligentes produisant 143 pétaoctets de données par jour, selon un rapport de Kaleido Intelligence1 ou pour les véhicules autonomes qui génèrent plusieurs téraoctets (To) de données, le besoin de solutions de stockage efficaces est plus pressant que jamais. Les constructeurs de véhicules autonomes transfèrent d’énormes quantités de données aux services cloud, qui procèdent ensuite à leur traitement et à leur utilisation pour améliorer les modèles d’intelligence artificielle. Ce flux continu de données nécessite des solutions de stockage robustes capables de gérer la vitesse et le volume requis par les applications d’IA.

Rapport performances/consommation

Malgré l’importance accordée aux technologies de pointe telles que les processeurs graphiques (GPU), les disques durs restent un composant essentiel de l’infrastructure IA. Ils apportent la capacité de stockage nécessaire pour les gigantesques ensembles de données utilisés pour l’entraînement et l’inférence de l’intelligence artificielle. Les GPU assument la lourde tâche de traiter les données, tandis que les disques durs sont chargés de stocker les données qui alimentent ces processus. Cette relation de dépendance garantit aux systèmes IA un fonctionnement efficace sans se heurter à des limites de stockage.

L’un des plus grands défis d’une infrastructure IA est l’équilibre entre performances et consommation énergétique. À mesure que les clusters de GPU se développent, la consommation nécessaire à leur exécution augmente considérablement. Par exemple, les déploiements à grande échelle, tels que ceux réalisés par les leaders de l’IA, nécessitent des milliers de processeurs graphiques, chacun d’entre eux consommant énormément d’énergie. Ainsi, ce type d’application crée un besoin de solutions de stockage à la fois hautement performantes et peu énergivores. Pour donner un ordre de grandeur, un seul processeur graphique peut consommer jusqu’à 700 watts, et des déploiements à grande échelle peuvent impliquer jusqu’à 100 000 processeurs graphiques, engendrant une consommation d’énergie de 70 mégawatts. Cela équivaut à la consommation totale d’énergie d’un grand centre de données. Par conséquent, si elles veulent suivre la cadence des processeurs graphiques, les solutions de stockage doivent être conçues pour minimiser la consommation d’énergie tout en optimisant les performances.

L’importance des points de contrôle.

L’entraînement de l’IA nécessite la création de points de contrôle pour éviter une perte de progression en cas de défaillance du système. Ces points de contrôle enregistrent l’état du modèle IA à intervalles réguliers (par exemple, de l’ordre de quelques minutes), afin de permettre au processus d’apprentissage de reprendre au niveau du dernier enregistrement plutôt que du début. Ceci est particulièrement important pour les entraînements longs, qui peuvent s’étendre sur des semaines, voire des mois. L’efficacité des points de contrôle repose sur la rapidité des solutions de stockage, qui doivent être capables de sauvegarder et de récupérer rapidement de grandes quantités de données.

Par exemple, certaines grandes plates-formes d’entraînement réalisent des points de contrôle toutes les minutes pendant l’entraînement. Elles enregistrent d’abord les données sur des SSD avant de les transférer sur des disques durs. Ce processus garantit que, même en cas de défaillance, l’entraînement peut reprendre avec une perte de données minimale. Ces points de contrôle peuvent atteindre des tailles conséquentes, jusqu’à 12 To dans certains cas.

Les disques durs sont essentiels pour stocker les points de contrôle des entraînements d’IA en raison de leur évolutivité, leur rentabilité, leur efficacité énergétique, leur durabilité et leur longévité.

Prédictions des tendances et innovations.

À l’avenir, la demande en stockage pour l’IA devrait croître de manière exponentielle. Selon des données de Bloomberg Intelligence, IDC, eMarketer et Statista2, d’ici 2032, le marché du stockage IA devrait atteindre 92 milliards de dollars. Cet essor est encouragé par la complexité croissante des modèles d’IA et l’expansion de l’utilisation de l’IA dans divers secteurs. Pour répondre à cette demande, les solutions de stockage doivent se perfectionner pour offrir de meilleures capacités, des vitesses supérieures et une meilleure gestion de l’énergie.

Plusieurs innovations techniques sont explorées pour répondre aux besoins de stockage de l’infrastructure IA :

  • L’augmentation de la densité surfacique. Les améliorations apportées aux têtes et aux disques permettent d’obtenir une plus grande capacité de stockage pour un même format. Les disques durs Mozaic de Seagate constituent les solutions de stockage les plus efficaces au monde, capables de réduire les coûts d’acquisition et d’exploitation tout en augmentant la productivité. Grâce à la densité surfacique accrue des disques Mozaic, les clients peuvent stocker davantage de données sans augmenter leur consommation d’espace, d’énergie ou de ressources naturelles. Mozaic 3+ aide également les clients à atteindre leurs objectifs de durabilité, une priorité absolue pour les grands centres de données, en offrant une réduction de 55 % du carbone incorporé par téraoctet3.
  • Les disques à actionneur double. Ces disques offrent de meilleures performances grâce à leurs deux actionneurs capables de réaliser simultanément des tâches de lecture et d’écriture. Cette caractéristique peut considérablement améliorer le débit de transfert, et ainsi faciliter la gestion des gros volumes de données générés par les applications d’IA.
  • Les disques durs NVMe. La technologie NVMe (Non-Volatile Memory Express) offre un accès aux données plus rapide que les interfaces SATA (Serial Advanced Technology Attachment) ou SAS (Serial-Attached SCSI [petite interface système informatique]) traditionnelles. En adoptant des disques durs NVMe, les centres de données obtiennent de meilleures performances et une latence plus faible, un avantage essentiel pour les charges de travail liées à l’intelligence artificielle.
  • Les interconnexions optiques. Avec l’augmentation des taux de transfert, les interconnexions traditionnelles en cuivre peuvent ralentir considérablement la circulation des données. Les interconnexions optiques offrent une bande passante supérieure et une latence plus faible, pour une circulation des données plus rapide entre les périphériques de stockage et les unités de traitement.
  • Les solutions de stockage à faible consommation d’énergie. Face à la demande croissante en énergie des infrastructures IA, les solutions de stockage doivent être plus économes en énergie. Cela implique de développer des disques consommant moins d’énergie tout en garantissant de hautes performances, et d’explorer de nouvelles technologies de refroidissement pour gérer la chaleur générée lors des déploiements à grande échelle.

L’évolution des besoins de stockage IA.

Les besoins en stockage pour l’infrastructure IA évoluent rapidement, en raison de la croissance exponentielle des données et de la complexité croissante des modèles d’IA. À l’avenir, il sera essentiel de créer des solutions de stockage capables de suivre la cadence pour que les systèmes d’IA puissent poursuivre leur évolution et tenir leurs promesses : transformer les secteurs et changer des vies.

 


 

  1.  Cellular IoT Connectivity Series: Smart Cities Opportunities & Forecasts, Kaleido Intelligence, 2023, https://kaleidointelligence.com/smart-cities-2027/
  2. Generative AI to Become a $1.3 Trillion Market by 2032, Research Finds (Une étude prévoit une croissance du marché de l’IA génératrice susceptible d’atteindre 1,3 billion de dollars d’ici 2032), Bloomberg Intelligence, 2023, https://www.bloomberg.com/company/press/generative-ai-to-become-a-1-3-trillion-market-by-2032-research-finds/
  3. Disque Mozaic 3+ de 30 To comparé à un disque PMR conventionnel de 16 To. Le carbone incorporé comprend les émissions générées lors de l’extraction des matières premières, de la fabrication/de l’assemblage des produits et du transport des matériaux de l’extraction à la fabrication et de la fabrication aux clients.
Praveen Viraraghavan bio photo

Praveen Viraraghavan

Praveen Viraraghavan is a Technologist in the Products and Markets organization at Seagate Technology.