L’évolution des besoins de stockage pour l’infrastructure IA.
03 mars, 2025
Les solutions de stockage IA doivent évoluer pour gérer la croissance exponentielle des données. Des innovations telles que les disques à actionneur double, le stockage NVMe et les solutions à faible consommation d’énergie façonnent l’avenir de l’infrastructure IA.
À mesure que l’intelligence artificielle (IA) continue de s’améliorer, l’infrastructure sur laquelle elle repose doit évoluer pour gérer les demandes croissantes en matière de stockage et de traitement des données. Le stockage des données joue un rôle essentiel dans le cycle de vie d’une infrastructure IA, et les solutions doivent être capables de relever les défis actuels et futurs liés à l’IA.
La quantité de données générées quotidiennement est colossale. Que ce soit pour les villes intelligentes produisant 143 pétaoctets de données par jour, selon un rapport de Kaleido Intelligence1 ou pour les véhicules autonomes qui génèrent plusieurs téraoctets (To) de données, le besoin de solutions de stockage efficaces est plus pressant que jamais. Les constructeurs de véhicules autonomes transfèrent d’énormes quantités de données aux services cloud, qui procèdent ensuite à leur traitement et à leur utilisation pour améliorer les modèles d’intelligence artificielle. Ce flux continu de données nécessite des solutions de stockage robustes capables de gérer la vitesse et le volume requis par les applications d’IA.
Malgré l’importance accordée aux technologies de pointe telles que les processeurs graphiques (GPU), les disques durs restent un composant essentiel de l’infrastructure IA. Ils apportent la capacité de stockage nécessaire pour les gigantesques ensembles de données utilisés pour l’entraînement et l’inférence de l’intelligence artificielle. Les GPU assument la lourde tâche de traiter les données, tandis que les disques durs sont chargés de stocker les données qui alimentent ces processus. Cette relation de dépendance garantit aux systèmes IA un fonctionnement efficace sans se heurter à des limites de stockage.
L’un des plus grands défis d’une infrastructure IA est l’équilibre entre performances et consommation énergétique. À mesure que les clusters de GPU se développent, la consommation nécessaire à leur exécution augmente considérablement. Par exemple, les déploiements à grande échelle, tels que ceux réalisés par les leaders de l’IA, nécessitent des milliers de processeurs graphiques, chacun d’entre eux consommant énormément d’énergie. Ainsi, ce type d’application crée un besoin de solutions de stockage à la fois hautement performantes et peu énergivores. Pour donner un ordre de grandeur, un seul processeur graphique peut consommer jusqu’à 700 watts, et des déploiements à grande échelle peuvent impliquer jusqu’à 100 000 processeurs graphiques, engendrant une consommation d’énergie de 70 mégawatts. Cela équivaut à la consommation totale d’énergie d’un grand centre de données. Par conséquent, si elles veulent suivre la cadence des processeurs graphiques, les solutions de stockage doivent être conçues pour minimiser la consommation d’énergie tout en optimisant les performances.
L’entraînement de l’IA nécessite la création de points de contrôle pour éviter une perte de progression en cas de défaillance du système. Ces points de contrôle enregistrent l’état du modèle IA à intervalles réguliers (par exemple, de l’ordre de quelques minutes), afin de permettre au processus d’apprentissage de reprendre au niveau du dernier enregistrement plutôt que du début. Ceci est particulièrement important pour les entraînements longs, qui peuvent s’étendre sur des semaines, voire des mois. L’efficacité des points de contrôle repose sur la rapidité des solutions de stockage, qui doivent être capables de sauvegarder et de récupérer rapidement de grandes quantités de données.
Par exemple, certaines grandes plates-formes d’entraînement réalisent des points de contrôle toutes les minutes pendant l’entraînement. Elles enregistrent d’abord les données sur des SSD avant de les transférer sur des disques durs. Ce processus garantit que, même en cas de défaillance, l’entraînement peut reprendre avec une perte de données minimale. Ces points de contrôle peuvent atteindre des tailles conséquentes, jusqu’à 12 To dans certains cas.
Les disques durs sont essentiels pour stocker les points de contrôle des entraînements d’IA en raison de leur évolutivité, leur rentabilité, leur efficacité énergétique, leur durabilité et leur longévité.
À l’avenir, la demande en stockage pour l’IA devrait croître de manière exponentielle. Selon des données de Bloomberg Intelligence, IDC, eMarketer et Statista2, d’ici 2032, le marché du stockage IA devrait atteindre 92 milliards de dollars. Cet essor est encouragé par la complexité croissante des modèles d’IA et l’expansion de l’utilisation de l’IA dans divers secteurs. Pour répondre à cette demande, les solutions de stockage doivent se perfectionner pour offrir de meilleures capacités, des vitesses supérieures et une meilleure gestion de l’énergie.
Plusieurs innovations techniques sont explorées pour répondre aux besoins de stockage de l’infrastructure IA :
Les besoins en stockage pour l’infrastructure IA évoluent rapidement, en raison de la croissance exponentielle des données et de la complexité croissante des modèles d’IA. À l’avenir, il sera essentiel de créer des solutions de stockage capables de suivre la cadence pour que les systèmes d’IA puissent poursuivre leur évolution et tenir leurs promesses : transformer les secteurs et changer des vies.
Praveen Viraraghavan
Praveen Viraraghavan is a Technologist in the Products and Markets organization at Seagate Technology.