De la note de bas de page au gros : Nouvelle priorité accordée aux infrastructures
18 mars, 2026
NVIDIA GTC met en lumière l’architecture d’IA en cinq couches
La conversation sur l’intelligence artificielle passe du calcul et des modèles aux éléments constitutifs, aux couches et aux piles. Autant de façons de décrire les besoins d'une infrastructure d'IA à long terme.
D'après B.S. Teh, directeur commercial de Seagate, « L’IA et les charges de travail axées sur les données ont remis l’infrastructure sur le devant de la scène. »
Pourquoi toute cette attention ? « L’IA ne se contente pas de consommer des données, elle les amplifie », explique-t-il. Cette croissance exponentielle des données « modifie les modèles opérationnels, où les données ne sont plus seulement un atout, mais le fondement de l'intelligence, de l'automatisation et de la différenciation concurrentielle ».
Selon Teh, ces nouveaux modèles reposent sur cinq éléments fondamentaux : stockage de données, calcul/mémoire, réseau, infrastructure et alimentation/refroidissement.
Dans les premiers articles consacrés à l'IA, le stockage des données était à peine mentionné en note de bas de page. Mais avec l'explosion de l'IA générative et vidéo, elle s'est imposée dans les gros titres.
Les disques durs modernes, en particulier, répondent à une question importante que se posent les DSI et les responsables informatiques : Comment l’infrastructure peut‑elle évoluer afin que la croissance des données devienne un atout à long terme, plutôt qu’une contrainte ?
D'un autre point de vue, le PDG de NVIDIA, Jensen Huang, souligne également l'importance de l'infrastructure. « L’IA est en train de devenir l’infrastructure fondamentale du monde moderne », affirme-t-il. Elle s'appuie sur du « vrai matériel, de la vraie énergie et une vraie économie ».
Huang considère l’IA comme une architecture, ou une pile, composée de cinq couches interconnectées : applications, modèles, infrastructures, puces et énergie.
La couche infrastructure comprend le stockage IA, qui, selon lui, pourrait devenir « le plus grand marché de stockage au monde ».
« Cette conférence va couvrir chacune des couches de l’architecture d’IA en cinq couches », a déclaré Huang lors de son discours inaugural à la NVIDIA GTC 2026.
Dans son discours, il a également souligné la valeur fondamentale des données.
Les données structurées, de gigantesques feuilles de calcul contenant toutes les informations de la vie, constituent la « vérité fondamentale de l'IA » et de l'informatique professionnelle.
Les données non structurées, comme les PDF et les vidéos, constituent le « contexte de l'IA ». Croissant de plusieurs centaines de zettaoctets par an, elle représente la grande majorité des données mondiales.
L'IA peut utiliser les deux, non seulement pour entraîner des modèles, mais aussi pour manier des outils, lire des fichiers et effectuer un « travail productif ».
« Nous sommes maintenant au début d'une nouvelle ère de transition », a-t-il déclaré. « Le point d'inflexion de l'inférence est arrivé. »
En ce qui concerne les éléments constitutifs de l'inférence et de l'IA agentique, « l'approche gagnante repose sur des architectures de stockage permanentes à plusieurs niveaux », ajoute Mohamad El-Batal, spécialiste en chef des systèmes chez Seagate.
Une architecture d'IA intelligente utilise chaque niveau pour ce qu'il fait le plus efficacement.