Comment se préparer pour tirer le meilleur parti de ses investissements dans l'IA ?
13 oct., 2025
Sans les données, en masse, l'IA est peu de chose.
Et sans solution de stockage efficace, pas de données non plus.
L’IA dépend des données, qui elles reposent sur les disques durs à capacité élevée.
Ce sont les conclusions qui ressortent d'une enquête réalisée en 2025 par le cabinet d'études Recon Analytics.
Cette enquête mondiale sollicitée par Seagate a porté sur 1 062 répondants. Ces derniers, des acheteurs de solutions de stockage informatique et des décisionnaires, occupent des postes en lien avec l'infrastructure de stockage au sein d'entreprises qui présentent un chiffre d'affaires annuel supérieur à 10 millions de dollars, utilisent plus de 50 To de stockage, ont adopté l'IA ou prévoient de le faire dans les trois années à venir, et sont situées aux États-Unis, en Chine, au Royaume-Uni, en Corée du Sud, à Singapour, en France, en Inde, au Japon, à Taïwan et en Allemagne.
L’enquête s’est concentrée sur les effets de l’adoption de l’IA sur les priorités en matière d’infrastructure, la rétention des données et leur gestion. Les conclusions mettent en lumière l'impact de l'IA sur les besoins en infrastructure des trois prochaines années.
Pour commencer, l'enquête a démontré que l'adoption de l'IA va engendrer une croissance exponentielle de la demande en stockage des données jusqu'en 2028.
Figure 1. 61 % des répondants dont l'entreprise utilise principalement le stockage dans le cloud pour gérer ses données d'IA s'attendent à voir leurs exigences en matière de stockage augmenter d'au moins 100 %.
Les applications d'IA génèrent des quantités de données à des niveaux inégalés. Or, plus ces données seront nombreuses, et plus les organisations pourront valider le bon fonctionnement de l'IA. Grâce aux données comportementales, telles que les ensembles de données d'entraînement, les points de contrôle des modèles, les invites et les réponses, il est possible d'analyser les algorithmes et de mieux comprendre la prise de décision liée à l'IA. Sans l'évolutivité et l'efficacité des centres de données, le potentiel de l'IA resterait limité, car la capacité à stocker et à récupérer des ensembles de données volumineux est indispensable à la réussite de l'IA.
Cette réussite ne repose pas uniquement sur la capacité de stockage. La durée de ce dernier importe également.
Figure 2. 90 % des entreprises qui recourent aujourd’hui à l’IA estiment que la rétention d'un plus grand nombre de données historiques améliore la précision des modèles.
Ce résultat met en évidence un lien entre la durée de rétention des données et la fiabilité des analyses d'IA : plus cette durée est longue, plus les analyses sont fiables. Plusieurs facteurs peuvent expliquer ce phénomène. Tout d'abord, le traitement itératif constant est intrinsèque au fonctionnement des algorithmes d'IA. Les résultats sont réinjectés dans le modèle, ce qui améliore sa précision et permet d'en générer de nouveaux. Les ensembles de données bruts et les résultats sont utilisés en tant que sources pour d'autres développements et de nouveaux flux.
Mais cette durée de rétention des ensembles de données profite aussi à d'autres fonctions critiques de l'entreprise, en protégeant la propriété intellectuelle par exemple. Elle conserve des « reçus » des ensembles de données et des processus d'origine du modèle, fournissant ainsi une explication des résultats lorsque nécessaire (par exemple, dans le cadre d'une procédure judiciaire). Ces « reçus », qui constituent la lignée des données, assurent un enregistrement clair du trajet parcouru par les données, de leur entrée à leur sortie. Avec cette lignée des données, les organisations peuvent vérifier l'origine des ensembles de données et l'utilisation qui en a été faite, et ainsi faire que les modèles d'IA s'appuient sur des données exactes. Elle permet de rendre entièrement vérifiables les systèmes d'IA et contribue à la fois à la conformité réglementaire et à la responsabilité interne.
Les entreprises se rendent compte, par ailleurs, qu'elles n'ont aucun moyen de savoir aujourd'hui quelles informations nouvelles et exploitables les algorithmes de demain sont susceptibles de découvrir à partir des données d'hier. Elles préfèrent donc stocker plus de données et plus longtemps. Une rétention plus longue permet le traitement d'anciennes données par des modèles d'IA non encore développés. Pour toutes ces raisons, une rétention plus longue des données augmente la valeur commerciale de l'IA.
De la même façon, les décideurs chargés de l’infrastructure voient en l’allongement de la rétention des données une nécessité pour établir la confiance. Une base essentielle sans laquelle les analyses d'IA n'ont que peu de valeur.
Pour Seagate, une IA digne de confiance est composée de flux de données et de modèles d'IA qui utilisent des entrées fiables pour générer des informations fiables. Une IA de confiance repose sur des données répondant aux critères suivants :
Figure 3. 88 % des répondants estiment que l'adoption d'une IA fiable implique de stocker davantage de données sur une plus longue période.
L'infrastructure de stockage évolutive favorise une IA digne de confiance, ce qui permet de gérer, de stocker et de sécuriser de façon appropriée les grands volumes de données utilisés par les systèmes d'IA.
La création de points de contrôle consiste à sauvegarder l'état d'un modèle d'IA à de courts intervalles spécifiques au cours de son entraînement. Les modèles d'IA sont entraînés à traiter de vastes ensembles de données par le biais de processus itératifs qui peuvent durer de quelques minutes à plusieurs mois. La durée de l'entraînement d'un modèle dépend de sa complexité, de la taille de l'ensemble de données et de la puissance de calcul disponible. Pendant cette période, les modèles reçoivent des données, les paramètres sont ajustés et le système apprend à prédire des résultats à partir des informations qu'il traite.
Les points de contrôle agissent comme des instantanés de l'état actuel du modèle (données, paramètres et réglages) à de nombreux moments de l'entraînement. Enregistrés sur des périphériques de stockage toutes les minutes, ou toutes les quelques minutes, ces instantanés permettent aux développeurs de garder une trace de la progression du modèle et d'éviter de perdre un travail précieux en cas d'interruptions inattendues.
D'après l'enquête, les entreprises qui stockent plus de 100 Po de données enregistrent et sauvegardent des points de contrôle sur une base quotidienne ou hebdomadaire, 87 % d'entre elles stockant ces points de contrôle dans le cloud ou sur une combinaison de disques durs et de SSD.
Le calcul et l'énergie sont des thèmes récurrents dans les discussions sur l'adoption de l'IA. Toutefois, l’enquête menée par Recon Analytics montre que le stockage joue un rôle déterminant.
Figure 4. 66 % des décisionnaires en matière d'infrastructure ont classé le stockage au deuxième rang des quatre principaux facteurs favorisant l'IA. Ils l'ont également classé au quatrième rang des principaux obstacles au déploiement de l'IA.
Roger Entner, fondateur de Recon Analytics et analyste principal, commente :
« Les résultats de l’enquête indiquent globalement une augmentation à venir de la demande de stockage de données, les disques durs étant les grands gagnants. Si l’on considère que les dirigeants d'entreprise interrogés ont l'intention de stocker de plus en plus de ces données basées sur l'IA dans le cloud, il semble que les services cloud soient bien placés pour surfer sur une deuxième vague de croissance. »
Pour tirer le meilleur parti de l'IA, les entreprises doivent choisir un stockage de données évolutif et efficace. Que ce soit directement ou via les services cloud, la dépendance de l'IA aux données repose sur les disques durs. Offrant une capacité, une rentabilité et une durabilité inégalées, ils constituent la pierre angulaire d'une IA fiable.