Wie sollten Unternehmen sich darauf vorbereiten, das Beste aus ihren KI-Investitionen herauszuholen?
13 Okt., 2025
Kein KI-Erfolg ohne Daten – haufenweise Daten.
Und ohne ausreichende und effiziente Datenspeicherung gibt es keine riesigen Datensätze.
Daten untermauern KI, und Massenspeicher-Festplatten untermauern Daten.
Eine Umfrage des Marktforschungsunternehmens Recon Analytics aus dem Jahr 2025 bestätigt diese Erkenntnisse.
Bei der von Seagate in Auftrag gegebenen weltweiten Studie wurden 1.062 Personen befragt. Bei ihnen handelt es sich um Einkäufer von IT-Speichern und Entscheidungsträger, die in Funktionen der Speichersystem-Infrastruktur tätig sind. Sie arbeiten für Unternehmen, die einen Jahresumsatz von über 10 Millionen Dollar ausweisen, einen aktuellen Speicherverbrauch von über 50 Terabyte haben, KI bereits eingeführt haben oder planen, dies innerhalb der nächsten drei Jahre zu tun, und ihren Sitz in den Vereinigten Staaten, China, dem Vereinigten Königreich, Südkorea, Singapur, Frankreich, Indien, Japan, Taiwan und Deutschland haben.
Die Umfrage konzentrierte sich auf die Auswirkungen der KI-Einführung auf Infrastrukturprioritäten, Datenaufbewahrung und Datenverwaltung. Die Ergebnisse geben Aufschluss darüber, wie sich KI in den nächsten drei Jahren auf die Anforderungen an die Infrastruktur auswirken wird.
Die Umfrage ergab vor allem, dass die Einführung von KI bis 2028 zu einem exponentiellen Wachstum der Nachfrage nach Datenspeicher führen wird.
Abbildung 1 61 % der Befragten, deren Unternehmen hauptsächlich Cloud-Speicher für ihre KI-Datenverwaltung nutzen, erwarten, dass ihre Speicheranforderungen um 100 % oder mehr steigen werden.
Da KI-Anwendungen eine beispiellose Datenerzeugung antreiben, gilt: je mehr Daten Organisationen speichern, desto besser können sie validieren, ob die KI wie erwartet funktioniert. Mit Zugriff auf Verhaltensdaten – wie Trainingsdatensätze, Modell-Checkpoints, Prompts und Antworten – können Unternehmen Algorithmen untersuchen und die KI-Entscheidungsfindung besser verstehen und verfeinern. Ohne skalierbare und effiziente Rechenzentren ist das Potenzial von KI begrenzt, denn das Speichern und Abrufen großer Datensätze ist unerlässlich für den Erfolg von KI.
Es ist nicht nur die Speichermenge, die den Erfolg von KI ausmacht. Die Dauer der Datenspeicherung ist ebenfalls von Bedeutung.
Abbildung 2: 90 % der Unternehmen, die heute KI nutzen, glauben, dass die Speicherung von mehr historischen Daten die Genauigkeit des Modells verbessert.
Dieses Ergebnis weist auf einen Zusammenhang zwischen der längeren Aufbewahrung von Daten und zuverlässigeren KI-Erkenntnissen hin. Diese Vorgehensweise kann durch mehrere Faktoren untermauert werden. Erstens ist die ständige iterative Verarbeitung wesentlich für die Funktionsweise von KI-Algorithmen. Die Inhaltsausgaben fließen wieder in das Modell ein, was dessen Genauigkeit verbessert und neue Modelle ermöglicht. Rohdatensätze und -ergebnisse werden zu Quellen für Weiterentwicklungen und neue Workflows.
Die längerfristige Aufbewahrung von Datensätzen dient aber auch anderen geschäftskritischen Funktionen: Sie schützt das geistige Eigentum eines Unternehmens. Es bewahrt "Belege" der ursprünglichen Datensätze und Prozesse des Modells auf und liefert bei Bedarf eine Erklärung der Ergebnisse (z. B. im Rahmen eines Rechtsverfahrens). Diese "Belege" legen die Datenherkunft fest und gewährleisten eine klare Aufzeichnung des Weges, den die Daten von der Eingabe bis zur Ausgabe zurücklegen. Durch die Datenherkunft können Unternehmen den Ursprung und die Verwendung von Datensätzen verifizieren, damit KI-Modelle sich auf exakte Daten stützen. Das sorgt dafür, dass KI-Systeme vollständig überprüfbar sind, und unterstützt sowohl die Einhaltung der Vorschriften als auch die interne Rechenschaftspflicht.
Zudem entscheiden sich Unternehmen möglicherweise dafür, größere Datenmengen länger zu speichern, weil sie erkennen, dass sie heute nicht wissen können, welche neuen, wertvollen Erkenntnisse die Algorithmen von morgen aus den Daten von gestern gewinnen könnten. Eine längere Datenaufbewahrung ermöglicht die Verarbeitung alter Daten durch noch nicht ausgereifte KI-Modelle. Aus diesen Gründen steigert eine längere Datenaufbewahrung den Geschäftswert, den KI bieten kann.
In einem ähnlichen Zusammenhang betrachten Entscheidungsträger im Bereich der Infrastruktur die verlängerte Datenaufbewahrung als wesentlich für den Aufbau von Vertrauen, einer kritischen Grundlage, ohne die KI-Erkenntnisse wenig Wert haben.
Seagate definiert vertrauenswürdige KI als KI-Datenworkflows und -modelle, die zuverlässige Eingaben verwenden und zuverlässige Erkenntnisse generieren. Die zugrunde liegenden Daten müssen folgende Kriterien erfüllen:
Abbildung 3. 88 % der Befragten, deren Unternehmen heute KI einsetzen, gaben an, dass die Einführung einer vertrauenswürdigen KI dazu führt, dass mehr Daten über längere Zeiträume gespeichert werden müssen.
Eine skalierbare Speicherinfrastruktur ist ein Baustein für die Schaffung einer vertrauenswürdigen KI, denn damit können große Datenmengen von KI-Systemen korrekt verwaltet, gespeichert und gesichert werden.
Beim Checkpointing wird der Zustand eines KI-Modells während seines Trainings in bestimmten kurzen Intervallen aufgezeichnet. KI-Modelle werden anhand von großen Datensätzen in iterativen Prozessen trainiert, die Minuten bis hin zu Monaten dauern können. Die Dauer des Trainings für ein Modell hängt von der Komplexität des Modells, der Größe des Datensatzes und der verfügbaren Rechenleistung ab. In dieser Phase werden den Modellen Daten zugeführt, Parameter werden angepasst und das System lernt, Ergebnisse auf der Grundlage der verarbeiteten Informationen zu prognostizieren.
Checkpoints dienen an vielen Stellen während des Trainings als Momentaufnahmen des aktuellen Zustands des Modells, also seiner Daten, Parameter und Einstellungen. Die Momentaufnahmen, die im Abstand von einer oder einigen wenigen Minuten auf Speichergeräten gesichert werden, ermöglichen den Entwicklern, den Fortschritt des Modells festzuhalten und zu vermeiden, dass Arbeit durch unerwartete Unterbrechungen verloren geht.
Laut der Umfrage speichern und sichern Unternehmen mit einem Speicher von 100+ PB Checkpoints täglich bis wöchentlich, wobei 87 % von ihnen diese Checkpoints in der Cloud oder in einer Mischung aus HDD und SSD speichern.
Rechenleistung und Energieverbrauch sind beliebte Themen bei Diskussionen über die Einführung von KI. Die Umfrage von Recon Analytics zeigt jedoch, dass der Speicher der entscheidende Faktor ist.
Abbildung 4. 66 % der Entscheidungsträger im Bereich der Infrastruktur nannten Speicher als die zweitwichtigste Komponente unter ihren vier wichtigsten KI-Enablern. Zudem wurde Speicher als viertgrößte Hürde für den Einsatz von KI genannt.
Roger Entner, Gründer und leitender Analyst von Recon, beschreibt dies wie folgt:
„Die Umfrageergebnisse deuten insgesamt auf einen bevorstehenden Anstieg der Nachfrage nach Datenspeicherung hin, wobei Festplatten als klare Gewinner hervorgehen. Wenn man bedenkt, dass die von uns befragten Führungskräfte beabsichtigen, immer mehr dieser KI-gesteuerten Daten in der Cloud zu speichern, scheinen Cloud-Dienste gut positioniert zu sein, diese zweite Entwicklungswelle mitzumachen.“
Um den größtmöglichen Nutzen aus KI zu ziehen, müssen sich Unternehmen mit einer skalierbaren und effizienten Datenspeicherung vorbereiten. Ob direkt oder über Cloud-Dienste, die Abhängigkeit der KI von Daten hängt von Festplatten ab – die unübertroffene Kapazität, Kosteneffizienz und Nachhaltigkeit bieten – als Rückgrat vertrauenswürdiger KI.