Perspective

13 okt., 2025

AI

Hoe kunnen bedrijven zich voorbereiden om het meeste uit hun AI-investeringen te halen?

Perspective

hoe-moeten-ondernemingen-zich-voorbereiden-om-het-maximale-uit-hun-AI-investeringen-te-halen?-thumbnail-1440x900

AI kan geen succes worden zonder gegevens. Massaal veel gegevens.

En die enorme gegevenssets zijn alleen mogelijk als er ruime, efficiënte gegevensopslag beschikbaar is.

Gegevens zijn de grondslag van AI en harde schijven met grote opslagcapaciteit zijn de grondslag voor gegevens.

Deze inzichten worden duidelijk in beeld gebracht door een onderzoek uit 2025 van het onderzoeksbureau Recon Analytics.

Voor het wereldwijde onderzoek dat in opdracht van Seagate werd uitgevoerd, werden 1.062 respondenten ondervraagd. Dat waren inkopers van IT-opslag en besluitvormers die functies bekleden die gerelateerd zijn aan de opslaginfrastructuur van bedrijven met een jaaromzet van meer dan $10 miljoen, die momenteel meer dan 50 TB opslagcapaciteit in gebruik hebben, die AI hebben geïmplementeerd of van plan zijn dit binnen de komende 3 jaar te doen, en die gevestigd zijn in de Verenigde Staten, China, het Verenigd Koninkrijk, Zuid-Korea, Singapore, Frankrijk, India, Japan, Taiwan en Duitsland.

De enquête richtte zich op de effecten van de invoering van AI op infrastructuurprioriteiten, gegevensbewaring en -beheer. De resultaten werpen licht op de manier waarop AI de komende drie jaar van invloed zal zijn op de infrastructuurbehoeften.

Bevindingen van de enquête.

Eerst en vooral toonde het onderzoek aan dat AI de drijvende kracht is achter de exponentiële groei in de vraag naar gegevensopslag tot 2028.

  • Maar liefst 61% van de respondenten van bedrijven die voornamelijk cloudopslag gebruiken, gaf aan dat de cloudgebaseerde opslag van hun bedrijf met meer dan 100% zou moeten toenemen (en dus de komende drie jaar zou moeten verdubbelen).

Afbeelding 1. 61 procent van de respondenten van wie de bedrijven voornamelijk cloudopslag gebruiken voor hun AI-gegevensbeheer, verwacht dat hun opslagvereisten met 100% of meer zullen toenemen.

AI genereert een ongeziene hoeveelheid gegevens. En hoe meer gegevens organisaties opslaan, hoe meer ze kunnen valideren dat AI handelt zoals verwacht. Met toegang tot gedragsgegevens, zoals gegevenssets van trainingen, modelcontrolepunten, prompts en antwoorden, kunnen bedrijven algoritmen nauwkeurig onderzoeken en de besluitvorming van AI beter begrijpen en verfijnen. Zonder de schaal en efficiëntie van datacenters zou het potentieel van AI beperkt zijn, omdat het vermogen om enorme gegevenssets op te slaan en op te vragen essentieel is voor het succes van AI. 

Het is niet alleen de hoeveelheid opslag die bepalend is om geslaagde AI-resultaten te behalen. De duur van de gegevensopslag is ook van belang.

  • Van de respondenten die werkzaam zijn bij bedrijven die AI-technologie hebben geïmplementeerd, is 90% ervan overtuigd dat de kwaliteit van AI-resultaten verbetert door gegevens langer te bewaren.

Afbeelding 2. 90 procent van de bedrijven die tegenwoordig AI gebruiken, gelooft dat het behoud van meer historische gegevens de nauwkeurigheid van het model verbetert.

Deze bevinding wijst op een verband tussen het langere behoud van gegevens en betrouwbaardere AI-inzichten. Verschillende factoren kunnen hieraan ten grondslag liggen. Ten eerste is constante iteratieve verwerking inherent aan hoe AI-algoritmen werken. De output van de content wordt teruggekoppeld naar het model, waardoor de nauwkeurigheid ervan verbetert en nieuwe modellen mogelijk worden. Sets van onbewerkte gegevens en resultaten worden bronnen voor verdere ontwikkeling en nieuwe workflows.

Maar het langere behoud van gegevenssets dient ook andere bedrijfskritieke functies: het beschermt de intellectuele eigendom van een bedrijf. Zo worden 'ontvangstbewijzen' van de oorspronkelijke gegevenssets en processen van het model bijgehouden, die zo nodig resultaten kunnen verklaren (bijvoorbeeld als onderdeel van een juridische procedure). Deze 'ontvangstbewijzen' bepalen de herkomst van gegevens, zodat het traject dat de gegevens afleggen van input naar output duidelijk wordt vastgelegd. Door middel van herkomstbepaling van gegevens kunnen organisaties de herkomst en het gebruik van gegevenssets verifiëren, zodat AI-modellen kunnen vertrouwen op accurate gegevens. Het maakt AI-systemen volledig controleerbaar en ondersteunt zowel de naleving van wet- en regelgeving als interne verantwoordingsplicht.

Daarnaast kunnen bedrijven ervoor kiezen om meer gegevens langer op te slaan, omdat ze beseffen dat ze vandaag nog niet kunnen weten welke nieuwe, waardevolle inzichten de algoritmen van morgen uit de gegevens van gisteren kunnen halen. Door gegevens langer te bewaren, kunnen oude gegevens worden verwerkt door nog niet ontwikkelde AI-modellen. Om die redenen verhoogt het langere behoud van gegevens de bedrijfswaarde die AI kan bieden.

Een verwante bevinding is dat besluitvormers op het gebied van infrastructuur het langere behoud van gegevens essentieel vinden voor het opbouwen van vertrouwen, een essentiële basis waarzonder AI-inzichten weinig waarde hebben.

  • 88% van de respondenten wier bedrijven vandaag AI gebruiken, gelooft dat om AI echt betrouwbaar te maken meer gegevens voor langere tijd moeten worden opgeslagen.

Seagate definieert betrouwbare AI als AI-gegevensworkflows en -modellen die betrouwbare inputs gebruiken en betrouwbare inzichten genereren. Betrouwbare AI is gebaseerd op gegevens die aan de volgende criteria voldoen: 

  • hoge kwaliteit en nauwkeurigheid 
  • duidelijke wettigheid, eigendom en herkomst 
  • veilige opslag en bescherming 
  • verklaarbare en traceerbare transformaties door het algoritme 
  • consistente en betrouwbare output van de gegevensverwerking 

Afbeelding 3. 88 procent van de respondenten wier bedrijven vandaag AI gebruiken, geeft aan dat om AI echt betrouwbaar te maken meer gegevens voor langere tijd moeten worden opgeslagen.

Schaalbare opslaginfrastructuur helpt AI betrouwbaar te maken omdat het de mogelijkheden biedt om enorme hoeveelheden gegevens die door AI-systemen worden gebruikt, juist te beheren, op te slaan en te beveiligen.

  • 80% van de respondenten benadrukte het belang van checkpointing voor het creëren van betrouwbare AI.

Checkpointing is het proces waarbij de toestand van een AI-model wordt opgeslagen op specifieke, korte intervallen tijdens de training van dat model. AI-modellen worden getraind op basis van grote gegevenssets door middel van iteratieve processen die minuten tot maanden kunnen duren. De duur van de training van een model hangt af van de complexiteit van het model, de grootte van de gegevensset en de beschikbare rekenkracht. Tijdens die training worden modellen gevoed met gegevens, worden parameters aangepast en leert het systeem hoe het resultaten kan voorspellen op basis van de informatie die het verwerkt. 

Controlepunten fungeren als momentopnames van de actuele toestand van het model (de gegevens, parameters en instellingen ervan), op vele punten tijdens de training. Aan de hand van die momentopnamen, die elke minuut of om de paar minuten op opslagapparaten worden opgeslagen, kunnen ontwikkelaars de voortgang van het model bijhouden en voorkomen dat waardevol werk verloren gaat bij onverwachte onderbrekingen. 

Volgens het onderzoek bewaren en back-uppen bedrijven die meer dan 100 PB aan opslag gebruiken dagelijks tot wekelijks controlepunten, waarbij 87% ervan die controlepunten opslaat in de cloud of op een combinatie van HDD's en SDD's.

Opslag: de geheime drijvende kracht achter het succes van AI.

Rekenkracht en energieverbruik komen vaak aan bod in gesprekken over de ingebruikname van AI. Het onderzoek van Recon Analytics geeft echter aan dat opslag de belangrijkste drijfveer is. 

  • Vanuit het perspectief van de kopers van infrastructuur kwam gegevensopslag op de tweede plaats als belangrijkste aspect van de AI-infrastructuur, na beveiliging. Beveiliging en opslag werden, in volgorde van belangrijkheid, gevolgd door gegevensbeheer, netwerkopslagcapaciteit, rekenkracht, regelgeving, levensvatbaarheid van LLM's en energieverbruik.
  • Voor twee derde (66%) van de respondenten was opslag de op één na belangrijkste van hun vier determinerende factoren voor AI en de op drie na belangrijkste belemmering voor de ingebruikname van AI.

 Afbeelding 4. 66 procent van de besluitvormers op het gebied van opslaginfrastructuur beschouwde opslag als de op één na belangrijkste van hun vier determinerende factoren voor AI. Ze beschouwden opslag ook als de op drie na belangrijkste belemmering voor de ingebruikname van AI.

Roger Entner, oprichter en hoofdanalist van Recon, beschrijft de conclusie:

"De enquêteresultaten wijzen over het algemeen op een komende stijging in de vraag naar gegevensopslag, waarbij harde schijven als duidelijke winnaar uit de bus komen. Als je bedenkt dat de door ons ondervraagde bedrijfsleiders van plan zijn om steeds meer van deze AI-gestuurde gegevens in de cloud op te slaan, lijkt het erop dat cloudservices goed gepositioneerd zijn om mee te liften op een tweede groeigolf."


Om de meeste waarde uit AI te halen, moeten bedrijven zich voorbereiden met schaalbare, efficiënte gegevensopslag. Of het nu rechtstreeks of via cloudservices is, de afhankelijkheid van AI van gegevens steunt op harde schijven - die een ongeëvenaarde opslagcapaciteit, kostenefficiëntie en duurzaamheid bieden - als de ruggengraat van betrouwbare AI.

 

Verwante onderwerpen:

Innovation Artificial Intelligence