Perspective

17 mei, 2024

GEGEVENSARCHITECTUUR 

Drie waarheden over harde schijven en SSD's

Perspective

Detailopname van een schijf die boven een computerscherm met groene lampjes is geplaatst.

"Harde schijven behoren binnenkort tot het verleden."

"All-flash arrays vervangen binnenkort schijven en hybride arrays in het datacenter."

"Het datacenter van de toekomst is all-flash."

Welkom bij de nieuwste aflevering van de eeuwige saga over het einde van de harde schijf. Het debat - met bekende uitspraken zoals hierboven - duurt nu al meer dan tien jaar. De voorspellingen over de ondergang van de harde schijf, rondgebazuind door een aantal, zullen we maar zeggen, optimistische voorstanders van flash-onlytechnologie, hebben de tand des tijds niet bepaald goed doorstaan. Met de tijd lijken ze zelfs eerder steeds driester te worden. 

Flashopslag is zonder twijfel zeer geschikt voor toepassingen die hoge prestaties en snelheid vereisen. En de flashgebaseerde omzet is inderdaad aan het stijgen, net als de omzet uit all-flash-arrays (AFA). Maar niet ten koste van harde schijven. De onderliggende gedachte achter de speculaties over het einde van de harde schijf is gehuld in heel wat onjuistheden.

We leven in een tijdperk waarin de alomtegenwoordigheid van de cloud en de opkomst van AI-gebaseerde gebruikssituaties de waarde van enorme gegevenssets de hoogte in hebben gestuwd. Harde schijven, waarop vandaag wereldwijd verreweg de meeste exabytes (EB) worden opgeslagen, zijn voor beheerders van datacenters onmisbaarder dan ooit.

Ook de afgelopen jaren, waarin de prijzen van flash tijdelijk tot een historisch dieptepunt daalden, hebben SSD's (solid-state-schijven) harde schijven niet verdrongen voor werkbelastingen die de opslag van enorme hoeveelheden gegevens vereisen.

Sectoranalisten verwachten dat harde schijven het meest zullen profiteren van de gestage toename van gegevens op EB-schaal. De grafiek hieronder laat zien dat bedrijfs- en grootschalige cloud-datacenters - waar de overgrote meerderheid van alle datasets ter wereld zich bevindt - een belangrijke drijvende kracht zullen zijn achter deze groei in geïnstalleerde capaciteit. Volgens de voorspellingen van de sector zal de totale opslag in bedrijven tussen 2023 en 2028 naar verwachting met 8.528 EB groeien en in 2028 14 zettabytes (ZB) bereiken. Van die groei zal opslag op harde schijven naar verwachting met 440 EB groeien, SSD's met 166 EB en tape met 921 EB.¹ Deze cijfers weerspiegelen absolute capaciteitstoevoegingen in alle gebruikssituaties van ondernemingen.

De onderstaande grafiek richt zich op samengestelde jaarlijkse groeipercentages (CAGR's) en het totale geïnstalleerde bestand per mediatype, in plaats van op deze ruwe EB-deltas. Een goed voorbeeld: de opslag van harde schijven zal naar verwachting groeien met 440EB tussen 2023 en 2028, wat neerkomt op een CAGR van ongeveer 25% over die periode van vijf jaar.² Deze CAGR van 25%, weergegeven in het groene segment van de grafiek, vertegenwoordigt de groei in geïnstalleerde basis, die stijgt van 4,1ZB in 2023 tot meer dan 10,5ZB in 2028. Het cijfer 440EB verwijst specifiek naar de nieuwe capaciteit die jaarlijks wordt toegevoegd, wat bijdraagt aan deze algemene uitbreiding van de totale geïnstalleerde basis.

Staafdiagram geeft de voorspelling weer van de groeipercentages van zakelijke zettabyte-opslag uitgesplitst per type opslagmedium.
Staafdiagram met prognose van groeipercentages van zakelijke zettabyte-opslag uitgesplitst per jaar, en cloud- en niet-cloudgegevens.

Het is geen nulsomspel. In datacenters hebben harde schijven en flash altijd in synergie gewerkt, ter ondersteuning van verschillende diensten. Ze hebben elk hun eigen unieke voordelen en waardepropositie. Sterker nog, in het tijdperk van generatieve AI zullen rekenclusters die nauw verbonden zijn met flashtechnologie indirect de stroomafwaartse behoefte aan harde schijven met meer exabytes versterken, omdat de gegenereerde content voordelig moet worden opgeslagen.

Deze synergie van opslagmedia is springlevend terwijl de veronderstellingen over de achterhaaldheid van harde schijven niet geloofwaardig zijn en uiteindelijk niet zullen uitkomen. 

Laten we eens wat dieper ingaan op drie grote mythes die aan deze veronderstelling ten grondslag liggen en de gegevensgestuurde redenen van derden waarom harde schijven in de nabije toekomst een centrale rol zullen blijven spelen in gegevensopslagarchitecturen.

Waarheid #1: Prijsverschil

Mythe: SSD's zullen binnenkort evenveel kosten als harde schijven.
Werkelijkheid: de prijzen van SSD's en harde schijven zullen in het komende decennium op geen enkel moment samenvallen.

De redenen zijn duidelijk. Harde schijven zijn per terabyte (TB) een stuk voordeliger dan SSD's, waardoor ze de onbetwistbare hoeksteen zijn van de opslaginfrastructuur van datacenters. 

Hoewel de prijzen van NAND-flashgeheugenopslag zeer volatiel blijven en in 2023 een dieptepunt bereikten vanwege de zwakke vraag en het overaanbod, voorspelde analistenbureau Forward Insights een prijsheropleving voor SSD's vanaf 2024 tot 2025, en deze voorspelling is uitgekomen. Terugblikkend op de steile prijsdalingen zullen SSD-leveranciers die ommekeer verwelkomen, nadat ze eerst moeite hadden met het afbouwen van hun voorraad verouderende producten en het verlagen van kapitaaluitgaven om het aanbod af te stemmen op de vraag. Daarom zien we nu al prijsstijgingen voor NAND-gebaseerde oplossingen. 

Zelfs als de kosten per TB van zowel SSD's als harde schijven tot minstens 2027 blijven dalen, bevestigt Seagate's analyse van onderzoek door IDC, TRENDFOCUS en Forward Insights dat harde schijven de meest kosteneffectieve optie blijven voor de meeste zakelijke taken. Het prijs-per-TB-verschil tussen SSD's voor zakelijk gebruik en harde schijven voor zakelijk gebruik zal naar verwachting minstens tot 2027 7:1 bedragen. 

Staafdiagram toont het verschil in bedrijfskosten per terabyte tussen SSD's en harde schijven.

Dit verschil in prijs per TB is vooral duidelijk in het datacenter, waar de aankoopkosten van apparaten veruit het grootste deel van de totale eigendomskosten (TCO) uitmaken. Wanneer alle kosten van het opslagsysteem in beschouwing worden genomen, inclusief de aankoop van apparatuur, stroom, netwerken en computerkosten, leveren systemen die met harde schijven zijn uitgerust per TB een veel betere TCO op.

Grafiek met geschatte totale eigendomskosten voor opslag in datacentra voor SSD's en harde schijven.

Om deze onbetwistbare TCO- en prijsverschillen te omzeilen, zijn sommige OEM's van AFA begonnen met het ontwerpen van hun eigen aangepaste NAND-apparaten met hoge dichtheid en een capaciteit die in de honderden TB's loopt, waarbij ze theoretische TCO-voordelen claimen die verder gaan dan de economische aspecten van apparaten tot het systeemniveau. Het probleem met deze logica is dat het toevoegen van veel hogere niveaus van NAND-dichtheid aan één apparaat of systeem nog steeds niets verandert aan het grote verschil in kosten per TB van de onbewerkte media.

Een andere tactiek die wordt aangewend om de aandacht af te leiden van het kosten-per-TB-nadeel heeft te maken met de zogeheten 'effectieve terabytes' (Terabytes Effective, TBe). Er wordt beweerd dat dankzij technieken voor gegevensreductie (bijv. gegevenscompressie) een SSD aanzienlijk meer opslagcapaciteit kan bieden dan zijn onbewerkte capaciteit impliceert. Bij grote implementaties vindt gegevensreductie echter hoger in de stack plaats, waardoor dit irrelevant wordt op het opslagniveau. Bovendien is gegevenscompressie, gezien de toegenomen aandacht voor de bescherming van gegevens en de prevalentie van versleuteling, vaak niet haalbaar in de meeste gebruikssituaties van bedrijven en clouds. Als gegevens versleuteld zijn, kunnen ze niet gecomprimeerd worden omdat de entropie ervan zo hoog is dat er geen patroon is om te vereenvoudigen.

Conclusie: hoewel flash zeer sterk is in het uitvoeren van specifieke en veeleisende taken, zullen harde schijven de primaire bestemming blijven voor exabytes in datacenters, omdat ze een betrouwbare, rendabele en zeer gangbare oplossing bieden voor de nabije toekomst.

Waarheid #2: Productieschaal

Mythe: het aanbod van NAND kan worden opgevoerd om alle capaciteit van harde schijven te vervangen.
Werkelijkheid: harde schijven volledig vervangen door NAND zou onhoudbare kapitaalinvesteringen vereisen.

Het idee dat de NAND-industrie haar beschikbare voorraad om alle capaciteit van harde schijven te vervangen snel zou kunnen of willen vergroten, is niet alleen optimistisch, maar een dergelijke poging zou leiden tot een financieel fiasco. Bij de overstap van harde schijf naar NAND draait het niet alleen om het produceren van meer eenheden. Het is financieel en logistiek een titanenwerk om uit te voeren, laat staan tegen een prijs die kan concurreren met die van harde schijven.

Volgens het rapport Q4 2024 NAND Market Monitor van industrie-analist Yole Intelligence, zal de gehele NAND-industrie tussen 2015 en 2024 3,9 ZB verschepen, terwijl ze een duizelingwekkende groei van 223 miljard dollar in CapEx moeten investeren - ongeveer 43% van hun gecombineerde inkomsten.

Daarentegen voorziet de hardeschijfsector in de overgrote meerderheid (ongeveer 87%) van de opslagbehoeften van datacenters op een zeer kapitaalefficiënte manier. Laten we, om dit te verduidelijken, Seagate Technology gebruiken als een indicator voor de hardeschijfsector. Van 2015 tot 2024 verkocht Seagate 4 ZB aan opslag. De kapitaalinvesteringen van Seagate bedroegen in die periode van negen jaar in totaal 4,5 miljard dollar, of slechts ongeveer 4,9% van de totale inkomsten van Seagate uit harde schijven. Dit komt neer op ongeveer 57 miljard dollar per ZB voor de NAND-industrie tegenover ongeveer 1.1 miljard dollar per ZB voor de productie van harde schijven (zoals vertegenwoordigd door Seagate). De hardeschijfsector is veel efficiënter in het leveren van zettabytes aan het datacenter. Seagate’s analyse van prognoses van IDC voor harde schijven en die van Forward Insights voor SSD's tonen aan dat in 2025 de productie van harde schijven op exabyteschaal bijna 2,5 keer zo groot zal zijn als die van SSD's. In datzelfde jaar zal de productie van harde schijven op exabyteschaal op de markt voor bedrijven en datacenters vier keer zo hoog zijn als die van SSD's.

Als we kijken naar de opslagapparaten van enterprisekwaliteit, blijven harde schijven ongeëvenaard op het gebied van kostenefficiëntie, schaalbaarheid en duurzaamheid. Vergeleken met SSD's en DRAM leveren harde schijven de laagste kosten per gigabyte, verzenden ze het grootste volume exabytes en vereisen ze de laagste CapEx-intensiteit als percentage van de omzet. Ze bieden ook de laagste koolstofvoetafdruk per TB, wat hun rol als de meest efficiënte en duurzame keuze voor opslag op schaal versterkt.

Zie de vergelijking hieronder voor drie belangrijke dimensies - kosten, schaal en efficiëntie - gemiddeld van CY2020 tot CY2024. De hardeschijfsector is veel efficiënter in het leveren van zettabytes aan het datacenter.

De tabel vergelijkt de NAND-industrie en Seagate op het gebied van CapEx-investeringen, verzonden zettabytes en CapEx-efficiëntie, waarbij Seagate als beste uit de bus komt.
De tabel vergelijkt de gemiddelde efficiëntie van bedrijfsopslag bij gebruik van DRAM vs. SSD vs. harde schijf.

Onlangs beweerden sommige leveranciers van all-flash-arrays (AFA's) dat de flashsector de volledige productie van hardeschijfcapaciteit zou kunnen vervangen tegen 2028. Laten we eens kijken welke investeringen de NAND-industrie nodig heeft om dit te verwezenlijken.

Volgens interne schattingen van Seagate zouden NAND-leveranciers ruwweg $240 miljard aan extra CapEx moeten investeren om de toekomstige vraag naar harde schijven in bedrijven te vervangen, terwijl harde schijven zelf aan die vraag kunnen voldoen met een investering van slechts ongeveer $1 miljard. De wiskunde spreekt voor zich. Harde schijven blijven een radicaal kapitaalefficiëntere weg naar schaalbaarheid bieden.

De onderstaande grafiek toont de EB-vraag van ondernemingen in 2024 en 2028, en de investeringskloof tussen harde schijven en NAND-technologieën die nodig is om hieraan te voldoen.

Het is duidelijk dat een investering van deze omvang - zo'n $240 miljard - onwaarschijnlijk is voor een industrie met onzekere opbrengsten, vooral na het verliezen van geld in 2023.

Staafdiagram identificeert de verwachte vraag naar exabyte-capaciteit door ondernemingen.

De nieuwste NAND Flash Platinum Datasheet van TrendForce laat zien dat er vanaf 2024 wereldwijd ongeveer 28 NAND-fabrieken (fabs) in bedrijf zijn. Als we Kioxia's Fab7 Phase 1, geopend in oktober 2022, als voorbeeld nemen, kost de bouw van één volledig nieuwe NAND-fabriek ongeveer 6,8 miljard dollar. De extra kapitaaluitgaven van 240 miljard dollar die de NAND-industrie nodig heeft, zouden dus ongeveer gelijk zijn aan 35 nieuwe fabs. Deze investering is voornamelijk gericht op datacentertoepassingen voor bedrijven.

Hoewel de $240 miljard aan extra investeringen alleen al nodig is om de toekomstige capaciteit van harde schijven voor bedrijven te evenaren, is het belangrijk om op te merken dat NAND-fabrieken veel meer dan alleen de SSD-markt voor bedrijven bedienen. Volgens de Q4 2024 NAND Market Monitor van Yole Intelligence zal de industrie naar verwachting meer dan 74 miljard dollar investeren om 1,1 ZB van de totale NAND-productie op alle markten te produceren.

Wanneer rekening wordt gehouden met deze bredere productievraag - inclusief telefoons, tablets en andere apparaten - zal de totale behoefte aan NAND-investeringen oplopen tot naar schatting $ 414 miljard, oftewel ongeveer 50 nieuwe fabrieken. Dat is meer dan 15 keer de verwachte omzet van de hele industrie van harde schijven in 2028 - volgens IDC geschat op ongeveer 22 miljard dollar. Dit benadrukt een belangrijk contrast: de productie van harde schijven is bijna volledig gericht op opslag op bedrijfsschaal, terwijl NAND-fabrieken vele markten moeten bedienen en hun investeringen moeten spreiden over gefragmenteerde en niet-verwisselbare gebruikssituaties.

Deze faciliteiten zouden in de komende drie tot vier jaar gebouwd, opgeschaald, getest, gekwalificeerd en online gebracht moeten worden voor volledige productie, waardoor het aantal NAND-fabrieken wereldwijd in minder dan vier jaar meer dan verdubbeld zou worden.

Daarnaast laat het 2024 StorageSphere-rapport4 van IDC zien dat in 2024 de verhouding tussen de bestaande geïnstalleerde capaciteit van harde schijven en SSD's in cloud- en niet-clouddatacenters 7:1 was. IDC voorspelt dat deze dominante verhouding van op harde schijven gebaseerde EB's in de nabije toekomst ongeveer zes tot zeven keer zo groot zal blijven, met een samengestelde jaarlijkse groei (compound annual growth rate, CAGR) van 21%, wat zal leiden tot een geïnstalleerde harde schijfcapaciteit van maar liefst 10,5 ZB in 2028. Naast het vervangen van alle toekomstige jaarlijkse productie van nieuwe harde schijfinstallaties, zoals eerder beschreven, zou de NAND-industrie dus ook moeten investeren om het verouderende deel van deze 10,5ZB aan geïnstalleerde harde schijven van datacenters te vervangen wanneer deze het einde van hun levenscyclus bereiken - een extra investering die veel hoger is dan de $ 414 miljard die alleen al nodig is om de 2,4ZB aan harde schijfcapaciteit te vervangen die naar verwachting in 2028 voor ondernemingen zal worden geleverd.

NAND-oplossingen zijn efficiënt voor specifieke werkbelastingen in datacenters, maar het idee dat datacenters er volledig op zullen vertrouwen zit vol valkuilen. Naast de risico's en de onwaarschijnlijkheid dat de NAND-industrie de levering van harde schijven zou vervangen, voegen de prijsschommelingen nog extra onzekerheid toe voor bedrijven die op zoek zijn naar de beste TCO voor hun opslag en stabiliteit in het aanbod ervan.

Het idee dat NAND harde schijven binnen afzienbare tijd volledig kan vervangen is hoogst onwaarschijnlijk, zo niet onmogelijk. De industrie zou enorme financiële en logistieke obstakels moeten overwinnen en tegelijk heel wat kapitaal en technologie moeten investeren in een markt die niet is voorbereid op een verandering die de huidige architectuur van datacenters op zijn kop zou zetten.

Waarheid #3: Werklastingprofielen

Mythe: alleen AFA's kunnen voldoen aan de prestatievereisten van de huidige werkbelastingen in bedrijven.
Werkelijkheid: voor zakelijke opslagarchitectuur worden doorgaans verschillende soorten media gecombineerd, door gebruik van schijfarrays of hybride arrays, flash en tape, om optimaal voorbereid te zijn op de kosten, opslagcapaciteit en prestatiebehoeften van specifieke werkbelastingen.

Het gaat hier om een valse dichotomie. Leveranciers van all-flash opslag adviseren bedrijven om 'te vereenvoudigen' en 'toekomstbestendig' te zijn door volledig in te zetten op flash, voor hoge prestaties. Anders, zo stellen ze, lopen bedrijven het risico dat ze geen gelijke tred kunnen houden met de prestatievereisten van de huidige werkbelastingen. Die nulsomredenering is krom om drie redenen:

  1. Voor veruit de meeste van de huidige werkbelastingen is het prestatievoordeel van flash niet nodig.
  2. Bedrijven met budgettaire beperkingen en snel groeiende gegevenssets moeten een evenwicht vinden tussen capaciteit, kosten en prestaties.
  3. De vermeende eenvoud van een enkelvoudige opslagarchitectuur is een oplossing die om problemen vraagt.

Laten we die redenen eens een voor een bekijken.

Op de eerste plaats bevinden de meeste gegevens zich in de cloud en in grote datacenters. In die omgevingen volgen werkbelastingen een regel die vergelijkbaar is met het Pareto-principe: voor slechts een klein percentage van de werkbelasting is een groot percentage van de prestaties vereist. Hyperscale implementatietrends zijn een leidende indicator voor opslagarchitectuur op schaal. Volgens IDC⁵ zijn harde schijven van 2019 tot 2023 goed voor ongeveer 87% van de exabytes die worden verscheept naar cloud service providers en hyperscale datacenters.

De meeste gegevens in de wereld maken deel uit van werkbelastingen die een nominale gegevensoverdrachttijd nodig hebben voor algemeen gebruik. Bekijk de onderstaande grafiek, afkomstig uit het Cloud Infrastructure Index 2025-onderzoek van IDC.

Illustratie toont bedrijfsworkloads in kaart gebracht naar opgeslagen exabytes, met vermelding van capaciteits- en gegevensoverdrachtsniveaus.

In sommige gevallen zijn all-flash systemen zelfs helemaal niet vereist als onderdeel van de krachtigste oplossingen. Er zijn hybride opslagsystemen die net zo goed of sneller presteren dan all-flash-schijven. Op apparaatniveau zijn de verschillen in prestaties duidelijk; op schaal in datacenterracks profiteren de hardeschijfprestaties echter van extreem parallelle toegang, wat resulteert in een prestatieniveau dat ruim volstaat voor de meeste werkbelastingen, inclusief AI en machine learning. Net zo belangrijk is dat de sterk toenemende prestatievoordelen die flash biedt, vaak kunnen worden beperkt door andere infrastructuurbeslissingen, zoals netwerkcapaciteit of -kwaliteit.

Ten tweede, zoals eerder in dit artikel is vastgesteld, spelen TCO-overwegingen een grote rol bij de meeste beslissingen over de infrastructuur van datacenters. Dit dwingt ertoe een evenwicht te vinden tussen kosten, capaciteit en prestaties. Optimale TCO wordt bereikt door het meest rendabele medium (harde schijf, flash of tape) af te stemmen op de vereiste werkbelasting. Harde schijven en hybride arrays (samengesteld uit harde schijven en SSD's) passen uitstekend bij de meeste gebruikssituaties voor bedrijven en cloudopslag en andere toepassingen.

Uiteraard kan er voor SSD's of AFA's worden gekozen voor werkbelastingen die het meest geschikt zijn voor harde schijven, zoals bestandservices, objectopslag, documentbeheersystemen of webhosting. Maar vanuit kostenoogpunt zou een dergelijke beslissing vreemd genoeg onlogischer zijn naarmate de capaciteit hoger is. Net zo wanneer je je auto, geparkeerd in een garage, zou gebruiken om je kleren in op te bergen. Haalbaar? Zeker, als het dat is wat je met een auto wilt doen. Maar rendabel? Zeker niet.

Hoewel flashopslag ideaal is voor leesintensieve scenario's, neemt het uithoudingsvermogen ervan af naarmate er meer wordt geschreven. Fabrikanten pakken dit aan met foutcorrectie en overprovisioning - extra, onzichtbare opslag om versleten cellen te vervangen. Die oplossingen brengen echter extra kosten met zich mee: Overprovisioning verhoogt de kosten van het ingebedde product aanzienlijk, en er is constant vermogen nodig om gegevensverlies te voorkomen. Dit vormt een uitdaging voor omgevingen zoals edge datacenters, of elke andere omgeving waar continue werking niet gegarandeerd is en versneld wordt bij hoge temperaturen en doorvoer. 

Hoewel flash dankzij technologieën zoals triple-level cell (TLC) en quad-level cell (QLC) gegevensintensieve werkbelastingen kan verwerken zoals harde schijven dat doen, wordt de economische redenering zwakker voor grotere gegevenssets of langdurige bewaring. In die gevallen bieden schijven, met hun toenemende oppervlaktedichtheid, een meer rendabele oplossing. In hyperscale omgevingen kunnen door parallel gebruik te maken van duizenden harde schijven prestaties worden behaald die flash aanvullen (wat hun gezamenlijke rol in moderne datacenters illustreert).

Hoewel QLC-flash dus een aanzienlijk percentage van de TLC-markt overneemt, net zoals TLC de MLC (Multi-level Cell) NAND-opslag verving, wordt het marktaandeel van harde schijven niet aangetast vanwege de factoren kosten, beschikbaarheid en werkbelasting die in dit artikel worden besproken.

In de tabel wordt het probleem genoemd dat flash niet in staat is om de prestaties van harde schijven te evenaren als het gaat om schrijfweerstand.

Het derde en verwante punt is de bewering dat AFA's superieur zijn aan hybride arrays of opslagsystemen met harde schijven. Voorstanders van flash beweren dat het gebruik van één type opslag 'eenvoudiger' is dan het gebruik van een combinatie van verschillende soorten media en opslaglagen. Niet zo snel. 

Veel hybride opslagsystemen maken gebruik van een beproefde en fijn afgestemde softwaregedefinieerde architectuur die de sterke punten van verschillende soorten media naadloos integreert en bundelt in individuele eenheden. In schaalbare datacenterarchitecturen voor de private of openbare cloud, worden bestandssystemen of softwaregedefinieerde opslag gebruikt om de werkbelasting voor gegevensopslag over datacenterlocaties en regio's heen te beheren. Ze bieden meer dan voldoende flexibiliteit, waardoor bedrijven de samenstelling van hun opslag kunnen aanpassen op basis van hun steeds veranderende behoeften.

AFA's en SSD's zijn zeer geschikt voor leesintensieve werkbelastingen die hoge prestaties vereisen. Maar het is een vergissing om vanuit zeer specifieke gebruikssituaties of kleinschalige implementaties een extrapolatie te maken naar de massamarkt en naar hyperscaleniveau waar AFA's een onnodig dure manier bieden om te doen wat harde schijven al aankunnen tegen een veel lagere TCO.

Voor cloud-, hyperscale- en grootzakelijke opslagarchitecturen wordt gekozen voor opslag die de kosten, opslagcapaciteit en prestaties optimaliseert. Harde schijven kunnen werkbelastingen aan die flash-schijven niet zouden moeten uitvoeren. Flash is geschikt voor werkbelastingen waarvoor geen harde schijven zouden mogen worden ingezet. Beide opslagmedia zullen naast elkaar bestaan in het datacenter, maar ook in de nabije toekomst zullen de meeste exabytes op harde schijven worden opgeslagen.

Nu we het toch over exabytes hebben: het is gebruikelijk om te wijzen op de toename van het aantal SSD's in combinatie met de afname van het aantal harde schijven als bewijs van een keerpunt in de opslagmarkt. Maar dit argument is een dwaalspoor, want het gaat voorbij aan de toename van de opslagcapaciteit van harde schijven en het totaal aantal verkochte harde schijven op exabyteschaal, dat sneller dan ooit stijgt. Een goed voorbeeld: dankzij de HAMR-innovatie op het gebied van oppervlaktedichtheid zal het nieuwe Mozaic™-platform van Seagate de maximale capaciteit van eenheden de komende vier jaar verdubbelen, terwijl de traditionele PMR-technologie (Perpendicular Magnetic Recording) negen jaar nodig had om de capaciteit te verdubbelen.

In plaats van volume-eenheden te tellen, gaat het bij het nauwkeurig meten van de groei om het aantal verkochte exabytes. Analisten voorspellen dat het aantal harde schijven op exabyteschaal in een ongekend tempo zal blijven toenemen. En hoewel flashopslag ook zal groeien, zal die groei niet in de buurt komen van die van harde schijven wat geïnstalleerde opslagcapaciteit betreft. 

Seagate-analyse van gegevens van IDC en TRENDFOCUS voorspelt een verdubbeling van de toename van de EB-vooruitzichten voor harde schijven tegen 2028. Als we verder in de tijd extrapoleren, houdt die verhouding tot ver in het volgende decennium stand,

Hoewel de productie van SSD's ook toeneemt, is het belangrijk om te kijken naar wat voor soort SSD's er geproduceerd worden. Zoals de onderstaande grafiek laat zien, wordt de kloof tussen het totale aantal SSD-zendingen en het aantal SSD-zendingen naar bedrijven steeds groter. Dat betekent dat een steeds groter deel van de NAND-productie bestemd is voor consumenten- en niet-bedrijfssegmenten - mobiel, ingebed, randapparatuur - en niet voor SSD's op bedrijfsniveau. Voor klanten die op zakelijke flash vertrouwen, kan dit leiden tot aanhoudende leveringsbeperkingen, zelfs als de totale SSD-productie groeit. De investeringsmix is gewoon niet afgestemd op de typen SSD's die het hardst nodig zijn in het datacenter.

De grafiek geeft de vroegere en verwachte toekomstige zendingen van EB-capaciteit weer.

Conclusie — Hier om te blijven

De vermeende veroudering van harde schijven is al meer dan tien jaar een punt van discussie in de technologie-industrie. Maar de verschillende voorspellingen hebben de tand des tijds niet bepaald goed doorstaan. We verwachten ook niet dat de meest recente ronde zoden aan de dijk zal zetten.

Bijna altijd proberen all-flash absolutisten hun argumenten te onderbouwen met logische denkfouten, waarbij ze vaak extrapoleren van een kleine subset van gebruikssituaties naar een grootschalig niveau, waar hun conclusies niet opgaan.

Het is op zijn best creatieve marketing.

In werkelijkheid: 

  • De prijzen van NAND en harde schijven zullen niet snel samenvallen, zeker niet nu de oppervlaktedichtheid van harde schijven versneld is toegenomen en grotere volumes beschikbaar zijn in het Seagate Mozaic 3+ platform.
  • In tegenstelling tot wat sommigen hebben gesuggereerd, zullen NAND-producenten niet in staat zijn om de productiecapaciteit op te schalen om de bestaande en nieuwe vraag naar harde schijven op exabyteschaal te vervangen. Voor leveranciers van all-flash-arrays is het onmogelijk om zowel voldoende aanbod als goedkopere opslag dan harde schijven aan te bieden vanwege de vereiste investeringen. De AFA-fabrikanten zullen waarschijnlijk geen honderden miljarden dollars vinden om met een verlies van 15:1 te investeren om genoeg NAND te maken om harde schijven te vervangen. 
  • Beheerders van grote clouds en datacenters in bedrijven zijn pragmatisch en begrijpen dat schaalbare opslagarchitecturen een combinatie van media vereisen die geoptimaliseerd zijn om te voldoen aan de budgettaire, capaciteits- en prestatiebehoeften van hun werkbelastingen.

Natuurlijk zijn er nog andere mythes die bijdragen aan de 'creatieve marketing' die de ondergang van harde schijven voorspelt: mythes over onder andere duurzaamheid, stroom en betrouwbaarheid. Blijf ons volgen. We zullen ze in volgende artikelen behandelen. De drie mythen die hierboven zijn besproken, lijken ons echter het meest relevant.

Elke nauwgezet onderzoek van de gegevens in dit artikel leidt tot de conclusie dat harde schijven niet meer weg te denken zijn. Tot ver in de toekomst zal de overgrote meerderheid van alle gegevens ter wereld op harde schijven blijven worden opgeslagen.

Iets anders suggereren is een absolute misvatting.

Voetnoten

  1. IDC, Worldwide Global StorageSphere Forecast, 2024-2028. Doc #US52312824, juni 2024.
  2. IDC, Worldwide Global StorageSphere Forecast, 2024– 2028: An Installed Base and Retired Storage Perspective, Doc #US52312824, juni 2024.
  3. IDC, Worldwide Global StorageSphere Forecast, 2024-2028. Doc #US52312824, juni 2024.
  4. Ibid.
  5. IDC, Multi-Client Study, Cloud Infrastructure Index 2024: Verbruik van compute en opslag door 100 serviceproviders, september 2024.

Verwante onderwerpen:

Cloud Innovation
  1. IDC, Worldwide Global StorageSphere Forecast, 2024-2028. Doc #US52312824, juni 2024.

  2. IDC, Worldwide Global StorageSphere Forecast, 2024– 2028: An Installed Base and Retired Storage Perspective, Doc #US52312824, juni 2024.

  3. IDC, Worldwide Global StorageSphere Forecast, 2024-2028. Doc #US52312824, juni 2024.

  4. Ibid.

  5. IDC, Multi-Client Study, Cloud Infrastructure Index 2024: Verbruik van compute en opslag door 100 serviceproviders, september 2024.