Wanneer de schaal prestaties vereist: Hoe een wereldwijde aanbieder van clouddiensten beide behoeften vervult met harde schijven
28 jun., 2025
Terwijl multi-tenancy en vereisten met hoge prestaties de gegevensinfrastructuur hervormen, vindt een van de meest ingrijpende verschuivingen niet alleen plaats in trainingsclusters, maar ook in de systemen die in realtime reageren op miljarden gebruikersinteracties.
Bij een van 's werelds grootste internetgiganten1zijn infrastructuurarchitecten onlangs begonnen met het herontwerpen van een belangrijke werkbelasting die samenhangt met gebruikersbetrokkenheid: de Cache-infrastructuur die commentaren op sociale media ondersteunt (d.w.z. een tijdelijke gegevenslaag die snelle toegang tot vaak opgevraagde inhoud mogelijk maakt). Er stond veel op het spel - grote verkeersvolumes, hoge gelijktijdigheid en een grote vraag naar lezen/schrijven - en dat gold ook voor de noodzaak om de kosten en energie op schaal te verlagen. Het team identificeerde een strategische maar onconventionele oplossing: een cache tier op basis van een harde schijf, gebouwd op Seagate-schijven voor bedrijven met een lage capaciteit.
Sommigen gaan ervan uit dat voor deze laag flash nodig is, maar uit de analyse van de werkbelasting bleek dat harde schijven aan de prestatie-eisen voldoen en tegelijkertijd aanzienlijke kosten- en efficiëntievoordelen bieden, vooral voor inferentie- en data staging-werkbelastingen, die doorgaans meer door kosten, stroom en schaal worden beperkt dan door de ruwe latentie.
Deze architectuur laat zien wat er mogelijk is als infrastructuurbeslissingen worden gebaseerd op het werkelijke gedrag van werkbelasting en hoe harde schijven, mits strategisch gebruikt, wereldwijd krachtige, schaalbare en kostenefficiënte activiteiten mogelijk kunnen maken.
Het doel van de werkbelasting was om snelle, betrouwbare toegang te krijgen tot gegevens over gebruikerscommentaren tijdens virale contentbetrokkenheid - een uitdaging die op schaal al snel complex wordt. Maar het volume en de volatiliteit van de vraag maakten het allesbehalve gewoon.
Wanneer een stuk inhoud viraal gaat, stijgt de betrokkenheid onmiddellijk. Duizenden tot miljoenen gebruikers kunnen een enkele thread binnen enkele minuten overspoelen-ik likken, antwoorden, verversen en opnieuw posten. Het systeem moet een snelle vuurstorm van lezen en schrijven van kleine objecten ondersteunen, met pieken en dan net zo snel weer dalen. En hoewel prestaties belangrijk zijn, bieden ze alleen waarde als systeemknelpunten het mogelijk maken om die prestaties te benutten.
De architecten van het platform moesten ondersteuning bieden:
Traditionele hot/cold tiering was niet effectief voor dit soort dynamische patronen. En hoewel flash aan de prestatiebehoeften kon voldoen, maakten de kosten, de slijtage en het energieprofiel deze flash onhoudbaar op deze laag van de architectuur.
Er wordt vaak aangenomen dat caching-lagen - vooral voor gebruikersgerichte systemen - op flash gebaseerd moeten zijn om aan de prestatiebehoeften te voldoen. Maar in dit geval bleek uit een gedetailleerde analyse van de werkbelasting dat de doorvoer (de snelheid waarmee gegevens per seconde kunnen worden gelezen of geschreven) en de gelijktijdigheid (het vermogen om veel gelijktijdige verzoeken te verwerken) de beperkende factoren waren en niet de microseconde latentie. Harde schijven zijn met hoge prestaties in deze dimensies, en in architecturen op systeemniveau die zijn ontworpen om deze sterke punten te maximaliseren door middel van parallellisme, cachingstrategieën en slimme tiering, kunnen ze beter presteren dan flash-gebaseerde opstellingen voor dezelfde werkbelasting.
Door gebruik te maken van deze combinatie van sterke punten, was de cloudprovider in staat om:
In dergelijke implementaties bieden harde schijven voor bedrijven aanzienlijk lagere aanschafkosten per terabyte - momenteel meer dan 7× minder dan SSD's, volgens de analyse van Seagate van onderzoek door IDC, TRENDFOCUS en Forward Insights. Deze delta kan architecturale keuzes aanzienlijk beïnvloeden, vooral wanneer efficiëntie en duurzaamheid van de Cache een rol spelen.
De uiteindelijke architectuur implementeerde Seagate harde schijven met een lage capaciteit voor bedrijven als een persistente cachinglaag en plaatste deze tussen een primaire toepassingslaag en een cloudlaag op basis van harde schijven met een hoge capaciteit. De configuratie werd gebouwd met behuizingen die het team al in gebruik had voor andere werkbelastingen, waardoor het systeem efficiënt kon worden hergebruikt.
Zo werkt het:
De schijven in het caching-niveau werken meestal met prioriteit voor de buitendiameters van hun schijven voor bruikbare cache-ruimte, waardoor het schrijfgedrag wordt geoptimaliseerd en de effectieve prestaties voor de use case worden gemaximaliseerd.
Dit architectuurdiagram illustreert hoe harde schijf gebaseerde Cache, diepe opslag en toepassingsservices samenwerken om virale gegevensuitbarstingen efficiënt en kosteneffectief af te handelen.
De inzet leverde aanzienlijke verbeteringen op in de totale infrastructuurkosten en energie-efficiëntie, terwijl de hoge prestatie-eisen van de werkbelasting werden ondersteund door schijven die zijn ontworpen voor aanhoudende doorvoer, schrijfduur, beschikbaarheid van gegevens onder druk en inzet op vlootschaal.
De meeste werkbelastingen voor inferentie en gegevensopslag worden meer beperkt door kosten, vermogen en schaal dan door de ruwe latentie, waardoor harde schijven praktisch passen in het juiste architecturale niveau.
Op het moment van publicatie werd deze platformarchitectuur actief ingezet door de klant in de belangrijkste regio's, met voortdurende evaluatie van een bredere uitrol. De eerste indicatoren waren sterk: de prestatiecijfers van Cache bleven stabiel, de gebruikerservaring bleef responsief en de TCO werd verbeterd.
Als de resultaten van de proef blijven aanhouden, kan het platform dit model aanzienlijk uitbreiden, met mogelijke jaarlijkse inzetvolumes van schijven met zes cijfers, als gevolg van de vraag naar meer dan 6EB per jaar en het vertrouwen in harde schijven om prestaties en efficiëntie op vlootschaal te leveren.
Dit is niet slechts een eenmalige optimalisatie, het is een opkomend patroon voor het beter delen van afbeeldingen, microblogs, video en andere inhoud waarbij de gelijktijdigheid en relevantie van de eindgebruiker de infrastructuurvereisten schijven en een betere winstgevendheid van het platform mogelijk maken.
Het succes van dit ontwerp berust niet op een enkele doorbraak, maar op drie kernprincipes die weerklank zullen vinden bij andere bouwers van AI-platformen:
Harde schijven hebben het hier niet "gewonnen" van flash, ze waren gewoon logisch. Zo ziet het eruit om prestaties, kosten en operationele efficiëntie in een echte omgeving op elkaar af te stemmen. In bedrijven en cloudinfrastructuren blijven ze de overgrote meerderheid van werkbelastingen bedienen waarbij doorvoer, efficiëntie en schaal het belangrijkst zijn.
Om aan de prestatiebehoeften te voldoen, hebben moderne werkbelastingen zowel compute als storage nodig die schaalbaar zijn - vooral omdat het succes van modellen afhangt van onmiddellijke, continue relevantie voor de eindgebruiker.
Nu AI en andere moderne werkbelastingen het ontwerp van infrastructuur in verschillende sectoren blijven bepalen, is de vraag niet meer of u harde schijven of flash moet gebruiken. Het gaat erom hoe u systemen bouwt die het gedrag van echte werkbelasting, echte beperkingen en echte mogelijkheden om te optimaliseren weerspiegelen.
Deze toonaangevende wereldwijde aanbieder van clouddiensten bewees dat harde schijven niet alleen relevant zijn, maar ook centraal staan in de manier waarop moderne architecturen evolueren om te schalen, zodat responsieve toegang tot en beschikbaarheid van gegevens zelfs onder piekbelasting wordt gegarandeerd.
Geanonimiseerd volgens wederzijdse NDA.