Sztuczna inteligencja potrzebuje pamięci masowej o dużej pojemności.

Przechowanie i aktywacja danych masowych ma kluczowe znaczenie dla następnej fali innowacji w zakresie sztucznej inteligencji.

Maksymalizacja potencjału AI wymaga zrównoważonego podejścia.

Deweloperzy aplikacji prześcigają się w trenowaniu i wdrażaniu modeli AI. Do tej pory głównym zadaniem było dotarcie do odpowiednich danych i zwiększenie mocy obliczeniowej. W miarę rozpowszechniania się modeli i aplikacji wykorzystujących sztuczną inteligencję pilnym wyzwaniem staje się przechowanie ogromnych ilości generowanych eksabajtów. Obsługa obciążeń związanych ze sztuczną inteligencją wymaga połączenia różnych technologii pamięci masowej przy obsłudze przepływu danych AI. Ostatecznie jednak sztuczna inteligencja w dużej skali wymaga dysków twardych.

Sztuczna inteligencja bazuje na całym spektrum pamięci masowej.

Aby dostarczyć sztucznej inteligencji danych do uczenia się, tworzenia i doskonalenia, potrzebna jest szeroka gama technologii pamięci masowej. Począwszy od pamięci o wysokiej przepustowości, aż po dyski twarde o dużej pojemności, wybór odpowiedniego zestawu pamięci masowej dla przetwarzanych danych AI wymaga zachowania równowagi pomiędzy wydajnością, kosztem i skalowalnością. 

Większość danych AI trafia na dyski twarde.

Klastry komputerowe AI trenują, przetwarzają i optymalizują modele językowe. Działanie procesorów GPU, CPU, NPU i TPU jest ściśle powiązane z wydajnymi urządzeniami pamięci, zapewniając przepustowość rzędu terabajtów, a nawet petabajtów na sekundę i ekstremalną moc obliczeniową. Dane wejściowe i wyjściowe, z których korzystają i które generują, trafiają do sieciowych klastrów pamięci masowej, gdzie są przechowywane w długim okresie, głównie na dyskach twardych, aby mogły być użyte do powtórnego treningu, kontroli jakości i zapewnienia zgodności.

Największe centra danych na świecie wybierają dyski twarde.

Najbardziej zaawansowani innowatorzy w zakresie sztucznej inteligencji zarządzają obecnie również największymi na świecie centrami danych w hiperskali i chmurze. Firmy te przechowują 90% swoich internetowych eksabajtów¹ na dyskach twardych, ponieważ zdają sobie sprawę z korzystnego stosunku ceny do wydajności dysków twardych używanych do pamięci masowej. Choć dyski SSD także reprezentują technologię o kluczowym znaczeniu, to jednak dyski twarde utrzymają swoją pozycję nośnika dla większości danych we wdrażanej architekturze zoptymalizowanej pod kątem sztucznej inteligencji.

Dlaczego dyski twarde idealnie nadają się do sztucznej inteligencji w dużej skali?

Gwałtowny przyrost ilości danych w erze sztucznej inteligencji wymaga skalowalnej pamięci masowej. O ile dyski półprzewodnikowe (SSD) są ważne dla niskiej latencji obciążeń roboczych, sztuczna inteligencja w dużej skali bazuje na dyskach twardych. Wyjaśniają to trzy kluczowe czynniki.

Ekonomia skali.

Według kosztu na TB, zakup dysków twardych jest 6 × bardziej korzystny niż dysków SSD, a w konsekwencji są one logicznym wyborem dla urządzeń pamięci masowej wykorzystujących AI².

Produkcja eksabajtów w dużej skali.

Mierzona nakładami inwestycyjnymi, produkcja dysków twardych jest 9 × wydajniejsza niż przemysł pamięci NAND³.

Zrównoważony rozwój w dużej skali.

Dyski twarde zużywają 4× mniej energii podczas pracy na terabajt, a ich wbudowana emisja dwutlenku węgla jest 10 × niższa niż w dyskach SSD⁴.

Dyski twarde stanowią podstawę przechowywania danych wykorzystywanych przez sztuczną inteligencję.

Wspierając przepływ danych związany z AI, dyski twarde odgrywają kluczową rolę w walidacji modeli AI.

  1. Przeprowadzona przez Seagate analiza na podstawie badania IDC Multi-Client Study, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, listopad 2023 r.

  2. Analiza firmy Seagate oparta na danych Forward Insights Q323 SSD Insights, sierpień 2023 r.; IDC Worldwide Hard Disk Drive Forecast 2022-2027, kwiecień 2023 r., Doc. #US50568323; TRENDFOCUS SDAS Long-Term Forecast, sierpień 2023 r.

  3. Wykorzystanie całkowitej wbudowanej emisji dwutlenku węgla i 5-letni cykl eksploatacji.

  4. Sara McAllister et al., „A Call for Research on Storage Emissions”, Hotcarbon.org, 2024.