Pamięć masowa danych do sztucznej inteligencji
Przechowanie i aktywacja danych masowych ma kluczowe znaczenie dla następnej fali innowacji w zakresie sztucznej inteligencji.
Deweloperzy aplikacji prześcigają się w trenowaniu i wdrażaniu modeli AI. Do tej pory głównym zadaniem było dotarcie do odpowiednich danych i zwiększenie mocy obliczeniowej. W miarę rozpowszechniania się modeli i aplikacji wykorzystujących sztuczną inteligencję pilnym wyzwaniem staje się przechowanie ogromnych ilości generowanych eksabajtów. Obsługa obciążeń związanych ze sztuczną inteligencją wymaga połączenia różnych technologii pamięci masowej przy obsłudze przepływu danych AI. Ostatecznie jednak sztuczna inteligencja w dużej skali wymaga dysków twardych.
Aby dostarczyć sztucznej inteligencji danych do uczenia się, tworzenia i doskonalenia, potrzebna jest szeroka gama technologii pamięci masowej. Począwszy od pamięci o wysokiej przepustowości, aż po dyski twarde o dużej pojemności, wybór odpowiedniego zestawu pamięci masowej dla przetwarzanych danych AI wymaga zachowania równowagi pomiędzy wydajnością, kosztem i skalowalnością.
Klastry komputerowe AI trenują, przetwarzają i optymalizują modele językowe. Działanie procesorów GPU, CPU, NPU i TPU jest ściśle powiązane z wydajnymi urządzeniami pamięci, zapewniając przepustowość rzędu terabajtów, a nawet petabajtów na sekundę i ekstremalną moc obliczeniową. Dane wejściowe i wyjściowe, z których korzystają i które generują, trafiają do sieciowych klastrów pamięci masowej, gdzie są przechowywane w długim okresie, głównie na dyskach twardych, aby mogły być użyte do powtórnego treningu, kontroli jakości i zapewnienia zgodności.
Najbardziej zaawansowani innowatorzy w zakresie sztucznej inteligencji zarządzają obecnie również największymi na świecie centrami danych w hiperskali i chmurze. Firmy te przechowują 90% swoich internetowych eksabajtów¹ na dyskach twardych, ponieważ zdają sobie sprawę z korzystnego stosunku ceny do wydajności dysków twardych używanych do pamięci masowej. Choć dyski SSD także reprezentują technologię o kluczowym znaczeniu, to jednak dyski twarde utrzymają swoją pozycję nośnika dla większości danych we wdrażanej architekturze zoptymalizowanej pod kątem sztucznej inteligencji.
Wspierając przepływ danych związany z AI, dyski twarde odgrywają kluczową rolę w walidacji modeli AI.
Wykorzystanie pełnego potencjału sztucznej inteligencji wymaga danych oraz pamięci masowej do ich przechowania.
Rozwój sztucznej inteligencji sprawi, że ludzie i maszyny będą generować szybciej i na wiele różnych sposobów ogromne ilości danych.
Sztuczna inteligencja stale doskonali się w cyklu z pozytywnym wzmocnieniem, wykorzystując dane, generując nowe treści i ucząc się na podstawie własnego działania.
Seagate optymalizuje pamięć masową pod kątem sztucznej inteligencji, dokonując bezprecedensowego skoku w zakresie pojemności, aby wspierać wydajną architekturę i rozbudowę centrum danych.
Przeprowadzona przez Seagate analiza na podstawie badania IDC Multi-Client Study, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, listopad 2023 r.
Analiza firmy Seagate oparta na danych Forward Insights Q323 SSD Insights, sierpień 2023 r.; IDC Worldwide Hard Disk Drive Forecast 2022-2027, kwiecień 2023 r., Doc. #US50568323; TRENDFOCUS SDAS Long-Term Forecast, sierpień 2023 r.
Wykorzystanie całkowitej wbudowanej emisji dwutlenku węgla i 5-letni cykl eksploatacji.
Sara McAllister et al., „A Call for Research on Storage Emissions”, Hotcarbon.org, 2024.