Perspective

17 mar, 2025

Innowacyjność

Dyski twarde NVMe i przyszłość pamięci masowej dla sztucznej inteligencji

Perspective

dyski-twarde-nvme-i-przyszłość-pamięci-masowej-dla-sztucznej-inteligencji

Rosnące wyzwanie w obszarze pamięci masowej dla danych AI

Sztuczna inteligencja prowadzi do przełomów w różnych branżach, rewolucjonizując wszystko, począwszy od diagnostyki medycznej i modelowania finansowego, aż po autonomiczne pojazdy i automatyzację na dużą skalę. Jednak w miarę jak systemy wykorzystujące sztuczną inteligencję stają się coraz bardziej złożone, wymagania w zakresie pamięci masowej danych gwałtownie rosną, stwarzając wyzwania pod względem skalowalności, wydajności i kosztów.

Zbiory danych wykorzystywane w uczeniu maszynowym wymagają dziś petabajtów pamięci masowej, a niektóre przedsiębiorstwa zarządzają danymi w skali eksabajtów, aby nadążać za ewoluującymi modelami AI. Te ogromne zbiory danych muszą być efektywnie przechowywane, pobierane i przetwarzane w celu wspierania trenowania modeli i wnioskowania. Infrastruktura pamięci masowej stojąca za sztuczną inteligencją nie jest już tylko problemem informatycznym – sama stała się głównym czynnikiem umożliwiającym wprowadzanie innowacji w zakresie sztucznej inteligencji.

Pomimo postępów w dziedzinie obliczeń opartych na sztucznej inteligencji tradycyjne architektury pamięci masowej stały się skomplikowane i drogie w przypadku skali wymaganej do obsługi procesorów graficznych, które potrzebują dużych ilości danych, co doprowadziło do ograniczeń, które spowalniają wdrażanie AI. Istnieją trzy powody takiego stanu rzeczy:

Po pierwsze, o ile architektury oparte na dyskach SSD zapewniają dużą wydajność, wysokie koszty ich nabycia sprawiają, że są one niepraktyczne w przypadku potrzeb odnoszących się do pamięci masowej do zastosowań związanych z trenowaniem AI. Przechowywanie dużych zbiorów danych wyłącznie na dyskach SSD jest dla większości przedsiębiorstw niekorzystne z finansowego punktu widzenia.

Po drugie, o ile systemy dysków twardych SAS/SATA nadal zapewniają niezawodną i niedrogą pamięć masową do wielu zastosowań klasy korporacyjnej, obciążenia robocze związane ze sztuczną inteligencją stawiają specyficzne wymagania dla infrastruktury pamięci masowej. Interfejsy SAS/SATA bazują na autorskich konstrukcjach krzemowych, adapterach HBA i architekturach kontrolera, które nie zostały zaprojektowane z myślą o wysokiej przepustowości i niskich opóźnieniach w obciążeniach związanych ze sztuczną inteligencją. W miarę rosnącego wykorzystania sztucznej inteligencji czynniki te mogą zwiększać złożoność i powodować dodatkowe opóźnienia, utrudniając szybki dostęp modeli AI do ogromnych zbiorów danych.

Oprócz tego, obciążenia robocze związane ze sztuczną inteligencję, które zależą od pamięci masowej w chmurze, często charakteryzują się wysokimi kosztami transferu danych w sieci WAN, gwałtownymi wzrostami opóźnień i nieprzewidywalnym czasem pobierania. Ten brak wydajności ogranicza responsywność modeli AI i zwiększa koszty operacyjne, podczas gdy sprzęt przetwarzający oczekuje na dane.

W związku z tym w miarę zwiększania skali sztucznej inteligencji potrzebne jest nowe podejście, które uzupełnia istniejącą architekturę pamięci masowej, jednocześnie równoważąc pojemność, koszty i szybkość, aby wspierać trenowanie i wnioskowanie oparte na AI bez żadnych kompromisów.

Nowe podejście: Dyski twarde NVMe do obsługi obciążeń AI 

Firma Seagate jest pionierem w dziedzinie transformacyjnych rozwiązań, wprowadzając technologię NVMe w dyskach twardych o dużej pojemności. Rozwijając NVMe jako przyszły standardowy protokół w zakresie łączności dysków twardych, Seagate zapewnia alternatywę zaprojektowaną z myślą o optymalizacji strumieni danych AI i zmniejszeniu wąskich gardeł w pamięci masowej, przy jednoczesnym zachowaniu zalet odnoszących się do przystępności cenowej i gęstości dysków twardych.

W przeciwieństwie do dysków twardych opartych na interfejsie SAS/SATA dyski twarde NVMe eliminują potrzebę stosowania HBA, mostów protokołu i dodatkowej infrastruktury SAS, usprawniając pamięć masową AI. Dyski te pozwalają na płynną zmianę skali obciążeń roboczych związanych ze sztuczną inteligencją poprzez integrację dysków twardych o dużej gęstości z szybkim buforowaniem dysków SSD w ujednoliconej architekturze NVMe.

Taka zmiana zapewnia znaczne korzyści. Po pierwsze, dyski twarde NVMe upraszczają wdrażanie pamięci masowej związanej AI dzięki wyeliminowaniu adapterów sprzętowych do interfejsu z procesorem, co pozwala organizacjom na budowanie środowisk pamięci masowej związanej z AI na dużą skalę bez wyspecjalizowanych kontrolerów. Po drugie, dzięki zastosowaniu jednego sterownika NVMe i wspólnego stosu systemowego, dyski te zapewniają wydajną współpracę HDD i SSD, eliminując potrzebę stosowania oddzielnych warstw oprogramowania.

Jedną z najważniejszych korzyści jest bezpośredni dostęp do danych pomiędzy GPU i pamięcią masową za pośrednictwem DPU, co pozwala ominąć wąskie gardła związane z wykorzystaniem CPU. Tradycyjne architektury pamięci masowej kierują dane przez potoki sterowane przez CPU, powodując problemy z opóźnieniami. Dyski twarde NVMe mogą wyeliminować ten brak wydajności, umożliwiając modelom AI pobieranie i przetwarzanie ogromnych zbiorów danych przy znacznie mniejszych opóźnieniach.

Ponadto technologia NVMe over Fabrics (NVMe-oF) umożliwia dyskom twardym NVMe integrację z rozproszonymi architekturami pamięci masowej do zastosowań związanych ze sztuczną inteligencją, zapewniając bezproblemowe skalowanie w ramach wydajnych sieci centrów danych. Ta funkcja jest szczególnie korzystna dla przedsiębiorstw poszukujących elastycznych, komponowanych rozwiązań pamięci masowej dla obciążeń roboczych związanych ze sztuczną inteligencją.

Korzystając z dysków twardych NVMe wraz z dyskami SSD, organizacje będą w stanie zoptymalizować koszty przy jednoczesnym zachowaniu wydajności, rezerwując dyski SSD do aktywnych zestawów danych i wykorzystując dyski twarde do długoterminowego przechowywania danych związanych z trenowaniem AI.

Seagate's demonstration of a storage array unifying around NVMe.

Zapewnianie rozwiązań na przyszłość: Weryfikacja koncepcji dysków twardych NVMe firmy Seagate

Aby zademonstrować potencjalny, rzeczywisty wpływ dysków twardych NVMe, firma Seagate przeprowadziła weryfikację koncepcji (POC), łącząc dyski twarde NVMe, dyski SSD NVMe, procesory NVIDIA BlueField DPU i oprogramowanie AIStore, prezentując wydajny ekosystem pamięci masowej do zastosowań związanych ze sztuczną inteligencją.

Weryfikacja koncepcji podkreśliła kluczowe zalety dysków twardych NVMe w przepływach pracy związanych ze sztuczną inteligencją, dostarczając dowodów na to, że mogą one mieć znaczący wpływ w wielkoskalowych środowiskach pamięci masowej do zastosowań związanych ze sztuczną inteligencją:

  • Inżynierowie wykazali, że bezpośrednia komunikacja GPU-pamięć masowa za pośrednictwem dysków twardych NVMe i DPU pomogła zmniejszyć opóźnienia związane z pamięcią masową w przepływach danych AI.
  • Starsze rozwiązania SAS/SATA zostały wyeliminowane, co pozwoliło uprościć architekturę systemu i zwiększyć wydajność pamięci masowej.
  • AIStore dynamicznie zoptymalizowało buforowanie i warstwowanie, zwiększając wydajność trenowania modelu i jednocześnie upraszczając agregację pamięci masowej oraz skalowalność do poziomów eksabajtowych.
  • Integracja NVMe-oF umożliwiła bezproblemowe skalowanie, udowadniając komponowalność wielostanowiskowych klastrów pamięci masowej do zastosowań związanych z AI.

W ramach weryfikacji koncepcji firma Seagate demonstruje, w jaki sposób dyski twarde NVMe będą w stanie obsługiwać najbardziej wymagające obciążenia robocze AI na świecie bez konieczności stosowania architektury all-flash.

Wpływ w praktyce: Pamięć masowa do zastosowań związanych z AI w akcji

Firma Seagate wykorzystuje swoje wieloletnie doświadczenie we wdrażaniu modeli AI w swoich inteligentnych fabrykach, aby sprawdzać dyski twarde NVMe w rzeczywistych obciążeniach roboczych związanych z AI.

W zakładach produkujących anteny kwantowe firmy Seagate wykrywanie defektów na podstawie sztucznej inteligencji opiera się na szybkim pobieraniu obrazów i szybkim odzyskiwaniu w celu trenowania modeli i ciągłego doskonalenia. Stosując informacje z własnych środowisk produkcyjnych wykorzystujących sztuczną inteligencję, firma Seagate bada, w jaki sposób dyski twarde NVMe mogą umożliwić ten proces poprzez dostarczanie skalowalnej i niedrogiej pamięci masowej, która obsługuje zarówno przetwarzanie w czasie rzeczywistym, jak i długoterminowe przechowywanie:

  • Ogromna pojemność do przechowywania obrazów w wysokiej rozdzielczości bez stratnej kompresji danych.
  • Wydajne, długoterminowe przechowywanie zestawów danych związanych z trenowaniem AI.
  • Bezproblemowy dostęp do szkoleń i ciągłych ulepszeń w modelu AI.

Poprzez badanie integracji dysków twardych NVMe w architekturze pamięci masowej Seagate pokazuje, w jaki sposób nowa technologia może zmniejszyć koszty pamięci masowej do zastosowań związanych z AI, zapewniając jednocześnie responsywność w czasie rzeczywistym w zakresie wykrywania defektów AI. Wzrost wydajności obejmuje szybszą analizę wspomaganą przez sztuczną inteligencję, lepszą dokładność i niższe koszty infrastruktury.

Poza produkcją dyski twarde NVMe znajdują zastosowanie w autonomicznych pojazdach, obrazowaniu w opiece zdrowotnej, analityce finansowej i hiperskalowych platformach AI w chmurze.

Zrównoważony rozwój i oszczędności: Zalety dysków twardych NVMe

Infrastruktura AI pochłania ogromne ilości energii, co sprawia, że zrównoważony rozwój staje się coraz większym problemem. Prace Seagate nad dyskami twardymi NVMe pozwoliły odkryć opłacalną i energooszczędną alternatywę dla architektury SSD.

W porównaniu z dyskami SSD, dyski twarde NVMe oferują:

  • Dziesięciokrotnie bardziej korzystny współczynnik emisji dwutlenku węgla na terabajt, co znacząco zmniejsza wpływ na środowisko.
  • Czterokrotnie większą wydajność w zakresie poboru mocy podczas pracy na terabajt, obniżającą koszty zużycia energii przez centrum danych AI.
  • Znacząco niższy koszt w przeliczeniu na terabajt, zmniejszający całkowity koszt posiadania pamięci masowej do obsługi AI w dużej skali.

W miarę rozwoju infrastruktury AI zrównoważona pamięć masowa stanie się kluczowym czynnikiem w zmniejszaniu kosztów i wpływu na środowisko. Plan rozwoju firmy Seagate obejmuje dalsze usprawnienia w zakresie wydajności dysków twardych NVMe, co ma pomóc organizacjom w zwiększaniu skali pamięci masowej do zastosowań związanych z AI przy jednoczesnym osiąganiu długoterminowych celów w zakresie zrównoważonego rozwoju.

Plan na przyszłość pamięci masowej do zastosowań związanych z AI

Seagate opracowuje innowacje, które umożliwią wdrożenie infrastruktury pamięci masowej nowej generacji do obsługi sztucznej inteligencji, dostosowując się do trendów w branży oraz potrzeb środowisk hiperskalowych i chmur obliczeniowych.

Plan działania obejmuje:

  • Zmianę skali platformy Mozaic (obecnie oferowanej w dyskach o pojemności 36 TB) w celu opracowania dysków twardych NVMe o jeszcze większej pojemności.
  • Lepszą obsługę NVMe-oF, co umożliwia płynnie skalowanie obciążeń związanych z AI w środowiskach hybrydowych.
  • Tworzenie architektur referencyjnych zapewniających deweloperom zajmującym się sztuczną inteligencją możliwość łatwego wdrażania zoptymalizowanych rozwiązań pamięci masowej.

Seagate współpracuje z klientami i partnerami, aby zbadać, w jaki sposób dyski twarde NVMe można dopasować do rozwiązań nowej generacji pamięci masowej do obsługi AI, zapewniając przedsiębiorstwom możliwość niedrogiego i wydajnego zaspokajania potrzeb w zakresie pamięci masowej do obsługi AI.

Zaangażowanie firmy Seagate w przyszłość pamięci masowej do obsługi AI

Sztuczna inteligencja zmienia branże, jednak wiele organizacji zmaga się ze złożonością zarządzania danymi i rosnącymi kosztami pamięci masowej. Skalowalna i wydajna pamięć masowa ma zasadnicze znaczenie dla rozwoju innowacji w zakresie sztucznej inteligencji.

Praca firmy Seagate nad dyskami twardymi NVMe pokazuje, w jaki sposób łączność NVMe może zmniejszyć złożoność wdrażania pamięci masowej przy jednoczesnym zachowaniu korzyści pod względem kosztów i gęstości dysków twardych.

Dzięki integracji AIStore skalowalności NVMe-oF oraz ścieżkom pamięci masowej zoptymalizowanym pod kątem GPU w weryfikacji koncepcji Seagate przewodzi kolejnej fali innowacji w zakresie infrastruktury AI.

Sztuczna inteligencja zmienia kształt branż, a firma Seagate na nowo definiuje sposób skalowania infrastruktury pamięci masowej do obsługi AI, aby sprostać rosnącemu zapotrzebowaniu na pamięć masową.