Memorizzazione dati per l'IA
La memorizzazione e l'attivazione di dati in massa sono fondamentali per la prossima ondata di innovazioni IA.
Gli sviluppatori di applicazioni si stanno impegnando per addestrare e distribuire modelli di IA. L'attenzione si è concentrata sulla ricerca dei dati giusti e sull'aumento della potenza di elaborazione. Con la proliferazione dei modelli e delle applicazioni di IA, diventa una sfida urgente capire come memorizzare le enormi quantità di exabyte che genereranno. Il supporto dei carichi di lavoro dell'IA richiede una combinazione di importanti tecnologie di memorizzazione in tutto il flusso di lavoro dei dati dell'IA. Ma in definitiva, l'IA su grande scala richiede le unità disco.
Fornire all'IA i dati necessari per apprendere, creare e migliorare richiede un'ampia gamma di tecnologie di memorizzazione. Dalla memoria ad alta velocità di throughput alle unità disco ad alta capacità, determinare la giusta combinazione di memorizzazione per qualsiasi carico di lavoro di IA vuol dire bilanciare le esigenze di prestazioni e scalabilità.
I cluster di elaborazione con IA addestrano, eseguono e ottimizzano i modelli di linguaggio. Le GPU, CPU e TPU sono abbinate a dispositivi di memoria ad alte prestazioni, che offrono velocità di throughput nell'ordine dei terabyte e persino dei petabyte al secondo per l'elaborazione estrema. I dati di input e output che utilizzano e creano confluiscono in cluster di archiviazione di rete dove vengono conservati a lungo termine, principalmente su unità disco, per supportare la riqualificazione futura, il controllo di qualità e la conformità.
Oggi gli innovatori dell'IA più avanzati gestiscono anche i più grandi data center cloud e iperscalabili del mondo. Queste società scelgono di memorizzare il 90% degli exabyte¹ online su unità disco perché comprendono l'eccezionale rapporto prezzo/prestazioni offerto da queste unità per la memorizzazione di massa. Sebbene anche le unità SSD siano una tecnologia critica, le unità disco continueranno a memorizzare la maggior parte dei dati man mano che verranno implementate architetture ottimizzate per l'IA.
Poiché supportano l'intero flusso di lavoro dei dati di IA, le unità disco svolgono un ruolo cruciale nella convalida dei modelli di IA.
Per realizzare il pieno potenziale dell'IA sono necessari i dati e una memorizzazione che li sostenga.
Le persone e i computer creeranno dati in più modi e a un ritmo più veloce che mai con la proliferazione dell'IA, producendo enormi volumi di dati.
L'IA migliora in un circolo virtuoso di feedback che utilizza i dati, genera nuovi contenuti e impara dalle loro prestazioni.
Seagate sta ottimizzando i sistemi di memorizzazione per l'IA, facendo progressi senza precedenti in termini di capacità per supportare la progettazione e la costruzione di efficienti data center.
analisi di Seagate basata sullo studio multi-clienti di IDC Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, novembre 2023.
Analisi di Seagate basata su Forward Insights Q323 SSD Insights, agosto 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, aprile 2023, Doc. #US50568323; TRENDFOCUS SDAS Long-Term Forecast, agosto 2023.
Utilizzo del carbonio totale con un ciclo di vita di 5 anni.
Sara McAllister et al., “A Call for Research on Storage Emissions,” Hotcarbon.org, 2024.