L'IA dipende dalla memorizzazione dei dati con capacità di massa.

La memorizzazione e l'attivazione di dati in massa sono fondamentali per la prossima ondata di innovazioni IA.

Ottimizzare il potenziale dell'IA richiede un equilibrio.

Gli sviluppatori di applicazioni si stanno impegnando per addestrare e distribuire modelli di IA. L'attenzione si è concentrata sulla ricerca dei dati giusti e sull'aumento della potenza di elaborazione. Con la proliferazione dei modelli e delle applicazioni di IA, diventa una sfida urgente capire come memorizzare le enormi quantità di exabyte che genereranno. Il supporto dei carichi di lavoro dell'IA richiede una combinazione di importanti tecnologie di memorizzazione in tutto il flusso di lavoro dei dati dell'IA. Ma in definitiva, l'IA su grande scala richiede le unità disco.

L'IA consente l'uso di un'ampia gamma di capacità di memoria e archiviazione.

Fornire all'IA i dati necessari per apprendere, creare e migliorare richiede un'ampia gamma di tecnologie di memorizzazione. Dalla memoria ad alta velocità di throughput alle unità disco ad alta capacità, determinare la giusta combinazione di memorizzazione per qualsiasi carico di lavoro di IA vuol dire bilanciare le esigenze di prestazioni e scalabilità. 

La maggior parte dei dati di IA finisce su unità disco.

I cluster di elaborazione con IA addestrano, eseguono e ottimizzano i modelli di linguaggio. Le GPU, CPU e TPU sono abbinate a dispositivi di memoria ad alte prestazioni, che offrono velocità di throughput nell'ordine dei terabyte e persino dei petabyte al secondo per l'elaborazione estrema. I dati di input e output che utilizzano e creano confluiscono in cluster di archiviazione di rete dove vengono conservati a lungo termine, principalmente su unità disco, per supportare la riqualificazione futura, il controllo di qualità e la conformità.

I data center più grandi del mondo scelgono le unità disco.

Oggi gli innovatori dell'IA più avanzati gestiscono anche i più grandi data center cloud e iperscalabili del mondo. Queste società scelgono di memorizzare il 90% degli exabyte¹ online su unità disco perché comprendono l'eccezionale rapporto prezzo/prestazioni offerto da queste unità per la memorizzazione di massa. Sebbene anche le unità SSD siano una tecnologia critica, le unità disco continueranno a memorizzare la maggior parte dei dati man mano che verranno implementate architetture ottimizzate per l'IA.

Perché le unità disco sono ideali per l'IA su larga scala.

L'esplosione dei dati dell'era dell'IA richiede sistemi di memorizzazione con capacità di massa e scalabili. Mentre le unità con memoria a stato solido (SSD) sono importanti per i carichi di lavoro a bassa latenza, l'IA su larga scala viene eseguita su unità disco. Tre fattori principali spiegano perché.

Economie di scala.

In base al costo per TB, le unità disco sono 6 volte più efficienti rispetto alle unità SSD, il che le rende la scelta logica per le implementazioni di memorizzazione di dati di IA.²

Produzione di exabyte su vasta scala.

In termini di spese in conto capitale, la produzione di unità disco è 9 volte più efficiente del settore della tecnologia NAND.³

Sostenibilità su larga scala.

Il consumo in condizioni operative per terabyte delle unità disco è 4 volte inferiore e la quantità di carbonio è 10 volte inferiore rispetto alle unità SSD.⁴

Le unità disco sono la spina dorsale della memorizzazione dei dati di IA.

Poiché supportano l'intero flusso di lavoro dei dati di IA, le unità disco svolgono un ruolo cruciale nella convalida dei modelli di IA.

  1. analisi di Seagate basata sullo studio multi-clienti di IDC Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, novembre 2023.

  2. Analisi di Seagate basata su Forward Insights Q323 SSD Insights, agosto 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, aprile 2023, Doc. #US50568323; TRENDFOCUS SDAS Long-Term Forecast, agosto 2023.

  3. Utilizzo del carbonio totale con un ciclo di vita di 5 anni.

  4. Sara McAllister et al., “A Call for Research on Storage Emissions,” Hotcarbon.org, 2024.