I dati IA fluiscono in un ciclo infinito.

Questo ciclo virtuoso consente la creazione e l'iterazione continue, perfezionando i modelli mentre vengono eseguiti.

Il ciclo infinito dei dati di IA.

L'IA utilizza e al tempo stesso crea i dati. Di fatto i modelli di IA migliorano se si usano dati affidabili, sia quelli generati dal modello stesso che da nuove fonti di dati. Questo ciclo infinito di produzione e consumo di dati porta ad applicazioni più intelligenti e a risultati migliori.

Ciò cambia radicalmente il valore dei dati e il modo in cui li utilizziamo. La memorizzazione di più dati in questo ciclo infinito migliora l'IA.

I dati sono parte integrante dell'IA in ogni fase.

Insieme alle nuove fonti di dati acquisite, ogni risposta, contenuto o artefatto generato dall'IA diventa parte dell'input per il prossimo ciclo di formazione, promuovendo un ciclo continuo di miglioramento dei risultati. Nelle distribuzioni di data center su larga scala, le sei fasi del ciclo dei dati di IA sono attivate da una particolare combinazione di dispositivi di memorizzazione e memoria

1. OTTENERE I DATI

Si inizia con la definizione, l'individuazione e la preparazione dei dati.

Il set di dati potrebbe essere qualsiasi cosa, da un piccolo database strutturato alla stessa rete Internet. Le unità disco di rete forniscono dati grezzi con conservazione e protezione dei dati a lungo termine. Le unità SSD di rete fungono come data tier immediatamente accessibile.

2. ADDESTRARE I MODELLI

Successivamente, il modello apprende tramite addestramento sui dati memorizzati.

L'addestramento è un processo di tentativi ed errori ove un modello converge ed è salvaguardato da punti di controllo. L'addestramento richiede un accesso ai dati ad alta velocità. Questa fase ad elaborazione intensiva utilizza HBM, DRAM e unità SSD locali per l'apprendimento. Le unità disco e le unità SSD di rete memorizzano i punti di controllo per proteggere e perfezionare l'addestramento dei modelli.

3. CREARE IL CONTENUTO

Il processo di inferenza utilizza il modello addestrato per generare i risultati.

A seconda dell'applicazione, il modello può essere utilizzato per attività come chat, analisi di immagini o creazione di video. I dispositivi che consentono la memorizzazione primaria di questa creazione iterativa sono HBM, DRAM e le unità SSD locali.

4. MEMORIZZARE IL CONTENUTO

Il processo di iterazione crea nuovi dati convalidati che devono essere memorizzati.

Questi dati vengono salvati per un continuo miglioramento, garanzia di qualità e conformità. Le unità disco memorizzano e proteggono versioni replicate del contenuto creato. Le unità SSD di rete offrono un livello di dati ad alta velocità.

5. CONSERVARE I DATI

I set di dati replicati vengono conservati in più aree geografiche e ambienti.

I dati memorizzati sono la spina dorsale di un’IA affidabile, consentendo ai data scientist di garantire che i modelli funzionino come previsto. Le unità disco sono i principali componenti che rendono possibile memorizzare e proteggere i dati nel lungo termine. Le unità SSD di rete vengono utilizzate come strato di ottimizzazione per collegare le unità disco al layer SSD locale e aiutare i dati a muoversi all'interno dell'ecosistema.

6. RIUTILIZZARE I DATI

I dati di origine, modello e inferenza alimentano il prossimo impegno.

Il contenuto ottenuto viene reimmesso nel modello, migliorandone la precisione e consentendo di crearne di nuovi. Le unità disco e le unità SSD di rete supportano la creazione di dati di IA distribuiti geograficamente. I set di dati e i risultati grezzi diventano l'origine di nuovi flussi di lavoro..

I carichi di lavoro di IA richiedono una gamma di sistemi di memorizzazione.

Le tecnologie di memorizzazione come la memoria DRAM, le unità disco e le unità SSD svolgono un ruolo fondamentale nel flusso di lavoro dei dati di IA. Ogni passaggio richiede una combinazione ottimizzata di questi dispositivi per supportare i requisiti di prestazioni e scalabilità di ciascun carico di lavoro.