X

Dettagli tecnici La visione Kinetic Open Storage di Seagate

Informazioni su come una nuova piattaforma basata sui dispositivi e strumenti API per sviluppatori consentono di soddisfare le esigenze delle moderne infrastrutture di memorizzazione. La piattaforma Kinetic Open Storage di Seagate® è costituita da una nuova classe di unità Ethernet basate su coppie chiave/valore e da un'API e strumenti per sviluppatori che offrono un approccio alle architetture dei data center scale-out, basato sugli oggetti e gestito tramite software.

kinetic-vision-how-seagate-new-developer-tools-meets-the-needs-of-cloud-storage-platforms-kinetic-platform-gallery

Il mondo della memorizzazione è cambiato: tipi di dati, modelli di accesso, richieste e tipologie di impiego

Nell'ultima decade la crescita esplosiva di applicazioni su larga scala basate sui dati ha cominciato a trasformare sostanzialmente la natura delle infrastrutture di memorizzazione aziendale. Il paradigma tradizionale di sistemi basati su file e hardware sta lasciando spazio a nuovi approcci basati sugli oggetti e gestiti tramite software.

Il nuovo paradigma è basato sugli oggetti, che includono immagini, film, dati di e-commerce e Web, ricerche e giochi, e sulla loro memorizzazione. In questi ambienti gli oggetti (informazioni) vengono scritti, letti ed eliminati, ma mai modificati. Sempre più spesso, quindi, i sistemi e i data center vengono progettati per offrire capacità invece che prestazioni. La distribuzione e la memorizzazione a livelli sono diventate funzionalità imperative. Anche le analisi dei dati sono oramai fondamentali e all'ordine del giorno, su richiesta, in tempo reale e per qualsiasi quantità e frequenza di utilizzo dei dati.

Inoltre, poiché Ethernet è senza dubbio la struttura su cui si appoggiano data center e traffico delle applicazioni, non è sorprendente che si sia affermata come la colonna portante dell'infrastruttura di memorizzazione. La crescita fenomenale di infrastrutture desktop e server virtuali e il boom della diffusione dei servizi Web di Amazon sono esempi che confermano questa tendenza.

Questa crescita è causata dal continuo aumento di sistemi portabili, social network, cloud computing e grandi quantità di dati.Queste applicazioni utilizzano principalmente dati non strutturati (o semi strutturati), facili e poco dispendiosi da creare. Di conseguenza, il valore apportato da analisi, regolamentazione e aspettative personali per la conservazione dei dati promuoverà la crescita delle infrastrutture di memorizzazione attuali e nel prossimo futuro.

La combinazione di questi fattori ridefinisce i dispositivi, le interfacce e le architetture dell'intero stack. Affinché il settore possa tenere il passo con la crescita richiesta per supportare le esigenze di memorizzazione, è necessario rimuovere tutte le inefficienze dalle architetture esistenti e introdurre un nuovo approccio ottimizzato per le esigenze delle applicazioni scale-out e dei data center.

Questo è esattamente lo scopo degli strumenti per sviluppatori di Kinetic Open Storage di Seagate. Questa piattaforma implementa e consente di realizzare lo stack più efficiente (dispositivi, protocolli, interfacce, software e sistemi) al fine di soddisfare al meglio le esigenze attuali e future delle applicazioni, supporta in modo particolare le applicazioni orientate agli oggetti per sfruttare direttamente i sistemi di memorizzazione e promuove l'innovazione dei data center scale-out. In questo modo consente di ottenere miglioramenti significativi di prestazioni, gestibilità e costo totale di proprietà.

Modelli di data center con Kinetic Open Storage di Seagate e tradizionali a confronto: rimozione di intermediazione, assenza di aggregazione e sicurezza

La piattaforma Kinetic Open Storage di Seagate rappresenta un'opportunità per risolvere quasi totalmente le inefficienze dei data center tradizionali, in cui le architetture esistenti non si adattano bene ai carichi di lavoro molto distribuiti e ottimizzati per la capacità delle applicazioni e dei dati non strutturati in esplosivo aumento.

I data center moderni sono caratterizzati da diversi livelli di software e hardware impilati insieme per offrire un percorso dei dati tra sistemi poco compatibili, ossia un livello di applicazioni orientate agli oggetti e un livello hardware (con unità disco, SSD e nastri) con memorizzazione basata su blocchi. Il percorso di transizione dalle applicazioni ai sistemi di memorizzazione richiede vari livelli di manipolazione dei dati, che includono database, interfacce POSIX, file system, gestori di volumi e driver. Le informazioni vengono trasmesse su rete Ethernet, tramite interfaccia Fibre Channel, in controller RAID, expander SAS e schede HBA SATA.

Un tipico stack è ad esempio quello illustrato nella Figura 1 di seguito.

articlename-figure#-widthxheight.jpg, alt text

Figura 1 - Modello di un tipico stack di memorizzazione: server, server di memorizzazione e dispositivi

Oltre alle inefficienze causate ovviamente dalla trasmissione attraverso più livelli, questo modello parte da un presupposto ormai obsoleto, ossia che i dispositivi di memorizzazione locali sono organizzati e gestiti in base ai loro attributi fisici. Ora è tutto diverso. Lo stack del software non si è però evoluto di conseguenza.

La maggior parte delle moderne applicazioni che gestiscono oggetti di grandi dimensioni non utilizzano la semantica dei file o un file system per determinare e applicare la migliore strategia di gestione dello spazio sul dispositivo. Queste applicazioni utilizzano esclusivamente la semantica degli oggetti, ad esempio, scrivono, leggono ed eliminano l'intero oggetto e vi fanno riferimento mediante un handle creato dal gestore del cluster e del client, e non necessitano di sapere su quale dispositivo un oggetto è memorizzato.

È nato così un intero ecosistema di fornitori tecnologici di server di memorizzazione (sia hardware che software) per gestire questa complessità, al solo fine di astrarre la gestione dei livelli delle applicazioni e dei dispositivi. Non solo questa soluzione non è efficiente, ma introduce anche barriere aggiuntive tra i due livelli che potrebbero impedire l'uso di funzionalità e capacità di memorizzazione.

Che cosa succederebbe se fosse possibile iniziare da zero e ricostruire lo stack dalla base? Che cosa succederebbe se le applicazioni orientate agli oggetti potessero comunicare direttamente nel linguaggio dei dispositivi di memorizzazione? Avremmo una piattaforma come Kinetic Open Storage di Seagate.

La piattaforma Kinetic Open Storage di Seagate

Kinetic Open Storage di Seagate è:

  • Una nuova classe di unità Ethernet basate su coppie chiave/valore, insieme a strumenti per sviluppatori che includono un'API (Application Programming Interface) aperta e le librarie associate
  • Progettata per offrire la più semplice astrazione semantica e supportare la più ampia gamma di applicazioni mediante un'API intuitiva
  • Una piattaforma efficiente per la massima innovazione

Questi componenti insieme consentono alle applicazioni di comunicare direttamente con i dispositivi di memorizzazione e sfruttarne al meglio le funzionalità. Le unità comunicano mediante chiavi e valori, eseguendo operazioni come accessi, inserimenti ed eliminazioni. In questo modo le applicazioni possono distribuire oggetti e gestire cluster lasciando alle funzionalità delle unità la gestione efficiente di:

  • Ordinamento delle chiavi (oggetti)
  • Qualità del servizio
  • Migrazione dei dati tra le unità basata sui criteri
  • Errori parziali dei dispositivi e simili condizioni
  • Sicurezza dei dati memorizzati

Nella Figura 2 è illustrato come lo stack di Kinetic Open Storage di Seagate differisce da un tipico stack.

articlename-figure#-widthxheight.jpg, alt text

Figura 2. Stack di Kinetic Open Storage di Seagate

Il modello Kinetic Open Storage di Seagate comporta svariate interessanti conseguenze. Ad esempio:

  • I livelli superflui di software e hardware esistenti vengono rimossi.
  • Non è più necessario il tradizionale livello dei server di memorizzazione.
  • Memorizzazione ed elaborazione possono essere disaggregate.
  • La densità dei rack può essere maggiore.
  • Si riduce al minimo il numero di ventole.
  • Il traffico dei dati sfrutta l'infrastruttura di trasmissione esistente del data center (Ethernet).
  • La gestione delle attività del data center risultano semplificate, con costi e rischi inferiori.

Lo scale-out è più semplice, economicamente conveniente e non limitato da architetture e infrastrutture esistenti. Le informazioni ora sono accessibili con un semplice indirizzo IP.

API della piattaforma Kinetic Open Storage di Seagate

L'interfaccia API offre agli sviluppatori accesso diretto alle principali funzionalità e capacità di memorizzazione ottimizzate in modo aperto ed estensibile. Gli sviluppatori che utilizzano più stack software, open source e proprietari, possono utilizzare la piattaforma Kinetic Open Storage di Seagate e l'architettura del data center esistente per affrontare le sfide di memorizzazione più complesse. Il design ha lo scopo di promuovere l'innovazione aperta nel software, consentendo di risolvere problemi specifici in modo flessibile e ottimale.

Inoltre ora sono disponibili molte funzionalità delle unità disco da tempo desiderate. Ad esempio:

  • Condivisione dei dati - In passato la condivisione dei dati tra le unità disco era alquanto complicata. Con l'API di Kinetic Open Storage i dati possono essere facilmente condivisi tra le applicazioni da più fonti. Un'applicazione può ora scrivere una chiave e un valore su un'unità e un'altra applicazione può leggere i dati.
  • Trasferimento di dati tra unità - Tradizionalmente spostare dati tra unità richiedeva il passaggio tramite costosi server di memorizzazione. Con l'API di Kinetic Open Storage i dati ora possono essere trasferiti direttamente tra unità utilizzando comandi di copia allo stesso livello per spostare intervalli di chiavi tra le unità.
  • Integrità dei dati - Sfortunatamente il danneggiamento silenzioso dei dati è una realtà. Con Kinetic Open Storage i dati possono essere memorizzati utilizzando controlli completi di integrità che garantiscono che l'unità abbia ricevuto correttamente i dati, in modo che il destinatario finale sia sicuro della correttezza dei dati.

Oltre a questi vantaggi, la semantica basata su coppie chiave/valore di Kinetic Open Storage di Seagate consente di apportare innovazione nel settore delle unità, ad esempio nella tecnologia dei supporti e nella dimensione dei settori, per promuovere lo sviluppo di software in parallelo, ma anche indipendentemente, rispetto al livello di Kinetic Open Storage di Seagate. Gli sviluppatori non devono più apportare modifiche al software per poter sfruttare gli avanzamenti tecnologici delle unità. L'applicazione gestisce i dati semplicemente mediante chiavi e valori, mentre le unità operano in modo trasparente e ottimale dietro Kinetic Open Storage di Seagate.

La proposta di valore di Kinetic Open Storage di Seagate: prestazioni, scalabilità, semplicità, costo totale di proprietà e sicurezza

La piattaforma Kinetic Open Storage di Seagate è stata progettata per offrire scalabilità e prestazioni di memorizzazione facili e flessibili. Offre inoltre un costo totale di proprietà per la memorizzazione nei data center che consente di ridurre sia gli investimenti iniziali che le spese operative.

Prestazioni

Per design le unità supportate da Kinetic Open Storage di Seagate sono sistemi di memorizzazione nativi basati su coppie chiave/valore. In questo modo il carico di lavoro associato alla mappatura dello spazio del dispositivo passa dal file system all'unità stessa. Le applicazioni possono così semplicemente inserire e accedere a oggetti, senza dover conoscere la modalità LBA o la posizione dei dati. Questo cambiamento consente di eliminare una porzione significativa delle operazioni di I/O dell'unità, utilizzate non per spostare dati veri e propri ma metadati e informazioni del file system.

Un altro vantaggio è la scalabilità. Sia i produttori di dispositivi che gli operatori dei data center cloud cercano di aumentare il più possibile le capacità dei dispositivi e la maggiore efficienza di I/O, insieme all'utilizzo dell'I/O netto derivante, consente di scalare in maniera più equilibrata I/O e capacità, oltre alle prestazioni assolute di ogni dispositivo e nel cluster Kinetic Open Storage di Seagate.

Le prestazioni downstream incrementale risultano migliori grazie alla maggiore gestibilità derivante dall'astrazione semantica basata su coppie chiave/valore. L'astrazione consente ad esempio di gestire facilmente i guasti dei dispositivi, inclusi quelli parziali, in alcuni casi non richiedendo nemmeno i lunghi tempi di ricostruzione tipici delle unità ad alta capacità.

Scalabilità

La piattaforma Kinetic Open Storage di Seagate è ottimizzata appositamente per data center scale-out con una rapida crescita. L'architettura Kinetic Open Storage di Seagate, grazie alla disaggregazione tra memorizzazione ed elaborazione, consente agli operatori dei data center cloud di aggiungere con facilità sistemi di memorizzazione in risposta alle maggiori esigenze di capacità. L'impatto congiunto della connettività Ethernet e della struttura dei comandi API basati sulle coppie chiave/valore consente inoltre di distribuire in modo ottimale la capacità aggiuntiva, grazie alla replicazione dei dati direttamente tra le unità, che presenta costi per sistemi e spesa di capitale minimi.

Semplicità e adozione intuitiva

L'API di Kinetic Open Storage di Seagate consente ai clienti di sviluppare le loro applicazioni di gestione o chiamare direttamente le unità. L'API consente una rapida integrazione in un'ampia gamma di applicazioni software di memorizzazione. Inoltre i dispositivi Kinetic Open Storage di Seagate possono essere rilevati dinamicamente, facilitandone l'adozione nei data center esistenti e in ambienti eterogenei in evoluzione.

Alcune unità di Seagate includono una libreria completa per la gestione dello spazio utente che consente alle applicazioni di accedere direttamente alle unità. Questa libreria mette a disposizione un'interfaccia completa per accedere ai dati e gestire l'unità, scavalcando il normale stack di memorizzazione del sistema operativo e consentendo all'applicazione di comunicare direttamente con l'unità, come se si trattasse di un servizio del data center. A tal fine viene utilizzata una tradizionale chiamata di procedura remota. La piattaforma dell'API di Kinetic Open Storage al momento include librarie per Java, C++, C, Python ed Erlang, ma in futuro saranno aggiunti altri linguaggi.

L'API di Kinetic Open Storage di Seagate consente alle applicazioni di interagire con l'unità come se fosse un normale servizio basato sulle coppie chiave/valore in rete. Le applicazioni possono quindi inserire dati sull'unità sotto forma di chiavi/valori e accedervi specificandone la chiave. Ovviamente è anche possibile eliminare chiavi e i rispettivi valori. Le chiavi sono ordinate in modo da consentire la ricerca all'interno di un intervallo e l'identificazione della chiave precedente e successiva.

Di seguito è illustrata l'architettura di base.

articlename-figure#-widthxheight.jpg, alt text

Le implementazioni iniziali dell'API di Kinetic Open Storage di Seagate includono Swift e Riak CS, con altri aggiunti in futuro. Questi sistemi consentono a migliaia di unità di essere gestite come un singolo cluster di memorizzazione affidabile. Grazie a questo software di gestione di terze parti, non solo la memorizzazione dei dati è affidabile (con replicazione e/o codifica erasure coding), ma il ripristino delle unità guaste viene eseguito in modo trasparente rispetto alle applicazioni.

Sono disponibili anche comandi avanzati di gestione delle unità che consentono all'unità di segnalare il proprio stato di integrità e di specificare a chi è consentito comunicare con l'unità.

Riduzione del costo totale di proprietà

La piattaforma Kinetic Open Storage di Seagate consente di implementare le nuove architetture dei data center, perché le unità possono interfacciarsi direttamente con le applicazioni, eliminando così l'intero livello dei componenti hardware.

Questo vantaggio tecnologico consente di aumentare la densità dei rack di memorizzazione, con conseguenze in varie aree del costo totale di proprietà.

  • Minor capitale iniziale - Le architetture Kinetic Open Storage di Seagate consentono di rimuovere i server di memorizzazione dai data center, con conseguente costo iniziale di realizzazione fisica del data center inferiore. In alternativa, a parità di spesa iniziale e spazio fisico, è possibile allocare una capacità di memorizzazione molto superiore.
  • Manodopera - Dato che l'architettura Kinetic Open Storage di Seagate rimuove la necessità di utilizzare server di memorizzazione, sono richiesti meno addetti tecnici per mantenerla. La maggiore densità di memorizzazione consentita dall'architettura Kinetic Open Storage di Seagate potrebbe inoltre ridurre il numero di tecnici necessari in genere in un data center, con significativi risparmi dei costi di manodopera.
  • Consumo energetico - L'eliminazione del livello dell'architettura con i server di memorizzazione e la più efficiente densità dei rack consente di utilizzare meno rack a parità di volume di memorizzazione, con conseguente riduzione del consumo energetico.
  • Tempo di attività ed errore umano - La maggiore affidabilità dell'architettura Kinetic Open Storage di Seagate relativamente alla replica e al failover riduce il numero di errori di gestione del data center di memorizzazione. La gestione interna degli errori delle unità consente anche di trasformare gravi problemi tecnici in attività di ordinaria manutenzione.

La maggiore densità dei rack offre un ulteriore grande vantaggio economico quando il costo dello spazio fisico ha un peso significativo, ad esempio per data center che condividono la superficie con altre attività. Una maggiore densità dei rack comporta una superficie occupata dal data center molto inferiore, con conseguenti risparmi diretti.

L'impatto esatto sul costo totale di proprietà varia in base a diversi fattori (numero di unità disco per ogni server di memorizzazione, caratteristiche degli spazi, ecc.) specifici di un dato data center.

Sicurezza

La sicurezza dei servizi di memorizzazione all'interno dei data center cloud è complicata. La libreria dell'interfaccia supporta:

  • Autenticazione - Autenticazione crittografata completa dei server che hanno autorizzazioni di accesso all'unità.
  • Integrità - Controllo completo dell'integrità dei comandi e dei dati.
  • Autorizzazione - Un chiaro insieme di ruoli per server che descrivono le azioni consentite alle applicazioni, come lettura, lettura/scrittura, gestione dell'unità e gestione della sicurezza per l'unità.
  • Sicurezza TLS (Transport Layer Security) - Viene fornita l'intera suite dello standard TLS di settore per la protezione di dati molto sensibili e dei comandi di gestione.

Questo è decisamente diverso rispetto agli altri sistemi di memorizzazione distribuita, che non solo non proteggono, ma neanche autenticano, il traffico tra i servizi all'interno del data center. Questi sistemi infatti concedono a tutti coloro che hanno accesso al data center l'accesso completo e senza restrizioni ai sistemi di memorizzazione, consentendo loro di leggere, scrivere e persino eliminare tutti i dati. In queste situazioni, la sicurezza diventa responsabilità dell'infrastruttura di rete e richiede reti più costose, isole di reti distinte o reti VLAN complicate. L'architettura di sicurezza Kinetic Open Storage di Seagate consente di realizzare architetture di rete per data center economiche e flessibili.

Concetti principali 

La piattaforma Kinetic Open Storage di Seagate rappresenta un importante e fondamentale passo avanti nelle architetture di memorizzazione. Le esigenze di una realtà globale sempre connessa e mobile, che richiede infrastrutture di memorizzazione cloud immense, obbligano a riesaminare e ridefinire le tecnologie e le procedure consigliate. La piattaforma Kinetic Open Storage di Seagate introduce un nuovo paradigma, necessario per consentire al pubblico e al settore non solo di soddisfare le esigenze, ma anche di farlo in modo ottimale e il più economicamente possibile.

Tag:

ARTICOLI SUI DETTAGLI TECNICI CORRELATI
Gestione dei data center: tendenze e sfide

Seagate ha interpellato manager di data center negli Stati Uniti e in Cina per individuare e definire le principali problematiche che i responsabili delle decisioni presso queste strutture devono affrontare.

Ulteriori informazioni
RISORSE CORRELATE
Seagate è il leader mondiale nella fornitura di unità disco per il cloud computing e la memorizzazione cloud.
Architetture di cloud computing e memorizzazione cloud

Utilizzo delle conoscenze fondamentali relative alla memorizzazione dei dati IT e classe Enterprise

Ulteriori informazioni
Architettura di memorizzazione unificata: verso la riduzione dei costi dell'infrastruttura di memorizzazione a lungo termine

Le unità classe Enterprise compatibili di Seagate promuovono la convergenza dei sistemi di memorizzazione

Ulteriori informazioni