X

Et bien plus encore La technologie SSD et l'évolution de la hiérarchisation du stockage d'entreprise

La hiérarchisation permet aux OEM d'ajouter davantage de valeur à leur matériel que le simple fait d'emballer les périphériques de stockage.

Histoire de la hiérarchisation

La hiérarchisation consiste en la capacité de déplacer les données entre différentes catégories de stockage, afin d'optimiser l'investissement en performances réalisé par l'utilisateur. La première solution de hiérarchisation a probablement été une version IBM du système HSM (Hierarchical Storage Management), datant des années 80, qui offrait la possibilité de déplacer les fichiers entre un disque et une bande, en fonction des niveaux d'activité. Plusieurs autres entreprises ont ensuite développé des produits HSM, mais sans grand succès. Plus récemment, l'apparition d'appareils plus fins a permis de perfectionner la technique, qui ne gère plus les données au niveau du fichier, mais du bloc. Grâce à cette fonctionnalité orientée bloc, le déplacement des données du disque pour lequel les performances sont critiques s'est beaucoup affiné.

Le lancement des disques SSD (Solid State Drive) a engendré la nécessité de déplacer les données dynamiquement. Mais la première approche pour la vente des disques SSD a tout simplement été leur rapidité de fonctionnement, qui devait pousser les utilisateurs à l'achat et les impressionner. Cette approche n'a pourtant pas connu autant de succès que les fournisseurs de disques SSD l'auraient souhaité.

Le défi SSD

Les disques SSD apportent deux caractéristiques uniques au stockage d'entreprise : des performances sans précédent et un coût élevé sans précédent. Les utilisateurs souhaitent les utiliser pour rendre plus rapide d'accès à leurs données les plus critiques, mais ils n'ont pas les moyens d'y transférer un pourcentage conséquent de leur capacité. Ils doivent donc sélectionner les données pour lesquelles il est le plus important d'améliorer la charge de travail et déplacer uniquement ces données sur les disques SSD.

Lors du déploiement de disques SSD, les utilisateurs doivent faire face à trois problèmes immédiats :

  1. Ils ne possèdent pas les outils nécessaires pour identifier correctement les données les plus actives.
  2. Même lorsqu'ils y parviennent, ils ne peuvent pas toujours les isoler (isoler les entrées de base des données les plus actives de l'ensemble de la base de données par exemple, ou les métadonnées du système de fichiers de l'ensemble du système de fichiers).
  3. La situation évoluant au fil du temps, les données à transférer idéalement sur le disque SSD ne sont pas forcément toujours les mêmes.

La hiérarchisation permet de résoudre ces problèmes et donne aux OEM la possibilité d'ajouter de la valeur à leur matériel, plutôt que d'emballer simplement les périphériques de stockage et d'apposer leur marque sur la boîte.

La solution de hiérarchisation

Imaginez un sous-système avec plusieurs disques durs classiques et disques SSD. Dans cette configuration, le logiciel de hiérarchisation contrôle l'activité des disques et attribue dynamiquement les blocs les plus actifs aux disques SSD, de sorte que la plupart de l'activité des disques soit réalisée en dehors des disques SSD. Périodiquement, la fonction de hiérarchisation analyse les niveaux d'activité du sous-système, déplace les données ayant été moins sollicitées sur les disques magnétiques, puis les remplace par celles qui sont devenues plus actives.

Cela permet de résoudre les trois problèmes posés par le déploiement d'un système SSD. 1) Grâce à la hiérarchisation, l'utilisateur n'a plus besoin de mesurer l'activité des disques et d'ajuster le placement des données actives. 2) La hiérarchisation fonctionnant au niveau du bloc, le déplacement n'est pas limité au niveau des fichiers ou de la base de données. 3) La hiérarchisation fonctionne en permanence dans le sous-système et réajuste dynamiquement l'emplacement des données sur les différents disques en fonction de l'activité récente.

Là où les choses se compliquent

En théorie, la fonction de hiérarchisation décrite ci-dessus devrait permettre à l'utilisateur de tirer les meilleures améliorations de performances de son investissement dans la technologie SSD. En pratique, ce n'est pas si simple. Il n'est pas faisable de gérer chaque bloc individuellement dans un sous-système. Cela demanderait trop de mémoire dans le contrôleur du sous-système et imposerait une surcharge trop importante.

Pour obtenir un équilibre pratique entre surcharge et amélioration, la fonction de hiérarchisation doit être optimisée, sur la base de deux variables : 1) la fréquence de la réévaluation de l'attribution des données sur les différents niveaux, et 2) le volume de données à inclure dans l'unité minimale de stockage devant être gérée et déplacée. Ce dernier pourrait raisonnablement être évalué entre 1 Mo et 0,5 Go. Le service de hiérarchisation conserverait ensuite des statistiques sur l'activité de chaque mégaoctet (par exemple) d'espace de disque dans le sous-système. Il déplacerait régulièrement ceux dont l'activité a été la plus intense sur le stockage SSD, en renvoyant sur les disques durs traditionnels les mégaoctets les moins actifs des disques SSD. (Si un mégaoctet n'a connu aucune activité d'écriture, il peut bien sûr être supprimé.) En revanche, si cette réévaluation est effectuée trop souvent, la surcharge liée au déplacement des données dans un sens et dans l'autre risque de réduire à néant les performances obtenues grâce au placement des données sur les disques SSD. C'est pourquoi les règles de fréquence doivent impliquer une prise de décision dynamique sur la base des niveaux d'activité globaux et de la vitesse à laquelle les pics d'E/S passent d'une unité de mégaoctets à une autre. L'autre difficulté concerne la complexité engendrée par un sous-système de hiérarchisation. Bien qu'il soulage l'utilisateur du besoin de gérer l'emplacement des données, beaucoup d'autres éléments restent à surveiller. Le paramétrage des deux règles mentionnées ci-dessus, ainsi que d'autres règles associées à l'optimisation de la solution de hiérarchisation, exige de dispenser à l'opérateur/administrateur une formation poussée. Pour que le sous-système de hiérarchisation offre les meilleures performances, la personne en charge de sa configuration et de son fonctionnement doit posséder un solide bagage de connaissances en termes de gestion.

La nécessité d'un troisième niveau

Les partisans de la hiérarchisation déclaraient que, grâce aux améliorations offertes par les disques SSD, le stockage pourrait se résumer à une couche SSD (souvent appelée Tier 0 ou niveau 0) et à une couche économique de grande capacité (Tier 2 ou niveau 2), ce qui mettrait fin au besoin de disques de données critiques. Les récentes recherches et les commentaires des clients ont cependant révélé qu'il serait intéressant de conserver une troisième couche (Tier 1 ou niveau 1) composée de disques durs hautes performances qui fourniraient des performances optimales sur les modèles de données mal desservis par les disques SSD : lecture séquentielle et activité d'écriture intense, séquentielle ou aléatoire. En fait, le problème est plus général. Un investissement raisonnable dans la technologie SSD implique de renoncer à trop d'améliorations de performances (plus spécifiquement sur les disques durs). Nous savons désormais avec certitude que certains de nos clients réalisent des devis pour ce type de sous-systèmes de hiérarchisation, avec trois niveaux pour obtenir des performances optimales. Il est même arrivé qu'un responsable informatique demande une solution de hiérarchisation pour résoudre un problème critique de performances de son système de fabrication, suite à quoi son fournisseur lui a proposé un système à 3 niveaux, dont plus de la moitié de la capacité totale était située sur les disques 15 000 tr/min, et non sur les disques de niveau 2 !

Résumé

Depuis les premières tentatives relativement basiques, la hiérarchisation a évolué vers un système beaucoup plus sophistiqué et efficace. Bien que n'ayant pas éliminé tous les défis de gestion associés aux divers niveaux de stockage, la hiérarchisation se révèle un ingrédient précieux dans un sous-système de stockage, en donnant à l'utilisateur final la meilleure possibilité de tirer profit de son investissement dans la technologie SSD en termes de performances.

Il y a par ailleurs fort à parier que cette évolution n'est pas encore terminée. Grâce aux développements technologiques, la possibilité de tirer des performances maximales d'un investissement dans le stockage sera encore supérieure.

Tag :

Produits similaires
Enterprise Performance 10K HDD
Enterprise Performance 10K HDD

Applications critiques : serveurs et baies de stockage externe. Options d'autochiffrement et d'autochiffrement FIPS.

Enterprise Capacity 3.5 HDD
Enterprise Capacity 3.5 HDD

Le disque dur Nearline de 6 To avec autochiffrement le plus rapide du monde, idéal pour le stockage des données en masse.

Pulsar - page principale
Disque Seagate Pulsar SAS SSD

Cloud computing et applications de centres de traitement de données exigeantes en termes de lecture

POINTS DE VUE CONNEXES
La technologie SSD et l'évolution de la hiérarchisation du stockage d'entreprise

Utilisation des disques SSD dans les solutions à 3 niveaux, pour des performances optimales.

En savoir plus
La technologie SSD et l'évolution de la hiérarchisation du stockage d'entreprise

Utilisation des disques SSD dans les solutions à 3 niveaux, pour des performances optimales.

En savoir plus
ARTICLES PRATIQUES CONNEXES
Seagate est le leader mondial des disques durs destinés au cloud computing et au stockage.
La demande en périphériques de stockage dans un monde connecté de données

Les écosystèmes de données dans le cloud s'appuient sur des ressources de stockage numérique

En savoir plus