X

Punto de vista de Seagate Las unidades de estado sólido y la evolución del nivelado del almacenamiento para empresas

La organización por niveles permite a los OEM incrementar el valor y no limitarse al embalaje de dispositivos.

Historia de la organización por niveles

La organización por niveles es la capacidad de mover datos entre diferentes clases de almacenamiento para optimizar la inversión de los usuarios en cuanto a rendimiento. La solución de la organización por niveles original fue probablemente una versión de IBM de la administración de almacenamiento jerárquico (HSM, del inglés Hierarchical Storage Management), surgida en los años 80, que permitía mover archivos entre discos y cintas dependiendo de los niveles de actividad. Posteriormente, otras empresas desarrollaron productos de HSM pero ninguno destacó especialmente. Más recientemente, el aprovisionamiento fino aportó una mejora, al administrar los datos a nivel de bloque en vez de a nivel de archivo. Esta función basada en bloques proporcionó un contexto en el que podría producirse un movimiento mucho más ajustado de aquellos datos de discos clave para el rendimiento.

La introducción de unidades de estado sólido (SSD, del inglés Solid State Drive) ha generado la necesidad imperiosa de colocar los datos dinámicamente. Sin embargo, el primer enfoque de ventas de las unidades SSD se centró simplemente en lo rápidas que eran y se esperaba que los clientes las compraran y quedaran gratamente impresionados. Este enfoque no tuvo el éxito que los proveedores de las unidades SSD esperaban.

El reto de las unidades SSD

Las unidades SSD aportan dos características exclusivas al almacenamiento para empresas: un rendimiento y un coste elevados sin precedentes. Los usuarios quieren utilizarlas para acelerar el acceso a sus datos más esenciales, pero no pueden permitirse reubicar un porcentaje significativo de su capacidad en las unidades SSD. Deben decidir qué es más beneficioso para mejorar el uso de su carga de trabajo y mover únicamente esos datos a las unidades SSD.

Al tratar de implementar unidades SSD, los usuarios se enfrentan a tres problemas inmediatos:

  1. Carecen de herramientas que puedan identificar adecuadamente los datos más activos.
  2. Incluso cuando pueden determinar los datos más utilizados, no siempre pueden separarlos (por ejemplo, los registros de bases de datos más utilizados del resto de la base de datos o los metadatos del sistema de archivos del resto del sistema de archivos).
  3. Debido a que las condiciones cambian con el tiempo, el mejor candidato para los datos de unidades SSD en un momento dado puede no ser siempre el mejor.

La organización por niveles ofrece la posibilidad de solucionar estos problemas y permitir que los clientes fabricantes de equipos originales (OEM) no se limiten simplemente a embalar dispositivos de almacenamiento y poner su etiqueta en la caja.

La solución de la organización por niveles

Tomemos como ejemplo un subsistema con un determinado número de unidades de disco duro y varias unidades SSD. En dicha configuración, el software encargado de la organización por niveles supervisará la actividad de las unidades y trasladará dinámicamente los bloques más activos a las unidades SSD, de modo que la mayor actividad de disco se realice en las unidades SSD. De manera periódica, la función de organización por niveles revisará los niveles de actividad del subsistema, devolverá los datos a los que se haya accedido menos a las unidades magnéticas y, a continuación, los sustituirá con los que ahora sean los datos más activos.

Esto resuelve los tres problemas del reto de implementación de unidades SSD. 1) La organización por niveles evita que el usuario tenga que medir la actividad de los discos y ajustar la colocación de los datos más utilizados. 2) Como la organización por niveles trabaja a nivel de bloque, el movimiento no se limita a los archivos o bases de datos individuales. Y 3) la organización por niveles es una función de ejecución constante en el subsistema, con lo que reajusta dinámicamente la ubicación de los datos en las unidades SSD/HDD según la actividad reciente.

Los problemas surgen en los detalles

En teoría, una función de organización por niveles como la descrita arriba debería permitir que el usuario obtuviese la máxima mejora en el rendimiento con una inversión en unidades SSD. En la práctica, no es tan sencillo. No es factible administrar individualmente cada uno de los bloques de un subsistema. Requeriría demasiada memoria del controlador del subsistema e impondría una carga de trabajo excesiva.

Para alcanzar un equilibrio práctico entre la carga de trabajo y las mejoras, la función de organización por niveles debe optimizarse a sí misma basándose principalmente en dos variables: 1) con qué frecuencia volver a evaluar el traslado de datos de un nivel a otro y 2) cuántos datos incluir en la cantidad mínima de almacenamiento que se supervisará y moverá. Un valor razonable para el último elemento se encontraría entre 1 MB y 0,5 GB. En ese caso, el servicio de organización por niveles elaboraría estadísticas de la actividad de cada 1 MB de espacio de disco del subsistema. Periódicamente, movería aquellos MB que mostraran el mayor nivel de actividad al almacenamiento en unidades SSD, devolviendo a las unidades HDD los MB menos activos que se encontraran en las unidades SSD. (Por supuesto, si no hubiera ninguna actividad de escritura en un MB determinado, este podría desecharse.) Sin embargo, si esta reevaluación se realizara con demasiada frecuencia, la carga de trabajo derivada de mover los datos de un nivel a otro podría acabar con las ventajas en cuanto a rendimiento por tener los datos en las unidades SSD. Por lo tanto, una política de frecuencia quizá deba implicar una toma de decisiones dinámica basada en el nivel de actividad total y la velocidad a la que los picos de E/S pasan de unos grupos de MB a otros. Otra dificultad es la complejidad que presenta un subsistema de nivelado. Aunque evita que el usuario tenga que administrar la colocación de los datos, sigue habiendo mucho que supervisar. El ajuste de las dos políticas mencionadas, así como otras relacionadas con la obtención del máximo rendimiento de una solución de organización por niveles, requiere un grado elevado de formación por parte del operario/administrador. Se requiere una administración experimentada para configurar y mantener un subsistema de organización por niveles que alcance el mejor rendimiento posible.

La necesidad de un tercer nivel

Los defensores del nivelado afirmaron que, con la mejora que ofrecen las unidades SSD, el almacenamiento podría simplificarse a una capa de unidad SSD (a menudo denominada nivel 0) y una capa de bajo coste y alta capacidad (nivel 2), eliminando así totalmente la necesidad de unidades esenciales. Las investigaciones recientes y los comentarios de los clientes abogan por mantener una tercera capa (nivel 1) con unidades de disco duro de alto rendimiento para ofrecer un rendimiento óptimo en los patrones de datos que las unidades SSD no gestionan bien: la lectura secuencial y una gran actividad de lectura, secuencial o aleatoria. De hecho, se trata de un problema más general. Una inversión razonable en unidades SSD no saca el máximo partido de las mejoras en el rendimiento (en concreto, en las unidades de disco duro). En la actualidad hay pruebas sólidas de que algunos de nuestros clientes están utilizando subsistemas de organización por niveles exactamente de este modo, con tres niveles para lograr un rendimiento óptimo. En uno de los casos, cuando el encargado de TI solicitó una solución de organización por niveles para solucionar un problema de rendimiento del sistema de fabricación clave, el proveedor ofreció un sistema de tres niveles con más de la mitad de la capacidad adicional en unidades de 15.000 rpm, y no las unidades del nivel 2.

Resumen

La organización por niveles ha evolucionado a partir de los primeros esfuerzos bastante simples hasta convertirse en algo mucho más sofisticado y eficaz. Aunque no ha eliminado todos los retos de administración asociados con los diversos niveles de rendimiento del almacenamiento, la organización por niveles ha demostrado ser un factor inestimable en un subsistema de almacenamiento, que ofrece al usuario final la mejor oportunidad de aprovechar las ventajas de rendimiento al invertir en unidades SSD.

No obstante, no hay motivo para pensar que esta evolución haya finalizado. Los desarrollos tecnológicos seguirán avanzando y mejorando la capacidad de los usuarios para obtener el máximo rendimiento de una inversión en almacenamiento.

Etiqueta:

Productos relacionados
600 Pro SSD principal
600 Pro SSD de Seagate

Centros de datos a hiperescala, la mejor eficiencia de rendimiento de su clase (IOPS/vatio).

1200 SSD
1200 SSD de Seagate

Virtualización de servidores, procesamiento de transacciones en línea, informática de alto rendimiento y aplicaciones de análisis de datos masivos.

Pulsar Principal
Unidad de estado sólido SAS Pulsar de Seagate

Cloud Computing y aplicaciones de centro de datos de lectura intensiva

CARACTERÍSTICAS DE PUNTOS DE VISTA RELACIONADOS
Mercado de oferta de NAND Flash

Inversión necesaria de más de 750.000 millones de dólares en unidades SSD para sustituir negocios de unidades HDD de 30.000 millones de dólares

Más
Las unidades SSD para empresas agilizan los negocios

Las unidades SSD se combinan con las unidades de disco duro para cubrir las demandas de los centros de datos

Más
ARTÍCULOS DE PROCEDIMIENTOS RELACIONADOS
Seagate es líder mundial en dispositivos de almacenamiento en disco duro que se utilizan en el almacenamiento y procesamiento en la nube.
La demanda de dispositivos de almacenamiento en un mundo de datos conectado

Los ecosistemas de datos en la nube requieren capacidad de almacenamiento digital

Más