X

El punto de vista de Seagate SSD y la evolución del almacenamiento empresarial por niveles

La jerarquización por niveles permite a los OEM agregar más valor que simplemente empaquetar productos.

Historia de la jerarquización por niveles

La jerarquización por niveles es la capacidad de mover datos entre diferentes clases de almacenamiento para optimizar la inversión en rendimiento del usuario. La primera solución de jerarquización por niveles probablemente fue una versión de la administración de almacenamiento jerárquico (HSM, por sus siglas en inglés) creada por IBM en los ochenta, la cual permitía mover archivos entre discos y cintas, dependiendo de los niveles de actividad. Posteriormente, otras compañías desarrollaron productos HSM, pero ninguno llegó a ser especialmente exitoso. Más recientemente, el aprovisionamiento dinámico introdujo una mejora que permitió que la administración de datos se realizara a nivel de bloques, en lugar de a nivel de archivos. Esta funcionalidad a nivel de bloques proporcionó un contexto donde se podían llevar a cabo más movimientos detallados del rendimiento crítico de los datos de disco.

La introducción de las unidades de estado sólido (SSD) trajo consigo la imperativa necesidad de colocar los datos de forma dinámica. Pero la primera estrategia para vender unidades SSD fue simplemente dar a conocer su rapidez y aguardar a que los usuarios las adquirieran y quedaran impresionados. Esta estrategia no tuvo tanto éxito como los proveedores de unidades SSD esperaban.

El reto SSD

Las unidades SSD presentan dos características únicas para almacenamiento empresarial: un rendimiento sin precedentes y un altísimo costo. Los usuarios desean utilizarlas para acceder con mayor rapidez a sus datos esenciales, pero no les es posible adquirirlas para reubicar un porcentaje significativo de su capacidad en las unidades SSD. Deben decidir qué es lo más beneficioso a la hora de mejorar el servicio de su carga de trabajo y mover esos datos a las unidades SSD.

Al tratar de utilizar las unidades SSD, los usuarios enfrentan tres problemas inmediatos:

  1. La ausencia de herramientas para identificar adecuadamente los datos más activos.
  2. Aun cuando los usuarios pueden identificar los datos más activos, no siempre pueden separarlos (por ejemplo, separar los registros de la base de datos más activos del resto de la base de datos, o separar los metadatos del sistema de archivo del resto).
  3. Las condiciones cambian con el paso del tiempo y el mejor candidato para datos SSD en un momento determinado no será siempre el mismo.

La jerarquización por niveles ofrece una solución potencial para estos problemas y les permite a los clientes de fabricante de equipamiento original (OEM, por sus siglas en inglés) agregar más valor que simplemente empacar las unidades de almacenamiento y adherirle la marca al empaque.

La solución de jerarquización por niveles

Pensemos en un subsistema con varias unidades de disco duro y diversas unidades SSD. En estas circunstancias, el software de jerarquización por niveles supervisará la actividad de las unidades y transportará dinámicamente los bloques más activos a las unidades SSD, así un mayor porcentaje de las actividades del disco podrán ser atendidas por las unidades SSD. La función de jerarquización por niveles periódicamente revisará los niveles de actividad del subsistema, regresará los datos a los que se ha tenido menos acceso a las unidades magnéticas y luego los reemplazará por los datos que actualmente son más activos.

Esto aborda los tres problemas del desafío de implementación de las unidades SSD. 1) La jerarquización por niveles ha ayudado al usuario ante la necesidad de tener que medir la actividad del disco y ajustar la colocación de los datos activos. 2) Dado que la jerarquización por niveles trabaja a nivel de bloques, el movimiento no se restringe según la granularidad de los archivos o de la base de datos. Y 3) La jerarquización por niveles es una función que se ejecuta constantemente en el subsistema y reajusta dinámicamente la ubicación de los datos en SSD/HDD, según la actividad reciente.

El problema está en los detalles

En teoría, la función de jerarquización por niveles, según se describe arriba, le permite obtener al usuario las importantes mejoras de rendimiento que supone invertir en unidades SSD. En la práctica, esto no es tan simple. No es factible administrar los bloques de un sistema de forma individual. Implicaría contar con muchísima memoria en el controlador del subsistema y afrontar gastos operativos excesivos.

Para lograr un equilibrio práctico entre los gastos operativos y las mejoras, la función de jerarquización por niveles debe ser optimizada basándose en dos variables: 1) con qué frecuencia se reevalúa el transporte de los datos entre los niveles, y 2) cuántos datos se incluyen en el segmento mínimo de almacenamiento para supervisar y mover. Un valor razonable para el planteamiento anterior pudiera ser entre 1 MB y 0,5 GB. Supongamos que el servicio de jerarquización por niveles podría mantener las estadísticas en la actividad por cada 1 MB de espacio en el disco del subsistema. Periódicamente, se moverían los datos que mostraron la mayor actividad hacia el almacenamiento SSD y se regresarían a las unidades HDD los MB menos activos que se encuentran en las unidades SSD. (Si no se ha presentado ninguna actividad de escritura en MB, se descartará.) Sin embargo, si esta reevaluación se realiza con mucha frecuencia, el gasto operativo que genera mover los datos de un nivel a otro, podría anular los beneficios de rendimiento que se obtienen al almacenar los datos en unidades SSD. Por consiguiente, es necesario aplicar de forma dinámica una política de frecuencia en la toma de decisiones basada en el nivel de actividad global y el índice al que se mueven los picos I/O entre los segmentos de MB. Otro inconveniente es la complejidad que supone un subsistema jerarquizado. Aún cuando ayuda al usuario ante la necesidad de administrar la colocación de datos, requiere de mucha supervisión. Sincronizar estas dos políticas anteriormente mencionadas, al igual que otros asuntos relacionados para aprovechar al máximo las solución de jerarquización por niveles, exige muchísimo entrenamiento por parte del operador/administrador. Es necesaria la capacidad de administración que se adquiere con la experiencia para configurar y mantener un subsistema jerarquizado y alcanzar el mejor rendimiento posible.

La necesidad de un tercer nivel

Aquellos que apoyan la jerarquización por niveles una vez afirmaron que, con las mejoras que ofrecían las unidades SSD, el almacenamiento podría simplificarse a una capa de unidades SSD (llamada con frecuencia Nivel 0) y una capa de bajo costo y con alta capacidad (Nivel 2), eliminando la necesidad de un conjunto de unidades críticas. Los estudios recientes y las opiniones de los clientes apoyan el mantener una tercera capa (Nivel 1) con unidades de disco duro de alto rendimiento para proporcionar el rendimiento óptimo de los patrones de datos que no han sido bien atendidos por las unidades SSD: lectura secuencial y alta actividad de escritura, secuencial o aleatoria. De hecho, se trata de un problema más general. Una inversión razonable en unidades SSD deja por fuera muchas mejoras de rendimiento (más específicamente, en discos duros). Ahora existen pruebas sólidas de que algunos de nuestros clientes han cotizado subsistemas jerarquizados exactamente de esta manera, con tres niveles para alcanzar el rendimiento óptimo. En una ocasión, cuando el gerente de informática solicitó una solución de jerarquización por niveles para solventar un problema crítico de rendimiento en el sistema de fabricación, el vendedor cotizó un sistema de tres niveles con más de la mitad de la capacidad agregada en las unidades de 15K-RPM ¡y no en las unidades de Nivel 2!

Resumen

La jerarquización por niveles ha pasado de los primeros esfuerzos bastante simplistas a ser algo más sofisticado y eficaz. Mientras no se eliminen todos los retos administrativos asociados al rendimiento de los múltiples niveles de almacenamiento, la jerarquización por niveles ha demostrado ser un ingrediente invaluable en los subsistemas de almacenamiento, proporcionándole al usuario final la mejor oportunidad de conocer el beneficio del rendimiento que se obtiene al invertir en unidades SSD.

Sin embargo, no existen motivos para pensar que esta evolución ha llegado a su final. Los desarrollos tecnológicos continuarán y ayudarán a refinar y mejorar la capacidad de los usuarios de obtener el máximo rendimiento que se obtiene al invertir en almacenamiento.

Etiqueta:

Productos relacionados
600 Pro SSD Principal
600 Pro SSD de Seagate

Centros de datos de hiperescala, la mejor eficiencia en su clase (IOPS/W).

1200 SSD
1200 SSD de Seagate

Virtualización de servidor, procesamiento de transacciones en línea, computación de alto rendimiento y aplicaciones de analítica de datos intensivas.

Características principales de Pulsar
Seagate Pulsar SAS SSD

Aplicaciones y computación en la nube para centros de datos de lectura intensiva.

CARACTERÍSTICAS DE PUNTO DE VISTA RELACIONADAS
Mercado de suministro de NAND Flash

$ 750.000 millones + Inversión necesaria para que el negocio de SSD pueda reemplazar $ 30.000 millones del negocio de HDD

Más
Las unidades de estado sólido respaldan la velocidad del negocio

Las unidades de estado sólido se combinan con las unidades de disco duro para satisfacer las demandas de los centros de datos

Más
ARTÍCULOS DE INSTRUCCIONES RELACIONADOS
Seagate es el líder mundial en dispositivos de almacenamiento en discos duros, que se utilizan en computación y almacenamiento en nube.
La demanda de dispositivos de almacenamiento en un mundo de datos conectado

Los ecosistemas de datos en la nube requieren capacidad de almacenamiento digital

Más