Informe: métricas de rendimiento del almacenamiento en la nube

Aproximadamente el 50% de los datos comerciales se almacenan ahora en la nube, y el volumen almacenado mediante tecnologías en la nube es aún mayor cuando se tienen en cuenta las nubes privadas e híbridas.

El almacenamiento en la nube es flexible y potencialmente rentable. Las organizaciones pueden elegir entre los hiperescaladores (Amazon Web Services, GCP de Google y Microsoft Azure), así como proveedores de nube locales o más especializados.

Pero, ¿cómo medimos el rendimiento de los servicios de almacenamiento en la nube? Cuando el almacenamiento es local, existen numerosas métricas bien establecidas que nos permiten realizar un seguimiento del rendimiento del almacenamiento. En la nube, las cosas pueden ser menos claras.

Esto se debe en parte a que, cuando se trata de almacenamiento en la nube, la elección aporta complejidad. El almacenamiento en la nube viene en una variedad de formatos, capacidades y rendimiento, incluido el almacenamiento de archivos, bloques y objetos, sistemas basados ​​en disco duro, almacenamiento de VM, NVMe, SSD e incluso cintas, así como tecnología que funciona en una “nube”. en base a las instalaciones.

Esto puede hacer que comparar y monitorear instancias de almacenamiento en la nube sea más difícil que para el almacenamiento local. Además de las métricas de rendimiento de almacenamiento convencionales, como IOPS y rendimiento, los profesionales de TI que especifican sistemas en la nube deben tener en cuenta criterios como el costo, la disponibilidad del servicio e incluso la seguridad.

Métricas de almacenamiento convencional

Las métricas de almacenamiento convencionales también se aplican en la nube. Pero pueden ser bastante más difíciles de deshacer.

Los sistemas de almacenamiento empresarial tienen dos medidas principales de “velocidad”: rendimiento e IOPS. El rendimiento es la tasa de transferencia de datos hacia y desde los medios de almacenamiento, medida en bytes por segundo; IOPS mide el número de lecturas y escrituras – operaciones de entrada / salida (E / S) – por segundo.

En estas mediciones, los fabricantes de hardware distinguen entre velocidades de lectura y velocidades de escritura, con velocidades de lectura generalmente más rápidas.

Los fabricantes de discos duros, SSD y matrices también distinguen entre lecturas o escrituras secuenciales y aleatorias.

Estas métricas se ven afectadas por cosas como el movimiento de los cabezales de lectura / escritura sobre los discos y por la necesidad de borrar los datos existentes en el almacenamiento flash. El rendimiento de lectura y escritura aleatoria suele ser la mejor guía para el rendimiento en el mundo real.

Los fabricantes de discos duros calculan cifras de revoluciones por minuto (rpm) para discos giratorios, por lo general 7.200 rpm para almacenamiento convencional y, a veces, 12.000 rpm para sistemas empresariales de mayor calidad y 5.400 rpm para hardware de menor rendimiento. Sin embargo, estas medidas no son aplicables al almacenamiento en estado sólido.

Por lo tanto, cuanto mayor sea la IOPS, mejor será el rendimiento del sistema. Las unidades de disco giratorias generalmente alcanzan el rango de 50 IOPS a 200 IOPS.

Los sistemas de estado sólido son significativamente más rápidos. Sobre el papel, una unidad flash de alto rendimiento puede alcanzar 25.000 IOPS o incluso más. Sin embargo, las diferencias de rendimiento en el mundo real serán menores una vez que se tengan en cuenta el controlador de almacenamiento, la red y otros gastos generales, como el uso de RAID y la memoria caché.

La latencia es la tercera medida de rendimiento clave que se debe tener en cuenta. La latencia es la rapidez con la que se lleva a cabo cada solicitud de E / S. Para un sistema basado en HDD, esto será de 10 ms a 20 ms. Para SSD, son unos pocos milisegundos. La latencia suele ser la métrica más importante para determinar si el almacenamiento puede admitir una aplicación.

Métricas de la nube

Pero traducir las métricas de almacenamiento convencionales a la nube rara vez es sencillo.

Por lo general, los compradores de almacenamiento en la nube no sabrán exactamente cómo se aprovisiona su capacidad. La combinación exacta de flash, disco giratorio e incluso cinta o medios ópticos depende del proveedor de la nube y depende de sus niveles de servicio.

La mayoría de los proveedores de nube a gran escala operan una combinación de hardware de almacenamiento, almacenamiento en caché y tecnologías de equilibrio de carga, lo que hace que los datos de rendimiento del hardware sin procesar sean menos útiles. Los proveedores de la nube también ofrecen diferentes formatos de almacenamiento, principalmente bloques, archivos y objetos, lo que hace que las mediciones de rendimiento sean aún más difíciles de comparar.

Las medidas también variarán con los tipos de almacenamiento que compre una organización porque los hiperescaladores ahora ofrecen varios niveles de almacenamiento, según el rendimiento y el precio.

Luego están las ofertas centradas en el servicio, como la copia de seguridad y la recuperación, y el archivo, que tienen sus propias métricas, como el objetivo de tiempo de recuperación (RTO) o los tiempos de recuperación.

El área más fácil para las comparaciones, al menos entre los grandes proveedores de la nube, es el almacenamiento en bloque.

La plataforma en la nube de Google, por ejemplo, enumera las IOPS máximas sostenidas y el rendimiento máximo sostenido (en MBps) para su almacenamiento en bloque. Esto se desglosa además en IOPS de lectura y escritura, y rendimiento por GB de datos y por instancia. Pero como afirma Google: “Las IOPS de disco persistentes y el rendimiento del rendimiento dependen del tamaño del disco, el recuento de CPU virtuales de la instancia y el tamaño del bloque de E / S, entre otros factores”.

Google también enumera una comparación útil del rendimiento de su infraestructura con una unidad física de 7.200 rpm.

Microsoft publica una guía dirigida a los usuarios de TI que desean monitorear su almacenamiento Blob (objeto), que sirve como un manual útil sobre la medición del rendimiento del almacenamiento en el mundo Azure.

AWS tiene una guía similar basada en su oferta de Elastic Block Store (EBS). Nuevamente, esto puede guiar a los compradores a través de los distintos niveles de almacenamiento, desde SSD de alto rendimiento hasta almacenamiento en frío basado en disco.

Coste, disponibilidad del servicio … y otras medidas útiles

Dado que el almacenamiento en la nube es un servicio de pago por uso, el costo es siempre una medida clave.

Nuevamente, todos los principales proveedores de la nube tienen niveles basados ​​en el costo y el rendimiento. AWS, por ejemplo, tiene volúmenes de SSD de uso general gp2 y gp3, volúmenes de rendimiento optimizado io1 y io2 y volúmenes de HDD centrados en el rendimiento de st1, destinados a “cargas de trabajo grandes y secuenciales”. Los compradores querrán compilar su propio análisis de costos y rendimiento para hacer comparaciones similares.

Pero hay más en las métricas de almacenamiento en la nube que el costo y el rendimiento. El costo por GB o instancia debe considerarse junto con otras tarifas, incluida la entrada de datos y, especialmente, los costos de salida o recuperación de datos. Algunas ofertas de almacenamiento a largo plazo muy económicas pueden resultar muy caras cuando se trata de recuperar datos.

Otra medida es la capacidad utilizable: ¿cuánto del almacenamiento comprado está realmente disponible para la aplicación cliente y en qué punto la utilización comenzará a afectar el rendimiento en el mundo real? Una vez más, esto podría diferir de las cifras de la tecnología local.

Los CIO también querrán ver la disponibilidad del servicio. La confiabilidad de los componentes y subsistemas de almacenamiento se mide tradicionalmente en el tiempo medio entre fallas (MTBF), o para los SSD, los terabytes más nuevos escritos a lo largo del tiempo (TBW).

Pero para la provisión de nube a gran escala, la disponibilidad es una medida más común y útil. Los proveedores de la nube utilizan cada vez más medidas de disponibilidad o tiempo de actividad al estilo de los centros de datos o de las telecomunicaciones, y los “cinco nueves” suelen ser el mejor y más caro SLA.

Incluso entonces, estas métricas no son los únicos factores a tener en cuenta. Los compradores de almacenamiento en la nube también deberán considerar la ubicación geográfica, la redundancia, la protección y el cumplimiento de los datos, la seguridad e incluso la solidez financiera del proveedor de la nube.

Aunque estas no son medidas de desempeño en el sentido convencional, si un proveedor se queda corto, podría ser una barrera para usar su servicio.

Exit mobile version