Los datos son fundamentales para empresas de todos los tamaños, y la idea de poder almacenarlos en cualquier lugar y acceder a ellos desde cualquier lugar es inmensamente atractiva.
Esta es la promesa de los sistemas de archivos globales (GFS), cuyo objetivo es romper el vínculo entre el almacenamiento físico y la aplicación y el usuario agregando datos locales y en la nube en lo que efectivamente es un almacenamiento en la nube híbrido con archivos (y en algunos casos, bloques). ) acceso.
Al utilizar un GFS, una aplicación o un usuario ve los archivos como si estuvieran todos en un solo lugar, aunque los datos puedan residir en varias ubicaciones físicas.
Aquí veremos cómo un GFS hace esto y las diferentes formas que pueden adoptar los sistemas de archivos globales.
Archivos, sistemas de archivos y espacios de nombres.
Las organizaciones más grandes suelen tener varios almacenes de datos y una variedad de sistemas de archivos diferentes.
Esto crea silos de datos y dificulta compartir información o moverla entre aplicaciones. Agregue la nube a la mezcla y se convertirá en un desafío aún mayor. Pero al pasar a un GFS, las organizaciones pueden aprovechar el almacenamiento híbrido y en la nube.
Los sistemas de archivos globales generalmente se basan en el almacenamiento de objetos, que a su vez utiliza un espacio de nombres global. Esto permite que los datos se almacenen en múltiples ubicaciones, pero que ante una aplicación (almacenamiento de objetos) aparezcan como si estuvieran en un solo lugar.
La adopción del almacenamiento de objetos está siendo impulsada por los proveedores de nube de hiperescala porque les permite operar a la escala que necesitan en múltiples centros de datos.
Los sistemas de archivos globales van más allá, permitiendo a las empresas distribuir datos a través de su almacenamiento local y recursos de nube pública.
Características del sistema de archivos global
Un GFS opera un espacio de nombres global para agregar almacenamiento en diferentes ubicaciones físicas. El almacenamiento de objetos utiliza una estructura plana en lugar de directorios jerárquicos. Cada objeto tiene un identificador único que permite que los sistemas escale a grandes cantidades de datos sin volverse difíciles de manejar.
Sin embargo, la mayoría de las aplicaciones no pueden acceder directamente al almacenamiento de objetos. Un sistema de archivos global aborda esto vinculando su servicio de archivos (normalmente en la nube) al hardware local o a una aplicación virtualizada en la LAN del usuario.
Este hardware o máquina virtual (VM) actúa como caché y, de manera fundamental, garantiza la compatibilidad de las aplicaciones. Pero todos los datos permanecen en un único espacio de nombres para permitir el almacenamiento de datos en recursos de nube, nubes privadas y matrices locales en los centros de datos locales.
Los sistemas de archivos globales también proporcionan bloqueo de archivos que evita que varios usuarios intenten escribir en archivos simultáneamente y provoquen errores de datos. El almacenamiento de objetos no tiene bloqueo de archivos. Los sistemas de archivos lo hacen, por lo que los proveedores de GFS lo agregan para brindar acceso de la forma que esperan las aplicaciones.
Los proveedores añaden otras características según su posición en el mercado. Estos incluyen servicios de migración que pueden ayudar a las empresas a trasladar datos desde el almacenamiento conectado a la red (NAS) heredado al sistema de archivos global. También se proporciona soporte para varios sistemas operativos y aplicaciones que permiten a los clientes acceder al almacenamiento sin refactorizar aplicaciones.
Casos de uso para sistemas de archivos globales
Los principales casos de uso de los sistemas de archivos globales se centran en la necesidad de almacenar volúmenes grandes y crecientes de datos no estructurados.
En esto, su aplicación es muy similar al almacenamiento de objetos en general. Pero un sistema de archivos global proporciona más control sobre dónde se almacenan los datos (con la opción de mantener algunos datos en las instalaciones) y compatibilidad con los sistemas operativos y aplicaciones existentes.
Un GFS funciona cuando las organizaciones desean los beneficios de un espacio de nombres global y la escala de la nube, pero no están en condiciones de pasar directamente al almacenamiento de objetos. También funciona para organizaciones que tienen una inversión significativa en almacenamiento local y desean seguir usándolo.
Proveedores globales de sistemas de archivos y lo que ofrecen
Cada proveedor de GFS tiene un enfoque ligeramente diferente e incluso un nombre diferente para sus productos.
CTERA utiliza Edge, un archivador de caché; CTERA Drive, un agente para dispositivos endpoint; y VDI para espacios de trabajo virtuales. CTERA dice que no tiene límites de capacidad y proporciona servicios para compartir archivos y acceso a nivel de dispositivo desde Windows, Mac, Linux, Android e iOS.
Hammerspace ofrece un entorno de datos global que combina la nube, los centros de datos y el borde en un solo conjunto de datos. Esto luego proporciona acceso, niveles de datos, control de versiones de archivos, deduplicación, instantáneas y antivirus. Hammerspace también puede acceder a la nube, al centro de datos y a los almacenes de archivos DAS, SAN y NAS heredados.
Nasuni posiciona su UniFS como el componente básico de su plataforma de datos de archivos. Las instancias perimetrales locales brindan acceso en caché local, administración de archivos y orquestación. Nasuni IQ agrega análisis de rendimiento e interfaces de programación de aplicaciones (API).
Panzura se posiciona como una plataforma única para datos no estructurados. Su sistema de archivos global es CloudFS, que, según dice, crea un conjunto de datos único y optimizado para las empresas. El servicio también cuenta con soporte directo para dispositivos móviles, que se sincronizan directamente con la nube. Panzura también ofrece almacenamiento en bloques en la nube.
El servicio de archivos global de Peer Software ofrece soporte híbrido y multinube. PeerGFS es solo software, con sincronización activo-activo, un espacio de nombres global que utiliza Microsoft DFSN (espacios de nombres del sistema de archivos distribuidos) e integración de almacenamiento de objetos. También admite copias de seguridad y replicación en la nube.
El sistema de archivos definido por software de Qumulo cubre el almacenamiento local y en la nube, y apunta a aplicaciones de alto rendimiento y alta capacidad.