Almacenamiento de objetos y almacenes de objetos
¿Qué es el almacenamiento de objetos y qué son los almacenes de objetos?
El almacenamiento de objetos constituye un método de gestionar el almacenamiento de datos en unidades separadas, que se denominan objetos. Un almacén de objetos es una plataforma en la que el software de análisis de datos ejecuta consultas sobre los objetos.
Con una capacidad infinita, el almacenamiento de objetos se entendía en el pasado como un tipo de almacenamiento económico para funciones de copia de seguridad y recuperación. A medida que los desarrolladores se han ido desplazando hacia la nube y los análisis se han multiplicado en las empresas, los casos de uso de s3 y almacenamiento de objetos han aumentado debido a su capacidad para gestionar volúmenes y conjuntos de datos masivos.
¿Cómo funciona el almacenamiento de objetos?
El almacenamiento de objetos mantiene bloques de datos juntos en una unidad y asigna un identificador exclusivo con metadatos completos a cada objeto para facilitar la búsqueda en cualquier lugar de un pool de datos distribuidos, ya sea a nivel local o a través de varios sistemas de red o áreas geográficas.
El almacenamiento de objetos elimina la estructura jerárquica empleada por otros sistemas al utilizar un espacio plano de direcciones. De este modo, puede ampliarse o reducirse con facilidad para adaptarse a expansiones y contracciones rápidas que responden a las variaciones de las cargas de trabajo del almacenamiento.
Además, para realizar actualizaciones de los datos almacenados, los sistemas de almacenamiento de objetos guardan nuevas copias del activo completo y no solo las pequeñas porciones que se han modificado. Como consecuencia, el almacenamiento de objetos cuenta con datos más duraderos que otros sistemas.
Lamentablemente, una carga de metadatos más pesada impone un mayor sobrecoste y ralentiza los procesos de modificación de datos. Si tenemos esto en cuenta, el almacenamiento de objetos tradicional resultaba más adecuado para datos a los que no era necesario acceder con demasiada frecuencia, como por ejemplo:
- Procesamiento de copias de seguridad para recuperación de archivos tras un desastre o pérdida de datos
- Contenido web estático, como fotos, documentos históricos, música, etc.
- Aplicaciones que escriben solo una vez o que son de solo lectura y/o que no se actualizan con frecuencia
Almacenamiento de objetos vs. almacenamiento en bloque vs. almacenamiento de archivos
El almacenamiento de datos se presenta en tres categorías de modos que responden de forma diferente a las necesidades de acceso a los datos: objetos, bloque y archivos. Qué método elegir depende de varias características clave que determinan que unos casos de uso resulten más adecuados que otros.
Como método más antiguo y simple de almacenamiento de datos, el almacenamiento basado en archivos coloca los datos como un solo elemento de información en una carpeta, de forma parecida a un sistema clásico de archivo en papel. Puesto que se puede acceder a los datos almacenados siguiendo una ruta sencilla, resulta adecuado para la gestión de archivos compartidos. Pero como consecuencia de su estructura de archivo jerárquica, encontrar una pieza de información concreta puede resultar tedioso en el mejor de los casos.
El almacenamiento basado en bloques divide los datos en unidades que pueden repartirse por un sistema para lograr un almacenamiento más eficiente. No obstante, el almacenamiento en bloque limita los metadatos asignados a cada bloque de datos a una sola dirección de identificación. Como consecuencia, los bloques no producen un gran sobrecoste y pueden resultar más ligeros y eficientes que otros sistemas. Esta ligereza facilita un rendimiento extremadamente alto para datos que cambian con frecuencia, como los transaccionales.
En contraposición, el almacenamiento de objetos añade muchos más metadatos a cada archivo que otros sistemas de almacenamiento. Puede incluir información contextual y personalizable, como detalles de las aplicaciones, niveles de protección de datos y otra información que puede tener relación con las políticas de retención u otros atributos. Ello permite a los usuarios implementar una amplia variedad de análisis sobre grandes cantidades de datos desestructurados. Y como ventaja adicional, el almacenamiento de objetos elimina la estructura jerárquica de otros modos, lo que permite una escalabilidad mayor y un acceso distribuido de forma más amplia.
¿Cómo opera el almacenamiento de objetos con Kubernetes?
Para comprender cómo se intersecan Kubernetes y el almacenamiento de objetos, resulta esencial comprender que, básicamente, el crecimiento de datos conduce a las tecnologías hacia la obsolescencia. Como consecuencia, el aumento rápido y continuo del volumen de datos se encuentra en proceso de acelerar más que nunca los ciclos de desarrollo de la tecnología.
Diseñado específicamente para un entorno sometido a cambios rápidos, Kubernetes se ha convertido en una fuerza dominante para los operadores que gestionan las infraestructuras de computación, conectividad de red y almacenamiento. Como plataforma predeterminada para Kubernetes, el almacenamiento de objetos brinda la elasticidad, escalabilidad y resiliencia que necesita Kubernetes para alimentar su marco de diseño/paquetes/implementación. Al emplear el almacenamiento de objetos, Kubernetes permite a los operadores gestionarlo todo, desde el aprovisionamiento hasta la colocación de volúmenes a escala, y todo ello con un sobrecoste mínimo.
Y cuando las aplicaciones se ejecutan en contenedores, el almacenamiento de objetos mantiene el estado de dichas aplicaciones. Esto resulta crítico para Kubernetes, dado que requiere que el propio almacenamiento de objetos se ejecute en el contenedor para que pueda gestionar la automatización de la infraestructura. Por tanto, al emplear el almacenamiento de objetos, Kubernetes puede organizar la infraestructura en un entorno portátil sin estado.
Soluciones de almacenamiento de objetos de HPE
A medida que se han multiplicado los casos de uso para el almacenamiento de objetos, también lo ha hecho la necesidad de HPE de ampliar su oferta de soluciones.
Soluciones HPE para Scality representa la opción preferida para el almacenamiento de objetos general, e incluye:
- Alternativa local al almacenamiento en la nube pública desde una reducción masiva hasta un extremo de nodo único
- Medios y repositorio de datos listo para compartir
- Almacenamiento de siguiente nivel para descarga de datos, por ejemplo, Splunk SmartStore, imágenes médicas y archivo de HPC
- Almacenamiento objetivo de copia de seguridad empresarial simple
HPE Ezmeral Data Fabric es la solución preferida para cargas de trabajo de análisis, IA y ML que requieren alto rendimiento y amplia escalabilidad. Algunos ejemplos de estos casos de uso incluyen: análisis, investigación, Internet de las cosas (IoT) e información empresarial. HPE Ezmeral Data Fabric constituye la primera solución que ha unificado archivos, objetos, bases de datos NoSQL y flujos en un solo sistema de archivos e infraestructura de datos unificada a través de entornos locales, multinube y en el extremo. Ello permite que las aplicaciones y los usuarios accedan directamente a datos de confianza con independencia de donde residan.