Deduplicación de datos

¿Qué es la deduplicación de datos?

La deduplicación de datos es una técnica que minimiza el espacio requerido para almacenar datos. Se ha diseñado para ayudar a las organizaciones a abordar el problema de los datos duplicados. Con independencia de que una empresa acumule varias copias del mismo archivo o de varios archivos que contengan los mismos datos, la deduplicación sustituye las copias adicionales de datos con metadatos que simplemente apuntan al original.

¿Cómo funciona la deduplicación?

Existen dos métodos de deduplicación principales: deduplicación en línea y posprocesamiento. Se han diseñado para distintos tipos de entornos de copia de seguridad.

La deduplicación en línea analiza los datos en un sistema de copia de seguridad. Se identifican y eliminan las redundancias a medida que los datos se escriben en el almacenamiento de copia de seguridad. Ello requiere menos almacenamiento de copia de seguridad, pero puede producir cuellos de botella, por lo que se recomienda desactivar las herramientas de deduplicación de datos cuando se realicen funciones de almacenamiento primario de alto rendimiento.

La deduplicación de posprocesamiento elimina los datos redundantes una vez que se han escrito en el almacenamiento. Los datos duplicados se identifican, eliminan y sustituyen por un indicador dirigido a la primera iteración del bloque de datos. El enfoque de posprocesamiento permite a los usuarios deduplicar cargas de trabajo específicas y recuperar rápidamente la copia de seguridad más reciente.

La deduplicación de posprocesamiento requiere más capacidad de almacenamiento que la deduplicación en línea.

Soluciones, productos o servicios relacionados de HPE
Soluciones, productos o servicios relacionados de HPE

¿Por qué necesitamos la deduplicación de datos?

La deduplicación de datos ayuda a los departamentos de TI a reducir no solo los requisitos de espacio de almacenamiento, sino también los costes asociados con los datos duplicados. Los conjuntos de datos de gran tamaño a menudo presentan un enorme grado de duplicación, y ello incrementa los costes de almacenamiento. El ahorro de espacio que ofrece la deduplicación de datos depende del conjunto de datos o de la carga de trabajo presente en el volumen. Los conjuntos de datos con un alto grado de duplicación pueden lograr tasas de optimización de hasta el 95 %.

La deduplicación de datos también ayuda a reducir la cantidad de ancho de banda desperdiciada en la transferencia de datos desde y hacia los emplazamientos de almacenamiento remoto. Además, la capacidad de gestionar de forma efectiva los recursos de almacenamiento puede marcar la diferencia para las capacidades de tu copia de seguridad:

· Asignación de almacenamiento eficiente

· Ahorros de costes

· Optimización de redes

· Eficiencia de centros de datos

· Recuperación rápida y continuidad

HPE y la deduplicación de datos

No todas las soluciones de copia de seguridad abordan la deduplicación de la misma manera. Conoce tu infraestructura y los requisitos específicos de tu copia de seguridad. HPE puede ayudarte a eliminar las incertidumbres de la optimización de datos con una solución híbrida que proporciona un equilibrio entre las ventajas de la deduplicación de datos centrada en la copia de seguridad y la basada en objetivos a través de todo tu entorno de TI. Obtén más información acerca de HPE InfoSight y cómo puede ayudar a tu organización a lograr una experiencia de operaciones en la nube para la gestión de aplicaciones y datos, desde el extremo hasta la nube, con la inteligencia artificial más avanzada del sector para infraestructura, y garantizar que tu entorno no solo se encuentre siempre en funcionamiento, sino que también sea siempre rápido y ágil.