Plataforma de datos en la nube

¿Qué es una plataforma de datos en la nube?

Una plataforma de datos en la nube es un centro de datos que está ubicado en la nube, y que incluye un servidor y almacenamiento de datos. Proporciona acceso virtual a los datos desde numerosos orígenes en distintas ubicaciones.

¿Qué hace una plataforma de datos en la nube?

Uno de los pasos de la transformación digital de una organización implica migrar su ecosistema de datos y sus datos empresariales a la nube desde sus centros de datos y almacenes locales tradicionales. Una plataforma de datos en la nube es el lugar donde se reubican estos recursos, lo que permite a las empresas crear un lago de datos al que se puede acceder donde y cuando sea. Con esta «democratización» de los datos, se pueden ingerir rápidamente tanto datos estructurados como desestructurados para alimentar la capacidad de análisis. Además, la plataforma permite escalar rápidamente a medida que se producen cambios en las necesidades relacionadas con los datos y el análisis.

¿Por qué usan las empresas plataformas de datos en la nube?

Al usar una plataforma de datos en la nube, las empresas logran una forma más sencilla de sacarle el máximo provecho a sus datos. Permite que los datos se puedan gestionar, proteger y consultar desde cualquier ubicación, tanto en remoto como localmente. Estas plataformas de datos virtuales ofrecen la fiabilidad de un almacén de datos local a un precio con el que el hardware físico no puede competir. Las organizaciones utilizan estas plataformas para obtener un intercambio de datos mucho más flexible, lo que les permite adoptar decisiones empresariales mucho más informadas.

Elasticidad de la plataforma de datos en la nube

Las plataformas de datos en la nube son bastante más elásticas que sus homólogas locales y proporcionan una visión integrada de los datos alojados en la plataforma. Estas plataformas permiten una visibilidad total de todo lo que se esté ejecutando en ellas, incluida la utilización de la CPU y la memoria, así como información sobre qué solicitudes se están procesando y cómo se pueden optimizar. 

Los datos se almacenan en clústeres y mediante la observación del comportamiento real de las cargas de trabajo, una empresa puede ampliar o reducir un clúster para evitar la infrautilización de la capacidad.

Pasar a una plataforma de datos en la nube

Para los directores de información a menudo es complicado anticipar los picos de uso de sus empresas, lo que hace muy probable que sobreaprovisionen sus almacenes de datos para evitar problemas de rendimiento. Como consecuencia, la opción de modernizar los recursos de datos y trasladarlos a una plataforma de datos en la nube que permite escalar rápidamente parece algo claramente beneficioso. 

Sin embargo, muchos directores de información se resisten a ceder después de más de seis décadas ejecutando y manteniendo sus cargas de trabajo en el entorno local. Para no perder el control de sus datos, las empresas tienen que realizar un análisis de los costes y beneficios en el caso de un posible traslado a una plataforma de datos en la nube. Fundamentalmente, tienen que decidir si el coste de la migración y de las nuevas licencias compensa el coste del sobreaprovisionamiento y de las operaciones a largo plazo.

¿Cómo es la arquitectura de una plataforma de datos en la nube?

Una plataforma de datos típica está compuesta por muchos componentes que se encargan de controlar distintos aspectos de la gestión de datos. La arquitectura se compone de las siguientes capas:

  • Linaje de datos
  • Seguridad de los datos y registro de auditorías
  • Metadatos, glosario empresarial, catálogo de datos y búsqueda de datos
  • Almacenamiento y computación
  • Gobernanza de datos
  • Calidad y fiabilidad de los datos

La nube en sí misma permite a los usuarios desacoplar todos los componentes de las plataformas de datos, lo que ayuda a las empresas a escalar las aplicaciones y evitar los bloqueos por las herramientas exclusivas de algún proveedor. Además, la mayoría de proveedores de plataformas de datos en la nube separan la computación y el almacenamiento para tener un mejor control y una mayor agilidad. 

Primero se importan los datos, para después limpiarse en canalizaciones de datos. En cuanto al almacenamiento, las plataformas de datos en la nube almacenan datos en dos niveles: uno para los datos de acceso frecuente y otro para los datos inactivos. El primer nivel es la memoria, donde se guardan el índice de datos y los datos de acceso más frecuente. El segundo nivel es el disco local, o disco persistente (con frecuencia un disco de estado sólido), que normalmente se corresponde con el almacenamiento básico de objetos en la nube. Por lo general, este nivel tiene un rendimiento más lento.

Para almacenar datos, la plataforma de datos en la nube escribe primero las actualizaciones en el nivel de memoria más rápido y, después, las copia en el nivel de almacenamiento de objetos en la nube para ayudar a mejorar el rendimiento general. Cuando se solicitan datos, el nivel de acceso frecuente los extrae del nivel de datos inactivos, y los analiza a un nivel granular y muy profundo, lo que facilita el camino hacia la obtención de información fundamental para el negocio.

¿CUÁLES SON LAS VENTAJAS Y DESVENTAJAS DE LAS PLATAFORMAS DE DATOS EN LA NUBE?

Debido a la fluctuación de las cargas de trabajo y al constante incremento del volumen de datos desestructurados, la presión para modernizar la TI aumenta. Sin embargo, las organizaciones necesitan considerar cuidadosamente si incorporan y cómo incorporan la infraestructura de la nube, como plataformas de datos en la nube, en sus ecosistemas de TI. 

Ventajas

  • Flexibilidad: a medida que evolucionan las necesidades de los datos y su análisis, las plataformas de datos en la nube permiten ampliar o reducir la capacidad de forma rápida y sencilla.
  • Visibilidad: las plataformas de datos en la nube ingieren rápidamente datos estructurados y desestructurados que permiten análisis más rápidos.
  • Acceso: mover recursos a la nube facilita la creación de un lago de datos para democratizarlos y compartirlos desde cualquier lugar y en cualquier momento.
  • Costes ajustados: en lugar de pagar por un sistema sobreaprovisionado, usar una plataforma de datos en la nube con su modelo basado en el consumo permite a las empresas pagar solo por lo que usan, mientras lo usan.

Desventajas

  • Utilización: la utilización del centro de datos puede cambiar rápidamente desde el uso de toda su capacidad a solo dos tercios de uso, a medida que las cargas de trabajo se trasladan a la nube. Poder eliminar el ciclo de actualizaciones de un solo servidor ya daría lugar a ese escenario.
  • Complejidad: el traslado de las cargas de trabajo puede aumentar la complejidad de las operaciones de TI; las decisiones para moverlas se hacen caso por caso, en base a cambios en las prioridades o el portfolio de la empresa y a modificaciones en las cargas de trabajo.
  • Aumento de la presión para cumplir con la normativa: las regulaciones sobre privacidad y residencia de los datos siguen evolucionando, lo que hace que la necesidad de mover cargas de trabajo resulte variable.

¿Cómo se usan las plataformas de datos en la nube?

La naturaleza elástica de las plataformas de datos en la nube hace que sean la herramienta ideal para dar respuesta a los cambios de las cargas de trabajo, los objetivos de la empresa y del mercado. Pero, ¿cómo las usan exactamente las empresas? A continuación puedes ver algunos casos de uso:

  • Consolidación de datos: en lugar de tener que usar varias hojas de cálculo y otras fuentes de datos de archivo plano, los analistas utilizan plataformas de datos en la nube para crear un «almacén departamental de datos». Allí, de forma sencilla, pueden cargar y optimizar datos procedentes de diversas fuentes para su análisis y para la obtención de conocimientos prácticos.
  • Conocimientos operativos: los datos que se encuentran en una plataforma de datos en la nube se pueden integrar con facilidad en aplicaciones fundamentales para el negocio, lo que es una forma sencilla de operacionalizar e incorporar los resultados en las aplicaciones para permitir tomar decisiones basadas en los datos.
  • Análisis versátil: todos los analistas de datos tienen sus herramientas favoritas, en particular de código abierto, que pueden ser incompatibles con plataformas de datos fijos. Las plataformas de datos en la nube ofrecen una interoperatividad absoluta, lo que permite a los suscriptores conectar sus propias herramientas y usarlas en de la plataforma. De esta forma, pueden migrar la información obtenida a otra herramienta, si fuese necesario, y evitar así la dependencia del proveedor.
  • Procesamiento de datos de transmisión: una plataforma de datos en la nube combina las características de un lago de datos y de un almacén de datos para procesar datos de transmisión y otros datos desestructurados de la empresa, lo que posibilita el aprendizaje automático (ML).

HPE y las plataformas de datos en la nube

Las organizaciones se enfrentan a numerosos desafíos en cuanto a la gestión de sus datos: no solo cómo optimizar las cargas de trabajo de datos en la nube, sino también cómo optimizarlas en entornos híbridos que abarcan el extremo, el centro de datos y una infraestructura con una o varias nubes. HPE ofrece una plataforma edge-to-cloud para que sus usuarios puedan ejecutar aplicaciones y servicios en el entorno local y en la nube, así como servicios para gestionar la carga de trabajo. Por ejemplo, en el creciente portfolio de servicios de nube HPE GreenLake se incluyen:

  • Análisis: servicios de análisis en la nube abiertos y unificados para modernizar todos los datos y aplicaciones en cualquier lugar, ya estén en el entorno local, en el extremo o en la nube.
  • Protección de datos: servicios en la nube de recuperación ante desastres y copia de seguridad para ayudar a los clientes a hacer frente al ransomware y proteger sus datos desde el extremo hasta la nube.
  • Marco de adopción edge-to-cloud de HPE y herramientas de automatización: un conjunto completo y probado de metodologías, experiencia y herramientas de automatización para acelerar y eliminar los riesgos hacia una experiencia en la nube en todas partes.
  • Almacén de objetos de HPE Ezmeral Data Fabric: una tecnología de almacenamiento basada en Kubernetes que funcionará en todos los entornos híbridos. Permite a los usuarios combinar distintos tipos de datos procedentes de archivos, flujos de eventos de objeto y bases de datos dentro de la misma estructura de datos.

También se ha presentado recientemente HPE Ezmeral Unified Analytics, una plataforma data lake house en la nube creada con un grupo de tecnologías de código abierto que proporcionan una estructura de datos para que los usuarios puedan realizar análisis de datos y ejecutar cargas de trabajo de inteligencia empresarial sin quedarse bloqueados con las tecnologías de un proveedor concreto.