Plateforme de données cloud
Qu’est-ce qu’une plateforme de données cloud ?
Une plateforme de données cloud est un datacenter situé sur le cloud, comprenant un serveur et un stockage de données. Elle fournit un accès virtualisé aux données provenant de plusieurs sources dans plusieurs emplacements.
Que fait une plateforme de données cloud ?
Une étape dans la transformation numérique d’une organisation consiste à faire migrer son écosystème de données et ses données d’entreprise vers le cloud depuis ses datacenters ou entrepôts traditionnels sur site. Une plateforme de données cloud est l’emplacement où ces ressources sont relocalisées, permettant aux entreprises de créer un lac de données accessible n’importe où, n’importe quand. Avec ces données « démocratisées », les données structurées et non structurées peuvent être rapidement ingérées pour renforcer l’analyse. La plateforme peut également évoluer rapidement à mesure que les besoins en matière de données et d’analyse changent.
Pourquoi les entreprises utilisent-elles une plateforme de données cloud ?
En utilisant une plateforme de données cloud, les entreprises bénéficient d’un moyen plus simple d’exploiter leurs données. Elle permet aux données d’être gérées, sécurisées et visualisées depuis n’importe où, à la fois à distance et sur site. Ces plateformes de données virtuelles assurent la fiabilité d’un entrepôt de données sur site à un niveau d’accessibilité que le matériel physique ne peut égaler. Les organisations utilisent ces plateformes pour obtenir un échange de données beaucoup plus flexible, ce qui permet ensuite de prendre des décisions commerciales plus éclairées.
Élasticité de la plateforme de données cloud
Les plateformes de données cloud sont beaucoup plus élastiques que leurs homologues sur site et offrent une vue intégrée des données hébergées sur la plateforme. Ces plateformes permettent une observabilité complète de tout ce qui s’y exécute, y compris l’utilisation du processeur et de la mémoire, et offrent un aperçu des requêtes en cours d’exécution et de la manière dont elles peuvent être optimisées.
Les données sont stockées dans des clusters. En observant le comportement réel des charges de travail, une entreprise peut développer ou réduire un cluster pour éviter d’avoir une capacité sous-utilisée.
Passer à une plateforme de données cloud
Les DSI ont souvent du mal à prévoir les pics d’utilisation de leur entreprise, ce qui les rend enclins à surprovisionner leurs entrepôts de données pour éviter les problèmes de performances. Par conséquent, il semble indéniablement bénéfique de moderniser les ressources de données et de les déplacer vers une plateforme de données cloud capable d’évoluer rapidement.
De nombreux DSI rechignent toutefois à abandonner plus de six décennies d’exécution et de maintenance de leurs charges de travail sur site. Or, pour conserver le contrôle de leurs données, les entreprises doivent effectuer une analyse coûts-avantages d’un éventuel passage à une plateforme de données cloud. Fondamentalement, ils doivent décider si le coût de la migration et des nouvelles licences l’emporte sur celui du surprovisionnement et des opérations à long terme.
Quelle est l’architecture d’une plateforme de données cloud ?
Une plateforme de données typique est composée de plusieurs composants qui gèrent différents aspects de la gestion des données. L’architecture se décline en plusieurs couches :
- Origine des données
- Sécurité des dates et journalisation des audits
- Métadonnées, glossaire métier, catalogue de données et recherche de données
- Stockage et calcul
- Gouvernance des données
- Qualité des données et confiance dans les données
Le cloud lui-même permet aux utilisateurs de découpler tous les composants de leurs plateformes de données, ce qui aide les entreprises à faire évoluer leurs applications et leur évite de se retrouver enfermées dans les outils propriétaires d’un fournisseur. La plupart des fournisseurs de plateformes de données cloud séparent le calcul et le stockage pour un meilleur contrôle et une meilleure agilité des données.
Les données sont d’abord importées puis nettoyées dans des pipes de données. En ce qui concerne le stockage, les plateformes de données cloud stockent les données sur deux niveaux : l’un pour les données «∘à chaud∘» (actives) et l’autre pour les données en veille. Le premier niveau est la mémoire où sont conservés l’index de données et les données les plus fréquemment consultées. Le deuxième niveau est le disque local ou le disque persistant (souvent une baie SSD), qui est généralement un stockage d’objets cloud de base. Ce niveau offre généralement des performances plus lentes.
Pour stocker les données, la plateforme de données cloud écrit d’abord les mises à jour dans le niveau de mémoire le plus rapide, puis elle les copie dans le niveau de stockage d’objets cloud pour améliorer les performances globales. La couche de données actives extrait les données de la couche de données en veille à la réception d’une requête, et les examine de façon très approfondie et granulaire, ce qui facilite le cheminement vers les informations stratégiques de l’entreprise.
QUELS SONT LES AVANTAGES ET LES INCONVÉNIENTS DES PLATEFORMES DE DONNÉES CLOUD ?
Alors que les charges de travail fluctuent et que le volume de données non structurées continue d’augmenter, la pression pour moderniser l’informatique s’accélère. Cependant, les organisations doivent examiner attentivement si et comment intégrer l’infrastructure cloud, telles que les plateformes de données cloud, dans leur écosystème informatique.
Avantages
- Flexibilité : À mesure que les besoins en matière de données et d’analyses évoluent, les plateformes de données cloud peuvent faire évoluer leur capacité rapidement et facilement.
- Visibilité : Les plateformes de données cloud ingèrent rapidement les données structurées et les données non structurées qui permettent une analyse plus rapide.
- Accès : Le déplacement des ressources vers le cloud facilite la création d’un lac de données pour démocratiser les données et les partager n’importe où et n’importe quand.
- Coûts adaptés : Plutôt que de payer pour un système surdimensionné, le recours à une plateforme de données cloud avec un modèle à la demande permet aux entreprises de ne payer que ce qu’elles utilisent, et ce au fur et à mesure de leur utilisation.
Inconvénients
- Utilisation : L’implémentation d’un datacenter peut rapidement passer de la pleine capacité aux deux tiers de l’utilisation lorsque les charges de travail sont déplacées vers le cloud. Pour créer ce scénario, il suffit de supprimer un seul cycle d’actualisation du serveur.
- Complexité : Le déplacement des charges de travail peut accroître la complexité des opérations informatiques. Les décisions d’accélération/de ralentissement sont prises au cas par cas en raison de changements de priorité ou de l’évolution des portefeuilles et des charges de travail de l’entreprise.
- Pression de conformité accrue : Les réglementations sur la confidentialité des données et la résidence des données continuent d’évoluer, ce qui fait fluctuer la nécessité de déplacer les charges de travail.
Comment les plateformes de données cloud sont-elles utilisées ?
La nature élastique des plateformes de données cloud en fait un outil idéal pour répondre à l’évolution des charges de travail, des objectifs métier et des marchés. Mais comment précisément les entreprises les utilisent-elles ? Lisez ci-dessous quelques cas d’utilisation :
- Consolidation des données : Plutôt que d’utiliser plusieurs feuilles de calcul et d’autres sources de données de fichiers plats, les analystes utilisent des plateformes de données cloud pour créer un « data mart ». Là, elles peuvent facilement charger et optimiser des données provenant de plusieurs sources afin d’analyser et d’exploiter les informations utiles.
- Aperçu opérationnel : Les données sur une plateforme de données cloud peuvent être facilement intégrées à des applications stratégiques pour l’entreprise, offrant un moyen simple d’opérationnaliser les résultats et de les réinjecter dans les applications pour permettre des décisions basées sur les données.
- Analyse polyvalente : Les analystes de données ont tous leurs outils de prédilection, notamment des outils open source, qui peuvent être incompatibles avec des plateformes de données fixes. Les plateformes de données cloud offrent une interopérabilité complète, ce qui permet aux abonnés de brancher leurs propres outils et de les utiliser au sein de la plateforme. De cette façon, elles peuvent migrer les informations vers un autre outil si nécessaire et éviter l’enfermement propriétaire.
- Traitement des flux de données : Une plateforme de données cloud combine les capacités d’un lac de données et d’un entrepôt de données pour traiter les flux de données et d’autres données d’entreprise non structurées, permettant le machine learning (ML).
HPE et les plateformes de données cloud
Les organisations rencontrent de nombreux défis dans la gestion de leurs données, non seulement sur la manière d’optimiser des charges de travail de données sur le cloud, mais aussi dans des environnements hybrides dont l’infrastructure intègre l’edge, le datacenter, un cloud ou plusieurs. HPE propose une plateforme Edge to Cloud permettant aux utilisateurs d’exécuter des applications et des services sur site et dans le cloud, avec des services pour gérer la charge de travail. Par exemple, le portefeuille croissant de services cloud HPE GreenLake assure les fonctionnalités suivantes :
- Analyse : Des services cloud d’analyse ouverts et unifiés pour moderniser toutes les données et applications où qu’elles soient : sur site, dans l’edge ou dans le cloud.
- Protection des données : Des services cloud de sauvegarde et de reprise après incident pour aider les clients à lutter contre le ransomware et à sécuriser leurs données de l’edge au cloud.
- HPE Edge-to-Cloud Adoption Framework et des outils d’automatisation : un ensemble complet et éprouvé de méthodologies, de savoir-faire et d’outils d’automatisation pour accélérer le passage à une expérience cloud sur l’ensemble des emplacements et éliminer les risques associés.
- HPE Ezmeral Data Fabric Object Store : Une technologie de stockage basée sur Kubernetes qui fonctionne dans des environnements hybrides. Il permet aux utilisateurs de combiner différents types de données provenant de fichiers, de flux d’événements d’objets et de bases de données dans la même data fabric.
Récemment, HPE a également introduit Ezmeral Unified Analytics, une plateforme cloud de data lakehouse construite avec un groupe de technologies open source fournissant une data fabric aux utilisateurs souhaitant exécuter des analyses de données et des charges de travail d’informatique décisionnelle sans se retrouver enfermés dans les technologies d’un fournisseur unique.