Magasins de données

Qu’est-ce qu’un magasin de données ?

Un magasin de données est un référentiel permettant de stocker, de gérer et de distribuer des jeux de données.

Ce terme englobe tous les types de données qui sont produits, utilisés et stockés par les entreprises.

Quels sont les différents types de magasins de données ?

Voici les types courants de magasins de données :

Base de données relationnelle (BDR) – Type de magasin de données le plus durable et le plus fiable, la base de données relationnelle est la norme industrielle en matière de stockage fiable. Une base de données relationnelle organise les données en tables, chacune ayant un schéma qui définit les colonnes d’une table. Chaque ligne, représentant une entrée d’information, doit se conformer au schéma en ayant une valeur pour chaque colonne. En bref, un élément d’information se voit attribuer une valeur de schéma, ce qui permet d’établir et de maintenir une relation unique entre la valeur et l’information.

Base de données non relationnelle (NoSQL) – Il s’agit d’une base de données qui maintient la durabilité, la résilience, la persistance, la réplicabilité, la distribuabilité et la performance avec une application de schéma peu rigoureuse voire inexistante. Les bases de données NoSQL se classent dans deux grandes catégories : les magasins de documents et les magasins à colonnes larges.

· Magasin de documents – C’est un magasin clé-valeur où la clé n’est jamais utilisée. La valeur devient un blob de données semi-structurées, et le magasin de données est un grand tableau de blobs. Le langage du magasin de documents permet à un utilisateur de trier et de filtrer les données en fonction du contenu des blobs de documents.

· Magasin à colonnes larges (WCS, wide column store) – C’est essentiellement un magasin de documents hybride et une BDR. Bien qu’un WCS utilise des tableaux, des lignes et des colonnes, les noms et les formats des colonnes forment des lignes dans un seul tableau.

Solutions, produits ou services HPE connexes

Magasin de valeurs-clés – Il s’agit d’un hashmap à l’échelle de la production (un hashmap étant un mappage entre des clés et des valeurs). Ce type de magasin de données ne comporte aucun élément relationnel ou non relationnel, seulement des clés et des valeurs. Il permet de stocker temporairement des objets simples.

Moteur de recherche en texte intégral (FTSE, full-text search engine) – Techniquement, les FTSE sont des magasins de données NoSQL. Si les moteurs de recherche sont efficaces pour rechercher et filtrer des correspondances textuelles et des valeurs numériques exactes (les bases de données peuvent obtenir des résultats similaires), les FTSE sont idéaux pour rechercher des sous-chaînes ou des mots spécifiques dans des champs de texte plus longs.

File d’attente de messages – Bien qu’elles aient été conçues à l’origine pour le transfert de données, les files d’attente de messages sont aussi fiables que les types de magasins de données précédents. Une file d’attente de messages fonctionne comme un pseudo magasin de valeurs-clés, mais elle convient davantage lorsque vous devez temporairement stocker, mettre en file d’attente ou expédier des données.

Que comprend un magasin de données ?

Un magasin de données peut inclure des données provenant d’applications de bases de données d’utilisateurs finaux, de données aléatoires appartenant à une organisation ou à un système d’information, de fichiers ou de documents. Il peut être structuré, non structuré ou dans divers formats électroniques.

La classification d’un magasin de données dépend de l’entreprise. Un magasin de données peut être classé comme un magasin de données centralisé, opérationnel ou spécifique à une application, et peut être conçu et mis en œuvre en utilisant un logiciel spécialisé ou une application de base de données type.

HPE et les magasins de données

Un magasin de données unique est une idée logique. La meilleure façon d’exécuter un magasin de données unique est d’utiliser un déploiement logique. HPE Ezmeral est une idée logique : un magasin d’objets ouvert et performant, une base de données multimodale, une architecture mutualisée hybride et un espace de nom global unique.

Dans un seul magasin de données, HPE Ezmeral intègre des fichiers, des bases de données NoSQL, des objets et plusieurs types de flux de données provenant d’architectures cloud-native et de Big Data existants. Cela permet aux utilisateurs de raccourcir le temps d’accès aux informations, et de sécuriser le partage des données entre les applications et les outils d’analyse de données modernes et traditionnels.

Les topologies Edge to Cloud de HPE Ezmeral Data Fabric sont créées et accessibles via un espace de nom global unique, ce qui simplifie l’accès aux données depuis n’importe quelle application, quels que soient l’interface ou l’endroit où résident les données. La solution HPE Data Lakehouse est spécifiquement conçue non seulement pour effectuer de grandes quantités d’analyses de données structurées, mais aussi pour combiner les avantages d’évolutivité et de flexibilité de HPE Data Lake avec la gestion des données et les structures de HPE Data Warehouse.