Articles

Comment surmonter les défis de l’utilisation de Data Vault

Quels sont les DÉFIS?

De la flexibilité à l’évolutivité et à l’efficacité, l’utilisation de Data Vault comme approche de modélisation des données présente de nombreux avantages. Mais simultanément, il y a des défis dont vous devez être conscient. Dans ce blog, je vais vous guider à travers les limites et comment vous pouvez les surmonter.

L’approche Data Vault prend lors de la modélisation des données (quelque chose que je vais détailler plus bas) entraîne une quantité significativement plus grande d’objets de données par rapport aux autres approches. Ces objets incluent des éléments tels que des tables et des colonnes, et la raison pour laquelle il y en a tant d’autres est que Data Vault sépare les types d’informations.

En conséquence, l’effort de modélisation initial peut être plus important pour tenir compte des avantages qui en résultent – mentionnés ci–dessus – comme résultat final. Cela signifie également que pendant le processus de modélisation, il peut y avoir un plus grand nombre de tâches manuelles ou mécaniques impliquées pour établir le modèle de données flexible et détaillé avec tous ses composants.

Comment remédier à ces limitations ?

Pour éviter les tâches manuelles fastidieuses pendant le processus de modélisation, les architectes peuvent automatiser des parties du modèle, ce qui rend plus efficace la création, la mise à jour et la maintenance à long terme.

Comment peuvent-ils faire cela?

Dans l’approche Data Vault, il existe certaines couches de données. Celles-ci vont des systèmes sources d’où proviennent les données, à une zone intermédiaire où les données arrivent du système source, modélisées selon la structure d’origine, à l’entrepôt de données principal, qui contient le coffre-fort brut, une couche qui permet de remonter aux données du système source d’origine, et le coffre-fort métier, une couche sémantique où les règles métier sont implémentées. Enfin, il existe des data marts, qui sont structurés en fonction des exigences de l’entreprise. Par exemple, il pourrait y avoir un marché de données financières ou un marché de données marketing, détenant les données pertinentes à des fins d’analyse.

Parmi ces couches, la zone de stockage et le coffre-fort brut sont les mieux adaptés à l’automatisation.

Quelles sont les caractéristiques du chargement…modélisation du coffre de données ?

Le chargement…la technique de modélisation data vault apporte une flexibilité ultime en séparant les clés métier, qui identifient de manière unique chaque entité métier et ne changent pas souvent, de leurs attributs. Cela se traduit, comme mentionné précédemment, par de nombreux autres objets de données dans le modèle, mais fournit également un modèle de données qui peut être très réactif aux changements, tels que l’intégration de nouvelles sources de données et de règles métier.

La structure de base du modèle provient des clés commerciales et des relations entre elles. Leur nature stable fournit l’ingrédient clé d’un modèle de données robuste, mais signifie également que les clés doivent être choisies avec soin, car elles constituent la base même à partir de laquelle tout le reste est dérivé.

Hubs

Les tables contenant les clés métier sont appelées hubs dans l’approche data vault. En plus de stocker les clés, les concentrateurs contiennent également des clés de substitution et des métadonnées pour chaque clé métier. Enfin, la source de chaque clé commerciale peut également être trouvée dans le hub, de sorte que les informations puissent être retracées jusqu’à leurs origines.

Liens

Les tables de liaison sont des tables de jointure multiples qui connectent différentes clés métier. Dans les tables de liens, les informations que vous trouverez sont les clés de substitution pour les concentrateurs connectés via le lien, ainsi que la clé de substitution pour le lien et les métadonnées sur l’origine de l’association.

Satellites

Une fois les hubs et les liaisons en place, la structure du modèle de coffre de données est mise en place. Cependant, il ne contient pas encore d’attributs. C’est là que les satellites entrent en jeu. Les tables satellites contiennent des métadonnées qui les connectent à leurs concentrateurs parents et à leurs tables de liaison. Ils contiennent également des métadonnées sur l’origine des attributs, ainsi que des attributs temporels. Cela signifie que grâce aux satellites, les architectes de données peuvent s’assurer que l’historique est enregistré à n’importe quel intervalle, tout en fournissant une piste d’audit et une traçabilité jusqu’au système source.

Comment fonctionne Data Vault avec Exasol ?

Dans Exasol, vous disposez d’une base de données qui vous permet de travailler de manière flexible avec une pléthore d’outils et de méthodologies afin que vous puissiez choisir la bonne approche pour votre entreprise et votre stratégie analytique globale.

Exasol vous accompagne pleinement dans le choix de la technique de modélisation de données qui correspond le mieux à votre stratégie. Cela signifie que vous pouvez facilement bénéficier des avantages de Data Vault.

Nous avons des partenaires tels que Datavault Builder et Wherescape qui ont créé des outils de modélisation de données et d’automatisation d’entrepôt qui s’intègrent sans effort à la base de données Exasol.

Vous pouvez également construire votre modèle de données directement dans notre base de données, en utilisant notre framework UDF.

Apporter les performances d’Exasol à votre Data Vault données modélisées

La modélisation de vos données dans Data Vault peut entraîner l’exécution de requêtes SQL complexes dans votre entrepôt de données. L’architecture et la conception pure d’Exasol garantissent que les performances exceptionnelles que nous vous promettons sont maintenues tout au long du cycle de vie des données, y compris vos processus de modélisation et d’entreposage des données.

Vous pouvez auditer et reproduire les résultats des requêtes historiques rapidement et efficacement, tout en chargeant tous vos volumes de données importants dans l’entrepôt et inviter vos analystes et data scientists à exécuter leurs flux de travail, analyses et modèles analytiques directement dans l’entrepôt de données sans sacrifier la rapidité et la fiabilité.

Nos partenariats avec Datavault Builder et Wherescape se concentrent sur l’amélioration de l’expérience utilisateur à chaque nouvelle version, c’est pourquoi nous prenons vos commentaires et travaillons conjointement au développement et à l’intégration continus de nos produits respectifs.

En interne, nous utilisons Datavault Builder pour le développement de notre propre entrepôt de données et vous pouvez regarder cette vidéo pour avoir une idée de notre partenariat avec l’équipe de Datavault Builder.

Où aller d’ici ?

Si vous voulez commencer tout de suite, vous êtes au bon endroit. Le moyen le plus simple de tester les choses est d’utiliser notre version d’essai de la base de données Exaspol et d’y charger certaines de vos propres données. Si vous avez déjà un modèle de données en place et que vous souhaitez tester ses performances dans Exasol, vous pouvez également le faire.

Pour suivre ces étapes, voici les ressources pertinentes:

  1. Téléchargez et installez notre essai gratuit ou configurez-vous avec un essai dans notre ExaCloud.
  2. Utilisez notre portail de documentation si vous avez besoin d’aide pour vous connecter à vos outils existants, par exemple Datavault Builder.
  3. Rejoignez notre communauté en ligne où vous pouvez obtenir de l’aide et des conseils, apprendre de nouveaux trucs et vous connecter avec des personnes partageant les mêmes idées. De plus, vous pouvez entrer en contact avec nos employés et nous faire savoir comment vous allez pendant votre essai.

Nous sommes impatients de travailler avec vous et de vous aider à réussir le chargement…Modélisation du coffre de données dans Exasol.

Eva Murray, Évangéliste de la technologie, Exasol