Articles

Come superare le sfide dell’utilizzo di Data Vault

Quali sono le SFIDE?

Dalla flessibilità alla scalabilità e all’efficienza, l’utilizzo di Data Vault come approccio di modellazione dei dati ha molti vantaggi. Ma allo stesso tempo ci sono sfide che è necessario essere consapevoli di. In questo blog ho intenzione di camminare attraverso i limiti e come è possibile superarli.

L’approccio Data Vault prende quando si modellano i dati (qualcosa che entrerò in dettaglio più in basso) si traduce in una quantità significativamente maggiore di oggetti dati rispetto ad altri approcci. Questi oggetti includono cose come tabelle e colonne e il motivo per cui ce ne sono così tanti altri è perché Data Vault separa i tipi di informazioni.

Di conseguenza, lo sforzo di modellazione iniziale può essere maggiore per soddisfare i benefici risultanti-menzionati sopra – come risultato finale. Ciò significa anche che durante il processo di modellazione ci può essere un numero maggiore di compiti manuali o meccanici coinvolti per stabilire il modello di dati flessibile e dettagliato con tutti i suoi componenti.

Come possono essere affrontate queste limitazioni?

Per evitare lunghe operazioni manuali durante il processo di modellazione, gli architetti possono automatizzare parti del modello, rendendo più efficiente la creazione, l’aggiornamento e la manutenzione a lungo termine.

Come possono farlo?

All’interno dell’approccio Data Vault, ci sono alcuni livelli di dati. Questi vanno dai sistemi di origine in cui i dati hanno origine, a un’area di staging in cui i dati arrivano dal sistema di origine, modellati in base alla struttura originale, al Data Warehouse principale, che contiene il vault raw, un livello che consente di risalire ai dati del sistema di origine originale e il vault aziendale, un livello semantico in cui Infine, ci sono data mart, che sono strutturati in base alle esigenze del business. Ad esempio, potrebbe esserci un data mart finanziario o un data mart di marketing, contenente i dati pertinenti a fini di analisi.

Di questi livelli, l’area di staging e il vault raw sono più adatti all’automazione.

Quali sono le caratteristiche del Caricamento…modellazione di data vault?

Il caricamento…la tecnica di modellazione data vault offre la massima flessibilità separando le chiavi aziendali, che identificano in modo univoco ogni entità aziendale e non cambiano spesso, dai loro attributi. Ciò si traduce, come accennato in precedenza, in molti più oggetti dati presenti nel modello, ma fornisce anche un modello di dati che può essere altamente reattivo alle modifiche, come l’integrazione di nuove origini dati e regole aziendali.

La struttura di base del modello deriva dalle chiavi aziendali e dalle relazioni tra di esse. La loro natura stabile fornisce l’ingrediente chiave per un modello di dati robusto, ma significa anche che le chiavi devono essere scelte con attenzione, in quanto costituiscono la base stessa da cui tutto il resto è derivato.

Hub

Le tabelle che contengono le chiavi aziendali sono chiamate hub nell’approccio data vault. Oltre a memorizzare le chiavi, gli hub contengono anche chiavi surrogate e metadati per ogni chiave aziendale. Infine, la fonte di ogni chiave aziendale può anche essere trovata nell’hub, in modo che le informazioni possano essere ricondotte alle sue origini.

Collegamenti

Le tabelle di collegamento sono tabelle di join molti-a-molti che collegano chiavi aziendali diverse. All’interno delle tabelle di collegamento le informazioni che troverai sono le chiavi surrogate per gli hub collegati tramite il collegamento, così come la chiave surrogata per il collegamento e i metadati su dove l’associazione ha avuto origine.

Satelliti

Con gli hub e i collegamenti in posizione, viene impostata la struttura del modello data vault. Tuttavia, non contiene ancora alcun attributo. E ‘ qui che entrano in gioco i satelliti. Le tabelle satellite contengono metadati che le collegano agli hub padre e alle tabelle di collegamento. Contengono anche metadati sulle origini degli attributi, nonché attributi temporali. Ciò significa che grazie ai satelliti, i data architect possono garantire che la cronologia venga registrata a qualsiasi intervallo, fornendo al contempo una traccia di controllo e la tracciabilità del sistema di origine.

Come funziona Data Vault con Exasol?

In Exasol hai un database che ti consente di lavorare in modo flessibile con una pletora di strumenti e metodologie in modo da poter scegliere l’approccio giusto per il tuo business e la strategia di analisi generale.

Exasol ti supporta pienamente nella scelta della tecnica di modellazione dei dati che meglio si adatta alla tua strategia. Ciò significa che puoi facilmente beneficiare dei vantaggi offerti da Data Vault.

Abbiamo partner come Datavault Builder e Wherescape che hanno creato strumenti di modellazione dei dati e automazione del magazzino che si integrano senza sforzo con il database Exasol.

Puoi anche costruire il tuo modello di dati direttamente nel nostro database, usando il nostro framework UDF.

Portare le prestazioni di Exasol al Data Vault dati modellati

La modellazione dei dati in Data Vault può comportare l’esecuzione di query SQL complesse nel data warehouse. L’architettura e il design puro di Exasol assicurano che le prestazioni eccezionali che ti promettiamo siano mantenute durante l’intero ciclo di vita dei dati, inclusi i processi di modellazione e warehousing dei dati.

È possibile controllare e riprodurre i risultati delle query storiche in modo rapido ed efficiente, caricando al contempo tutti i grandi volumi di dati nel magazzino e invitando analisti e data scientist a eseguire i loro flussi di lavoro, analisi e modelli analitici direttamente nel data warehouse senza sacrificare velocità e affidabilità.

Le nostre partnership con Datavault Builder e Wherescape si concentrano sul miglioramento dell’esperienza utente con ogni nuova release, motivo per cui prendiamo il tuo feedback e lavoriamo congiuntamente al continuo sviluppo e integrazione dei nostri rispettivi prodotti.

Internamente, abbiamo utilizzato Datavault Builder per il nostro sviluppo di data warehouse e puoi guardare questo video per avere un’idea della nostra partnership con il team di Datavault Builder.

Dove da qui?

Se vuoi iniziare subito, sei arrivato nel posto giusto. Il modo più semplice per testare le cose è quello di utilizzare la nostra versione di prova del database Exasol e caricare alcuni dei propri dati in esso. Se si dispone già di un modello di dati e si desidera testare come si esibirebbe in Exasol, è possibile farlo anche.

Per passare attraverso questi passaggi, ecco le risorse rilevanti:

  1. Scarica e installa la nostra prova gratuita o ottieni l’installazione con una prova nel nostro ExaCloud.
  2. Utilizza il nostro portale di documentazione se hai bisogno di aiuto per connetterti agli strumenti esistenti, ad esempio Datavault Builder.
  3. Unisciti alla nostra comunità online dove è possibile ottenere aiuto e suggerimenti, imparare nuovi trucchi e connettersi con persone che la pensano. Inoltre, puoi metterti in contatto con la nostra gente e farci sapere come stai durante il processo.

Non vediamo l’ora di lavorare con te e di aiutarti ad avere successo con il caricamento…Modellazione di Data Vault in Exasol.

Eva Murray, Evangelista della tecnologia, Exasol