Articles

Cómo superar los desafíos de usar Data Vault

¿Cuáles son los DESAFÍOS?

Desde la flexibilidad hasta la escalabilidad y la eficiencia, el uso de Data Vault como su enfoque de modelado de datos tiene muchos beneficios. Pero, al mismo tiempo, hay desafíos que debes tener en cuenta. En este blog voy a guiarte a través de las limitaciones y cómo puedes superarlas.

El enfoque que toma el almacén de datos al modelar datos (algo que analizaré en detalle más adelante) da como resultado una cantidad significativamente mayor de objetos de datos en comparación con otros enfoques. Estos objetos incluyen cosas como tablas y columnas y la razón por la que hay tantos más es porque Data Vault separa los tipos de información.

Como consecuencia, el esfuerzo de modelado inicial puede ser mayor para acomodar los beneficios resultantes, mencionados anteriormente, como resultado final. También significa que durante el proceso de modelado puede haber un mayor número de tareas manuales o mecánicas involucradas para establecer el modelo de datos flexible y detallado con todos sus componentes.

¿Cómo se pueden abordar estas limitaciones?

Para evitar tareas manuales que consumen mucho tiempo durante el proceso de modelado, los arquitectos pueden automatizar partes del modelo, lo que hace que sea más eficiente crear, actualizar y mantener a largo plazo.

¿Cómo pueden hacer eso?

Dentro del enfoque de almacén de datos, hay ciertas capas de datos. Estos van desde los Sistemas de origen donde se originan los datos, hasta un Área de preparación donde llegan los datos del sistema de origen, modelados de acuerdo con la estructura original, hasta el Almacén de Datos Central, que contiene la bóveda sin procesar, una capa que permite rastrear los datos del sistema de origen original, y la bóveda de negocios, una capa semántica donde se implementan las reglas de negocio. Por último, hay data marts, que están estructurados en función de los requisitos del negocio. Por ejemplo, podría haber un mercado de datos financieros o un mercado de datos de marketing, que conserve los datos relevantes para fines de análisis.

De estas capas, el área de preparación y la bóveda sin procesar son los más adecuados para la automatización.

Cuáles son las características de la carga…¿modelado de bóveda de datos?

La Carga…la técnica de modelado de bóveda de datos aporta la máxima flexibilidad al separar las claves de negocio, que identifican de forma única a cada entidad de negocio y no cambian a menudo, de sus atributos. Esto resulta, como se mencionó anteriormente, en que hay muchos más objetos de datos en el modelo, pero también proporciona un modelo de datos que puede ser altamente sensible a los cambios, como la integración de nuevas fuentes de datos y reglas de negocio.

La estructura básica del modelo proviene de las claves de negocio y las relaciones entre ellas. Su naturaleza estable proporciona el ingrediente clave para un modelo de datos robusto, pero también significa que las claves deben elegirse cuidadosamente, ya que forman la base misma de la que se deriva todo lo demás.

Hubs

Las tablas que contienen las claves de negocio se denominan hubs en el enfoque de almacén de datos. Además de almacenar las claves, los concentradores también contienen claves sustitutivas y metadatos para cada clave de negocio. Por último, la fuente de cada clave de negocio también se puede encontrar en el hub, de modo que la información se pueda rastrear hasta sus orígenes.

Enlaces

Las tablas de enlaces son tablas de unión de muchos a muchos que conectan diferentes claves de negocio. En las tablas de enlaces, la información que encontrará son las claves sustitutivas para los concentradores conectados a través del enlace, así como la clave sustitutiva para el enlace y los metadatos sobre el origen de la asociación.

Satélites

Con los hubs y enlaces instalados, se configura la estructura del modelo de almacén de datos. Sin embargo, todavía no contiene ningún atributo. Aquí es donde entran los satélites. Las tablas satélite contienen metadatos que las conectan a sus centros primarios y enlazan tablas. También contienen metadatos sobre los orígenes de los atributos, así como atributos temporales. Esto significa que, gracias a los satélites, los arquitectos de datos pueden garantizar que el historial se registre en cualquier intervalo, al tiempo que proporcionan un seguimiento de auditoría y trazabilidad hasta el sistema de origen.

¿Cómo funciona Data Vault con Exasol?

En Exasol tiene una base de datos que le permite trabajar de manera flexible con una gran cantidad de herramientas y metodologías para que pueda elegir el enfoque correcto para su negocio y estrategia de análisis global.

Exasol le apoya plenamente en la elección de la técnica de modelado de datos que mejor se adapte a su estrategia. Esto significa que puede beneficiarse fácilmente de las ventajas que aporta Data Vault.

Tenemos socios como Datavault Builder y Wherescape que han creado herramientas de modelado de datos y automatización de almacenes que se integran sin esfuerzo con la base de datos Exasol.

También puede crear su modelo de datos directamente en nuestra base de datos, utilizando nuestro marco UDF.

Llevar el rendimiento de Exasol a su almacén de datos Datos modelados

El modelado de sus datos en almacén de datos puede dar lugar a la ejecución de consultas SQL complejas en su almacén de datos. La arquitectura y el diseño puro de Exasol garantizan que el rendimiento excepcional que le prometemos se mantenga durante todo el ciclo de vida de los datos, y eso incluye sus procesos de modelado y almacenamiento de datos.

Puede auditar y reproducir resultados de consultas históricas de forma rápida y eficiente, al mismo tiempo que carga todos sus grandes volúmenes de datos en el almacén e invita a sus analistas y científicos de datos a ejecutar sus flujos de trabajo, análisis y modelos analíticos directamente en el almacén de datos sin sacrificar la velocidad y la fiabilidad.

Nuestras asociaciones con Datavault Builder y Wherescape se centran en mejorar la experiencia del usuario con cada nueva versión, por lo que tomamos sus comentarios y trabajamos conjuntamente en el desarrollo e integración continuos de nuestros productos respectivos.

Internamente, hemos estado utilizando Datavault Builder para nuestro propio desarrollo de almacén de datos y puede ver este video para obtener una impresión de nuestra asociación con el equipo de Datavault Builder.

¿A dónde ir desde aquí?

Si desea comenzar de inmediato, ha venido al lugar correcto. La forma más fácil de probar las cosas es usar nuestra versión de prueba de la base de datos Exasol y cargar algunos de sus propios datos en ella. Si ya tiene un modelo de datos en su lugar y desea probar cómo funcionaría en Exasol, también puede hacerlo.

Para seguir estos pasos, aquí están los recursos relevantes:

  1. Descargue e instale nuestra versión de prueba gratuita o configure con una versión de prueba en nuestro ExaCloud.
  2. Utilice nuestro portal de documentación si necesita ayuda para conectarse a sus herramientas existentes, por ejemplo, Datavault Builder.
  3. Únete a nuestra comunidad en línea, donde puedes obtener ayuda y consejos, aprender nuevos trucos y conectarte con personas de ideas afines. Además, puede ponerse en contacto con nuestra gente y hacernos saber cómo lo está haciendo durante su juicio.

esperamos trabajar con usted y ayudarle a tener éxito con la Carga…Modelado de bóveda de datos en Exasol.

Eva Murray, Evangelista de Tecnología, Exasol