Articles

cum să depășim provocările utilizării seifului de date

care sunt provocările?

de la flexibilitate la scalabilitate și eficiență, utilizarea Data Vault ca abordare de modelare a datelor are multe beneficii. Dar, în același timp, există provocări de care trebuie să fiți conștienți. În acest blog am de gând să te plimbi prin limitările și modul în care le puteți depăși.

abordarea Data Vault ia atunci când modelarea datelor (ceva ce voi merge în detaliu pe mai jos) are ca rezultat o cantitate semnificativ mai mare de obiecte de date în comparație cu alte abordări. Aceste obiecte includ lucruri precum tabele și coloane, iar motivul pentru care există atât de multe altele se datorează faptului că seiful de date separă tipurile de informații.

în consecință, efortul de modelare în față poate fi mai mare pentru a se potrivi beneficiilor rezultate-menționate mai sus – ca rezultat final. De asemenea, înseamnă că în timpul procesului de modelare pot exista un număr mai mare de sarcini manuale sau mecanice implicate pentru a stabili modelul de date flexibil și detaliat cu toate componentele sale.

Cum pot fi abordate aceste limitări?

pentru a evita sarcinile manuale consumatoare de timp în timpul procesului de modelare, arhitecții pot automatiza părți ale modelului, făcând mai eficientă crearea, actualizarea și întreținerea pe termen lung.

cum pot face asta?

în abordarea seifului de date, există anumite straturi de date. Acestea variază de la sistemele sursă de unde provin datele, la o zonă de intermediere în care datele ajung din sistemul sursă, modelate în funcție de structura originală, la depozitul de date de bază, care conține seiful brut, un strat care permite urmărirea înapoi la datele sistemului sursă original și seiful de afaceri, un strat semantic în care sunt implementate regulile de afaceri. În cele din urmă, există marts de date, care sunt structurate pe baza cerințelor afacerii. De exemplu, ar putea exista un finance data mart sau un marketing data mart, care deține datele relevante în scopuri de analiză.

Din aceste straturi, zona de așteptare și bolta brută sunt cele mai potrivite pentru automatizare.

care sunt caracteristicile de încărcare…modelarea seifului de date?

încărcarea…tehnica de modelare a seifului de date aduce flexibilitate maximă prin separarea cheilor de afaceri, care identifică în mod unic fiecare entitate de afaceri și nu se schimbă des, de atributele lor. Acest lucru rezultă, așa cum am menționat mai devreme, în mai multe obiecte de date care se află în model, dar oferă și un model de date care poate fi foarte receptiv la schimbări, cum ar fi integrarea de noi surse de date și reguli de afaceri.

structura de bază a modelului vine de la cheile de afaceri și relațiile dintre ele. Natura lor stabilă oferă ingredientul cheie pentru un model de date robust, dar înseamnă, de asemenea, că cheile trebuie alese cu atenție, deoarece ele formează însăși baza din care derivă orice altceva.

hub-uri

tabelele care conțin cheile de afaceri se numesc hub-uri în abordarea seifului de date. Pe lângă stocarea cheilor, hub-urile conțin și chei surogat și metadate pentru fiecare cheie de afaceri. În cele din urmă, sursa fiecărei chei de afaceri poate fi găsită și în hub, astfel încât informațiile să poată fi urmărite până la originile sale.

link-uri

tabelele de Link-uri sunt tabele de conectare multi-La-mulți care conectează diferite chei de afaceri. În tabelele de legături, informațiile pe care le veți găsi sunt cheile surogat pentru hub-urile conectate prin link, precum și cheia surogat pentru link și metadatele despre locul de unde provine asocierea.

sateliți

cu hub-uri și link-uri în loc, structura modelului bolta de date este configurat. Cu toate acestea, nu conține încă atribute. Aici intervin sateliții. Tabelele satelit conțin metadate care le conectează la hub-urile părinte și la tabelele de legături. Ele conțin, de asemenea, metadate despre originile atributelor, precum și atributele temporale. Aceasta înseamnă că, datorită sateliților, arhitecții de date se pot asigura că istoricul este înregistrat la orice interval, oferind în același timp o pistă de audit și trasabilitate către sistemul sursă.

cum funcționează Seiful de date cu Exasol?

în Exasol aveți o bază de date care vă permite să lucrați flexibil cu o multitudine de instrumente și metodologii, astfel încât să puteți alege abordarea potrivită pentru afacerea dvs. și strategia generală de analiză.

Exasol vă sprijină pe deplin în alegerea tehnicii de modelare a datelor care se potrivește cel mai bine strategiei dvs. Aceasta înseamnă că puteți beneficia cu ușurință de avantajele pe care le aduce Data Vault.

avem parteneri precum Datavault Builder și Wherescape care au creat instrumente de modelare a datelor și automatizare a depozitelor care se integrează fără efort cu baza de date Exasol.

puteți construi, de asemenea, modelul de date direct în Baza noastră de date, folosind cadrul nostru UDF.

aducerea performanței Exasol la datele modelate din seiful de date

modelarea datelor dvs. în seiful de date poate duce la executarea unor interogări SQL complexe în depozitul dvs. de date. Arhitectura și designul pur al Exasol asigură faptul că performanțele remarcabile pe care vi le promitem sunt susținute pe parcursul întregului ciclu de viață al datelor și care includ procesele dvs. de modelare și depozitare a datelor.

puteți audita și reproduce rezultatele interogărilor istorice rapid și eficient, încărcând în același timp toate volumele mari de date în depozit și invitați analiștii și oamenii de știință de date să își ruleze fluxurile de lucru, analizele și modelele analitice direct în depozitul de date, fără a sacrifica viteza și fiabilitatea.

parteneriatele noastre cu Datavault Builder și Wherescape se concentrează pe îmbunătățirea experienței utilizatorului cu fiecare nouă versiune, motiv pentru care luăm feedback-ul dvs. și lucrăm împreună la dezvoltarea și integrarea continuă a produselor noastre respective.

pe plan intern, am folosit DataVault Builder pentru dezvoltarea propriului depozit de date și puteți viziona acest videoclip pentru a obține o impresie despre parteneriatul nostru cu echipa de la DataVault Builder.

unde de aici?

dacă doriți să începeți imediat, ați ajuns la locul potrivit. Cel mai simplu mod de a testa lucrurile este să folosiți versiunea noastră de încercare a bazei de date Exasol și să încărcați câteva date proprii în ea. Dacă aveți deja un model de date și doriți să testați cum ar funcționa în Exasol, puteți face și asta.

pentru a parcurge acești pași, iată resursele relevante:

  1. descărcați și instalați versiunea noastră de încercare gratuită sau obțineți configurarea cu o versiune de încercare în ExaCloud.
  2. utilizați portalul nostru de documentare dacă aveți nevoie de ajutor pentru a vă conecta la instrumentele existente, de exemplu, Datavault Builder.
  3. Alăturați-vă comunității noastre online, unde puteți obține ajutor și sfaturi, Aflați trucuri noi și conectați-vă cu oameni asemănători. În plus, puteți lua legătura cu oamenii noștri și să ne spui cum faci în timpul procesului.

așteptăm cu nerăbdare să lucrăm cu dvs. și să vă ajutăm să reușiți cu încărcarea…Modelarea seifului de date în Exasol.

Eva Murray, Evanghelist tehnologic, Exasol