Features Workbench | Zakra Minimal Portfolio

De data bench als datawarehouse manager

De data bench kent standaard “topologiën” ofwel gegevenslagen van een datawarehouse. Denk aan staging, datamars of hubs, links en satellieten van een Data Vault of ensemble model. Het product voorziet elk datawarehouse object van consistente kenmerken, zoals wanneer de data voor het eerste of laatst gezien is, welk proces verantwoordelijk is voor de totstandkoming en welke voor life-cycle management om wat te noemen.

Met behulp van zgn ‘metadata bridges’ of door handmatige import is het mogelijk een metadata repository op te bouwen van alle beschikbare bronsystemen. Impact en lineage analyses worden zo wel heel erg eenvoudig. Deze repository is doorzoekbaar op alle kenmerken en wordt in de navigatieboom volledig weergegeven.

Op basis van deze kenmerken is de manager in staat om alle technische import en conversie uit te voeren volgens vooropgestelde stappenplannen, inclusief audit trail en lineage. Alle acties zijn gebaseerd op templates. De resulterende commando’s worden uitgevoerd op de plek waar de data zich begeeft.

Wizards om acties te automatiseren

De DWH workbench is een voorgeconfigureerde data bench en is in staat om grote delen van het ontwikkel- en beheerproces van een datawarehouse uit handen te nemen. Alle code die verantwoordelijk is voor data-logistiek wordt gegenereerd, altijd en volledig.

Toevoegen van nieuwe bronobjecten aan een datawarehouse
Data Vault / model manipulaties
Toevoegen van een nieuwe datamart
Doelmodel genereren aan de hand van input data
Deploy objecten (tabellen, views, procs)
Voer complexe actie uit over meerdere tabellen (Bulk action on tables)

Laadstrategien

Elke laadstrategie is mogelijk, maar standaard worden voor elke mapping of transformatie een standaard laadstrategie meegeleverd. Zo wordt een staging tabel standaard leeggemaakt, alvorens nieuwe data wordt ingelezen. Deze strategie kan desgewenst worden aangepast, per tabel en zelfs per transformatie.

Een strategie bestaat uit een vast aantal opeenvolgende stappen die op een mapping (bron naar doeltabel) wordt uitgevoerd. Elke stap wordt gedefinieerd aan de hand van een templates. Het systeem bevat een groot aantal standaard templates. Door deze te kopiëren kunt U eigen varianten maken die beter aansluiten bij Uw standaard ontwikkel en laadprocessen.

Data profileren

Zodra een tabel is geopend, is het mogelijk om hiervan een profile aan te maken. De profiler doorzoekt van elk attribuut de voorkomens; minimale, maximale waardes, hoe vaak deze leeg is, wat de uniciteit graag is en houdt ook statistieken van voorkomens bij.

Toegankelijkheid

Met een Office Ribbon menu hoeft de gebruiker niet lang te zoeken naar de menuopties van het systeem. Alleen de menu’s die betrekking hebben op een geselecteerd object worden getoond.

Zo kent een tabel de volgende functies:

Deployen van de tabel
Maak er een satelliet, een hub, een hub/satelliet, een dimensie of een feit van
Vernietig alle voorkomens ervan in de repository
Vernietig het database object
Genereer relaties aan de hand van naamgeving en business keys

Automatische lookups

Door zogenaamde business keys toe te voegen aan de repository, “begrijpt” de applicatie steeds meer van de data. Daarnaast bieden businesskeys de mogelijkheid tot centrale registratie van de identificatie methode van entiteiten. Bij een wijziging ervan, zal alles consistent kunnen worden meegenomen. Ook worden modellen (feiten) hiermee automatisch verbonden aan dimensies, zonder dat de gebruiker hier handmatig werk voor moet uitvoeren.

Verander de laad eigenschappen van een relatie en genereer de ETL opnieuw. Vanaf dat moment houdt de ETL rekening met onbekende en/of lege verwijzingen in een brontabel.