DW - Data Warehousing & Modeling

Normalize

Wanneer in een database alle herhalende waardes (op attribuut niveau) verwijderd werden door deze waardes op te nemen in andere tabellen.

Relationele OLTP systemen zijn meestal in hoge mate genormaliseerd. Data warehouses kennen typisch geen hoge graad van normalisatie.

Het normaliseren van data is een proces, origineel gedefinieerd door E.F. Codd en komt neer op het zodanig structureren van gegevens in verschillende tabellen zodat er geen redundantie of dubbele gegevens meer aanwezig zijn.

Level

Levels vormen een niveau binnen een hierarchie die een bepaald niveau van detail binnen de dimensie voorstellen.

Binnen een tijdshierarchie, hebben we bijvoorbeeld levels voor jaar, kwartaal, maand en dag.

Information discovery

Information Discovery, "het ontdekken van informatie" bevindt zich tussen het eigenlijke Performantie Management als proces en de beschikbare data-layer in een datawarehouse. Het laat beslissingsnemers toe om de data te benaderen, te navigeren, te analyseren, te formatteren en te delen binnen een organisatie. Het bestaat in de eerste plaats uit een business intellgence platform, met daarin componenten als query, analyse, rapportering en dashboards.

End user layer

De end user layer of eindgebruikerslaag is de gebruikers-interface binnen business intelligence tools. Hierbij wordt de technische laag (database-tabellen & relaties) logisch omgezet in een business laag, begrijpbaar voor de eindgebruiker.

Dimensional hierarchy

Een dimensionele hierarchie laat toe om de data te gebruiken of te begrijpen op verschillende niveaus van aggregatie. Een analyst kan een dimensionele hierarchie gebruiken om bepaalde trends te ontdekken op een bepaald niveau, daarna naar een lager niveau door te drillen om eventueel vast te stellen wat de eventuele redenen zijn voor deze trends, om daarna terug naar een hoger niveau te navigeren om te kijken welke effecten deze trends hebben op de gehele business.

Denormalize

Bij het denormalisatie proces van gegevens zal men de genormaliseerde informatie opnieuw structureren in een vorm waar dubbele data aanwezig mag zijn. Dit is soms de meest aangewezen en enige manier om een datawarehouse in een stermodel te modeleren omwille van performantie redenen. Het dernomaliseren van tabellen slorpt meer opslagruimte op en vertraagt tevens OLTP transactie’s, maar verbetert wel de performantie van queries in een BI omgeving.

Change data capture (CDC)

Change data capture (CDC) is het process om veranderingen te capteren die aan data in een data bron worden aangebracht en om ze daarna toe te passen doorheen heel de organisatie. CDC minimaliseert de resources die nodig zijn voor ETL processen omdat het zorgt voor een minimum data set die enkel de wijzigingen bevat. Het doel van CDC is, om het synchroon zijn van data, doorheen de verschillende applicaties te verzekeren.

Pagina's

Abonneren op RSS - DW - Data Warehousing & Modeling