DW - Data Warehousing & Modeling

Dimension

Een dimensie tabel bevat alle beschrijvende informatie voor één enkele entiteit in de context van één of meerdere gerelateerde fact tabellen. Bv. een klant dimensie bevat een klant nummer, naam, adres, contacten, etc.

Data Vault

Dit is één van de mogelijke wijzen waarop een database of data warehouse gestructureerd kan worden. De data die gehaald kan worden uit verschillende bronsystemen is op een zodanige wijze opgeslaagen dat het een complete historiek bevat, die op elk moment in de tijd kan geraadpleegd worden. De data vault architectuur bevat drie basis entiteiten, namelijk hub, link en satelliet.

Consolidation (Data)

Het consolideren van informatie is het proces om data, die bestaat in verschillende systemen en in verschillende formaten, op te slaan op een centrale plaats en in een uniforme manier die toegankelijk is voor meerdere gebruikers en verschillende applicaties.

Common dimensions

Wanneer een data model gedefinieerd is in een data warehouse context, is het zeer belangrijk om de bijhorende dimensies behoorlijk te definiëren. Op deze manier kan dezelfde dimensie makkelijk herbruikt worden binnen een andere context. Common of gemeenschappelijke dimensies zijn dus standaard dimensies, welke gedeeld kunnen worden tussen data modellen of ster schemas. Het zijn dimensies die hetzelfde betekenen hebben in combinatie met om het even welke facts met dewelke ze ge-join-ed kunnen worden.

Base table

Een Basis Tabel (Base Table) wordt vaak ook een feiten tabel (Fact Tabel) genoemd, en bevat numerische data op het laagst mogelijke niveau van detail opdat de informatie dan met zoveel mogelijk dimensionele gegevens kan gecombineerd worden.

Star schemas

Algemeen gesproken zijn er twee dimensionele modelleringstechnieken die gebruikt worden binnen een data warehouse context : ster schemas enerzijds en snowflake schema anderzijds.

Beide technieken vinden hun oorsprong binnen de dimensionele modelleer technieken van Ralph Kimball. Een ster schema is de geprefereerde techniek.

De kenmerken van het sterschema zijn :

Slice and dice

Dit is het manipuleren van data waarbij alle mogelijke combinaties van dimensies worden aangewend om de bijbehorende numerische waarden te tonen. Bij dit proces wordt er typisch gebruik gemaakt van een OLAP tool.

Slowly changing dimension

"Slowly changing dimensions” vormen een set van data warehouse technieken om met historiek om te gaan binnen een dimensie. Het is belangrijk aan te stippen dat dimensies steed gerelateerd worden aan facts en terwijl facts quasi altijd transactioneel georiënteerd zijn met een bijhorende datum, zijn dimensies dit niet. Daarom kan het zijn dat ook dimensies historiek vereisen.

Er bestaan 3 basis types :

Pagina's

Abonneren op RSS - DW - Data Warehousing & Modeling