Geschreven door Judith Rauwerda, Client manager bij Axians
Veel organisaties maken gebruik van analytics binnen hun organisatie. Ze maken dashboards en rapportages en halen hier verschillende inzichten uit. Als organisatie is het belangrijk om te weten op welke vragen je antwoord wilt krijgen, zodat je de juiste informatie verzamelt.
Bron van waarheid
Wanneer je bijvoorbeeld een database hebt met 250 tabellen, maar van deze 250 tabellen zijn er wellicht maar 100 tabellen relevant om tot jou antwoord te komen. Je wilt dan alleen gebruik maken van deze 100 tabellen.
Met een datawarehouse wordt de informatie uit de bronnen gehaald, de 100 tabellen, ingelezen en verwerkt in het datawarehouse. Hierop wordt een analytics tool gezet waar je vervolgens dashboards en rapportages op kan maken. Zoals in een vorig blog is besproken wordt het ingelezen in een datawarehouse, omdat dit zorgt dat de bron niet overbelast raakt. Daarnaast zijn de inlaad procedures optimaal, inclusief historie. wil je hier meer over weten? Lees er meer over in deze blog.
Business logica
In een datawarehouse wordt het ETL-proces toegepast, Extract, Transfer en Load. In de extractie laag wordt een kopie gemaakt van de data, deze wordt in een datalake gezet. Een datalake is een grote verzameling van alle ongestructureerde data. Vervolgens komt de transformatie laag, in deze laag pas je de business logica toe.
Er wordt bijvoorbeeld vastgesteld dat als een klant binnen 30 dagen de factuur betaalt, deze klant de stempel “goed betaal gedrag” krijgt. Op het moment dat er rechtstreeks een connectie wordt gemaakt met de bron, heb je niet genoeg informatie om tot de conclusie te komen of en wanneer de klant welke stempel krijgt. Het is hoogstwaarschijnlijk dat je daar informatie uit het financiële systeem voor nodig hebt, want wie heeft wanneer betaald? Maar ook uit het salessysteem om te zien wanneer welke offerte is verstuurd. Omdat je met een datawarehouse data kan combineren kun je dus ook business logica vast leggen en één bron van waarheid creëren.
Eén definitie
Als organisatie wil je werken naar één definitie die gehanteerd wordt binnen de complete organisatie. Je wilt voorkomen dat de definitie omzet bij de financiële afdeling inclusief BTW is, terwijl dat bij een andere afdeling exclusief BTW is. Of dat transportkosten wel worden meegenomen en bij de ene afdeling en bij de andere afdeling niet. Als organisatie wil je één definitie, zodat dat er intern geen verwarring ontstaat.
Op het moment dat een start wordt gemaakt met een datawarehouse traject kom je dit soort dingen tegen. Intern moeten daarom gesprekken plaatsvinden om dit kenbaar te maken en om de definitie vast te stellen. In een datawarehouse kun je deze definities vastleggen, zodat elke afdeling op het moment dat er gepraat wordt over omzet dezelfde definitie geldt of dat het kenbaar is dat de definitie voor een afdeling anders is.
Wie mag wat zien?
In een organisatie is niet alle data voor iedereen beschikbaar. De financiële afdeling maakt analyses op basis van de beschikbare financiële data, sales maakt analyses op basis van bijvoorbeeld hun verkoop cijfers. Op het moment dat je gebruikt maakt van een datawarehouse kun je je data combineren. De silo’s, losse bronnen, worden hiermee doorbroken en afdelingen kunnen waar nodig elkaars data inzien en combineren. Hierdoor kunnen nieuwe inzichten ontstaan die zonder datawarehouse niet zichtwaar waren.
De BI afdeling kan met een datawarehouse de data beter beheren en kijken wie toegang krijgt tot welke data. De toegang kun je beheren met data marts. Dit zijn blokken waarin data uit verschillende systemen in zit, deze marts worden toegewezen aan medewerkers. Een financieel medewerker heeft bijvoorbeeld een analytics tool op een data mart waarin data van het financieel systeem staat en informatie over offertes uit het sales systeem. Zo kun je zorgen dat medewerkers alleen de informatie zien die voor hen relevant is.
Wat is de kwaliteit van je data?
Organisaties hebben erg veel data, maar de kwaliteit hiervan is niet altijd even optimaal. Op het moment dat wordt gekeken naar de data die in de bronnen staat, kan het zo zijn dat een hoop gegevens niet kloppen of incompleet zijn. In een datawarehouse kun je de kwaliteit van de gegevens structureel verbeteren, omdat de data centraal komt te staan.
Tevens heb je de mogelijkheid om in een datawarehouse de datastromen vast te leggen zodat je kunt zien waar de data vandaan komt en kunt bijsturen op de plekken waar dat nodig is. Het kan ook zijn dat bepaalde acties afgevangen worden in het datawarehouse. De kwaliteit van data kan op deze manier in datawarehouse gecontroleerd en geborgd worden.
Meer weten?
Wil jij meer informatie over Datawarehouses? Neem contact met mij op via judith.rauwerda@axians.com. Samen gaan we in gesprek met de expert binnen Axians op het gebied van jouw vraagstuk. Benieuwd naar het vervolgblog of de video’s die ik maak in mijn reis om van beginner tot expert te groeien? Volg me dan op LinkedIn