Inhoudsopgave
Wat is het verschil tussen een database en een datawarehouse?
Een data warehouse is ook een database. Het verschil met een gewone database is de architectuur en de opslag van data. In een personeelssysteem zul je voor iedere medewerker maar een record/rij bewaren met de gegevens van de medewerker. In een datawarehouse kun je meerdere versies gaan opslaan van de medewerker.
Hoe bouw je een datawarehouse?
Aan de slag!
- Stap 1. Achterhaal de informatiebehoefte.
- Stap 2. Ga na welke gegevensbronnen nodig zijn.
- Stap 3. Stel een roadmap op.
- Stap 4. Kies een datawarehouse architectuur en technologie.
- Stap 5. Lever het datawarehouse op.
- Meer weten? Een datawarehouse dient zorgvuldig te worden ingebed in de organisatie.
Wat is een datawarehouse?
Een datawarehouse is een type databeheersysteem dat is ontworpen om business intelligence-activiteiten (BI), met name analytics, mogelijk te maken en te ondersteunen. Datawarehouses zijn uitsluitend bedoeld om zoekopdrachten en analyses uit te voeren en bevatten vaak grote hoeveelheden historische data.
Wat is een ETL tool?
Het extraheren van data uit systemen, het daarna transformeren en laden van de data in een nieuwe database noemen we afgekort ETL. Met zogenaamde ETL tools automatiseer je dat proces zodat je niet elke keer handmatig dit proces hoeft te doorlopen.
Waarom een DWH?
Met een datawarehouse kunnen je gebruikers sneller de juiste gegevens vinden en die opwerken tot bruikbare informatie, inzichten en kennis.
Waar moet een datawarehouse aan voldoen?
Een datawarehouse inrichten gaat zeker niet alleen om de technische zaken, maar denk aan alle vier de pijlers, te weten infrastructuur en architectuur, resourcing en tools, processen en methodieken en als laatste de gehele organisatie.
Waarom Sterschema?
In het datamodel staat de feitentabel centraal, met daarom heen meerdere dimensietabellen. De tabellen krijgen de vorm van een ster, vandaar dat dit een sterschema wordt genoemd. In de bovenstaande afbeelding kun je met een klein beetje verbeelding de vorm van een ster zien.
Waarom een Datalake?
Een data lake biedt de oplossing om alle beschikbare data, gestructureerd en ongestructureerd, op te slaan. Zelfs zonder beoogde toepassing, wordt het data lake gevuld met data. Door de lage kosten van dataopslag hoeft de opslag niet direct verbonden te zijn aan een concreet doel.
Hoe werkt ETL?
De term ETL beschrijft eigenlijk het proces van het extraheren van data uit een bron, het transformeren ervan tot een formaat waarmee je kunt werken en het laden van die data in een datamart of datawarehouse – de eindbestemming van data, waar het wordt opgeslagen en geanalyseerd.
Waarom ETL?
ETL heeft een aantal belangrijke pluspunten. Allereerst is het ontwikkeld om zeer grote datasets in bulk te kopiëren vanuit gestructureerde gegevensbronnen. Ten tweede kun je er historische datarecords mee maken en daarmee analyseren hoe een dataset in de loop van de tijd verandert.