Wat is een datawarehouse?

Datawarehouse, wat is het, waar bestaat het uit
en wat is het verschil met een datalake?
Contact met DWH architect

De betekenis van Datawarehouse (DWH)

Wat is de betekenis van een datawarehouse?

Een datawarehouse is een systeem voor het verzamelen, organiseren, opslaan en ter beschikking stellen van data. Het wordt typisch gebruikt voor beslissingsondersteuning en business intelligence-doeleinden. Het zorgt voor een (secure) platform waarin centraal data kunnen worden beheerd en geraadpleegd door geautoriseerde gebruikers.

Met de groei van data, de verdere digitalisering en de groei van organisaties in datageletterdheid neemt de behoefte aan een centraal data warehouse alleen maar toe. Datageletterdheid is een van de grootste data governance trends voor 2023 

Op deze pagina gaan we in op de vele aspecten van data warehousing en waarom dit zeker nog geen achterhaald concept is.

 

Dit behandelen we:

De soorten datawarehouses

Er zijn 3 soorten datawarehouses

DWH soort 1: Operational data store (ODS)

Een ODS bevat alle operationele gegevens van een organisatie en is dus de bron voor het datawarehouse. Het is een tijdelijke, kostenefficiënte manier om toegang te krijgen tot gegevens die anders moeilijk te verkrijgen zijn.

DWH soort 2: Standaard Datawarehouse

Een data warehouse bevat alle historische gegevens van een organisatie. Het is een centrale plek waar alle relevante gegevens worden opgeslagen. De gegevens zijn vaak geaggregeerd en gecontroleerd om de datakwaliteit te kunnen garanderen.

DWH soort 3: Enterprise data warehouses (EDW)

Een EDW bevat alle gegevens van een organisatie, zowel operationeel als historisch. Het is een centrale plek waar alle relevante gegevens worden opgeslagen en dus is het een belangrijke bron voor rapportages en dashboarding.

Het verschilt van een data warehouse omdat het ook operationele gegevens bevat. Dit maakt het een krachtige tool voor beslissingen op tactisch en strategisch niveau.

Voorbeeld van een enterprise datawarehouse

Datamodellering: Kimball vs Inmon

Datamodellen: Kimball vs Inmon

In een datawarehouse zijn er over het algemeen twee verschillende benaderingen voor datamodellering.

Data warehouse Inmon

De eerste is de Bill Inmon methode, die ook wordt gebruikt in operationele systemen. Deze aanpak is er vooral op gericht om snel data te kunnen vastleggen in (operationele) systemen.

Sterschema van Kimball

Data warehouse Kimball

De tweede is de methode van Ralph Kimball, ook bekend als het sterschema. Deze aanpak richt zich op het creëren van een datamodel dat is geoptimaliseerd voor prestaties en schaalbaarheid.

In sommige omgevingen wordt de datavault-methode van Dan Linstedt gebruikt. Deze aanpak combineert elementen van zowel de Inmon- als de Kimball-methode. In een datamart is de meest gebruikelijke aanpak die van Ralph Kimball.

Illustratie is van het boek ‘De Intelligente, Datagedreven Organisatie‘.

Inmon en Kimball vullen elkaar aan

De methode van Bill Inmon en die van Ralph Kimball bestaan eigenlijk naast elkaar en vullen elkaar aan. In de afbeelding hieronder is dit schematisch weergegeven.

Inmon en Kimball vullen elkaar aan

Toekomstbestendig datawarehouse architectuur

De componenten van een datawarehouse architectuur

Een datawarehouse bestaat uit verschillende componenten. In het kort:

Het begint met het ontsluiten van bronnen. Daarna worden vanuit een ETL proces verschillende databronnen getransformeerd en in het datawarehouse geplaatst.

Vervolgens worden de datamarts gemaakt via een data flow. Deze kunnen weer ontsloten worden door bijvoorbeeld software als PowerBI. Dit is het topje van de datawarehouse ijsberg. De eindegebruikers en analisten zien vaak alleen dit laatste.

Een toekomstvast datawarehouse bestaat uit de volgende onderdelen:

  • De operationele bronnen
  • Het datawarehouse ETL proces waarin informatie uit de bronnen omgezet wordt naar een datawarehouse.
  • Het datawarehouse zelf als centraal punt waarin data is vastgelegd
  • Datamarts waarin voor een specifieke gebruikersgroep data ter beschikking wordt gesteld
  • Data ontsluiting die kan bestaan uit rapportages, dashboards en eventueel data uitwisseling
  • User access, dus op welke manier kan de gebruiker bij de data, zoals via een portal functie
  • Ondersteunende processen zoals:

    • Metadatamanagement, waarin de data wordt beschreven die in het datawarehouse is opgeslagen.
    • Data security, waarin wordt geregeld dat niet iedere gebruiker overal bij kan.
    • Processen die het laden van de gegevens en het up-to-date houden van de omgeving monitoren.

Je moet over alle onderdelen nagedacht hebben wil je tot een toekomstvaste data architectuur komen. Data architecten zijn de aangewezen personen om een organisatie aan de hand te nemen en om gezamenlijk de juiste/betaalbare architectuur te kiezen en te implementeren.

Opzoek naar een datawarehouse architect?

Het opzetten van een datawarehouse is een uitgebreid en lastig project. Dick heeft al meer dan 30 jaar ervaring en heeft voor veel organisaties in Nederland gewerkt aan data warehouse projecten.
  • Opzetten van de datawarehouse
  • DWH opleidingen en trainingen op maat
Vrijblijvend contact

Het opzetten van een datawarehouse

De 14 stappen voor het opzetten van een datawarehouse

Een datawarehouse kan elke organisatie helpen, maar het vereist wel een bepaalde volwassenheid. Er zijn verschillende scholen/datamodellen die je kunt tegenkomen in een datawarehouse.

Het stappenplan voor het opzetten van een data warehouse ziet er als volgt uit:

1. Identificeer doelen

Identificeer de doelen van het datawarehouse: welke data wil je verzamelen en wat wil je hiermee bereiken?

2. Definieer bronnen

Definieer de bronnen (operationele systemen en in welke tabellen gegevens opgeslagen liggen).

3. Ontsluit de bronnen

Maak verbinding met de bronnen die je hebt gedefinieerd en zorg ervoor dat de data beschikbaar is. Hier komt ook master data management om de hoek kijken.

4. ETL (Extract, Transform, Load)

Bewerk en converteer de data vanuit de bronnen naar het juiste formaat voor het datawarehouse.

5. Data lakes/databases

Zorg dat de data correct vormgegeven is en groepeer de data rondom, voor de organisatie, logische begrippen zoals klant, order en medewerker. In specifieke gevallen wordt voor opslag de data vault methode gebruikt.

6. Metadatamanagement

Maak goede databaseschema’s aan en beheer deze schema’s. Beschrijf op logisch niveau de data begrippen en de transformaties.

7. Beheersprocessen

Richt de ondersteunende processen rond het datawarehouse in. Belangrijk is bijvoorbeeld dat er regelmatig back-ups worden gemaakt.

8. Compliance

Leg verantwoording af aan alle stakeholders en de organisatie is transparant in welke data ze opslaat en welke verwerkingen je daar mee doet.

9. Security

Zorg dat de omgeving beveiligd is aan de hand van verschillende standaarden. De beveiliging geldt natuurlijk ook voor de database administrator, de BI expert en alle medewerkers. Zorg ervoor dat niemand toegang heeft tot alle data, maar slechts tot een bepaalde groep van databases en/of tabellen.

10. Business process management

Zorg ervoor dat het datawarehouse een onderdeel wordt van de dagelijkse bedrijfsprocessen. Dit kan gerealiseerd worden door het inzetten van een ‘data steward’ en data engineering. Zij/hij beheert de data en zorgt voor de koppeling met de bedrijfsprocessen.

11. Reporting en data visualisatie tools

Test de functionaliteit van dashboard waarmee de gebruiker kan zien wat er in het datawarehouse staat, bijvoorbeeld PowerBI, Qlik, Tableau of MicroStrategy.

12. Ontsluit het datawarehouse

Zorg ervoor dat de data daadwerkelijk beschikbaar is voor gebruikers, dat ze al deze data begrijpen en steeds meer inzichten halen uit het datawarehouse of datalake.

13. Evaluatie en bijstelling

Blijf het datawarehouse evalueren op basis van de verzamelde inzichten en feedback van de gebruikers. Pas waar nodig het datawarehouse aan. Dit sluit goed aan op de KPI laag uit het IDAM-model.

14. Ontwikkel een duidelijk proces

Maak ook een duidelijk proces van hoe data uit een datawarehouse gebruikt kan en mag worden voor data science projecten. Door met machine learning modellen te gaan werken wordt kunstmatige intelligentie in organisaties geïntroduceerd.

Wil je meer weten over het stappenplan en hoe je valkuilen kan voorkomen, neem dan gerust vrijblijvend contact met ons!

Hoe wordt data in een datawarehouse gezet, zoals ETL?

Er zijn verschillende manieren om data in een datawarehouse te zetten. De meest gebruikte methode is ETL, maar je kunt ook data imports doen of data loads. In dit onderdeel ga ik alleen in op ETL.

ETL staat voor Extract, Transform en Load. Met ETL kun je data uit verschillende bronnen halen en die vervolgens opslaan in het datawarehouse. Je kunt ook data vanuit het datawarehouse exporteren naar een ander systeem.

De Extract-fase is de fase waarin je de data uit de bronnen haalt. Dit kan een database zijn, een bestand of een API. De data wordt dan in een staging area gezet. Vaak zijn er ook centrale databases beschikbaar met master data management data.

In de Transform-fase worden de gegevens omgezet naar het datawarehouse schema. Dit kan bijvoorbeeld door ze te koppelen aan een andere structuur of door ze te aggregeren.

In de Load-fase worden de gegevens geladen in het datawarehouse. Dit kan een database zijn, een bestand of een API.

Een andere manier is dat het ETL-proces zelf gebouwd wordt met zogenaamde scripts. Dit zijn SQL-statements die achter elkaar uitgevoerd worden.

Beginnen aan een datawarehouse, vereist dat een bepaalde volwassenheid?

Kan elke organisatie starten met een datawarehouse?

In principe kunnen alle organisaties starten met een datawarehouse. Maar om succesvol te zijn, is het wel belangrijk dat de organisatie al wat volwassener is.

Er moet een goede infrastructuur zijn, er moeten goede systemen zijn en de organisatie moet bereid zijn om te investeren in het datawarehouse. Als dat niet het geval is, dan zal het waarschijnlijk niet slagen.

Ook moet er op gelet worden dat data van een goede kwaliteit is, dus de datakwaliteit moet op orde zijn en die normen zijn vastgelegd in metadatamanagement. Als de data niet goed is, zal het datawarehouse ook niet goed werken met alle gevolgen van dien.

Eigen onderzoek op LinkedIn geeft de volgende oorzaken aan van het regelmatig niet aan de verwachtingen voldoen of zelfs mislukken van datawarehouse projecten:

Waarom Datawarehouse projecten vaak mislukken | Research op linkedin

De redenen en verdeling komen overeen met wat we zien in onze eigen advies- en implementatiepraktijk. 

Datawarehouse vs datalake

Het verschil tussen een datawarehouse en een data lake

Data wordt steeds belangrijker en datawarehouses blijven naast datalakes bestaan en dienen elk een ander doel.

De trend is nu om deze twee omgevingen samen te voegen. Inmiddels is daar zelfs al een naam voor bedacht: ‘datalakehouse’. Het datalakehouse combineert het datawarehouse met het datalake systeem en de datamart.

Het verschil tussen een data lake en een data warehouse

Door alle ontwikkelingen op dit gebied is het vaak lastig om verschillende onderdelen goed te scheiden, waardoor het datawarehouse eigenlijk steeds meer verwordt tot alles wat met data en analyse te maken heeft. Een soort containerbegrip.

Kunnen beide worden gebruikt voor data opslag en verwerking?

Een datawarehouse is niet alleen maar een plek om data op te slaan, maar ook om deze data te verwerken. Daarnaast kunnen datawarehouses worden gebruikt voor het verzamelen van data uit verschillende bronnen. De definitie van een datawarehouse is daardoor vaag en iedere organisatie kan hier zijn eigen invulling aan geven.

Een datawarehouse wordt voornamelijk gebruikt om informatie of andere datastructuren te verzamelen en op een bepaalde manier voor de organisatie gebruiksvriendelijk te maken. Echter zijn datawarehouses niet alleen geschikt om klantgegevens of financiële gegevens te verzamelen. Ook datastructuren van derde partijen of geavanceerde datastructuren die je niet zelf hebt kunnen creëren kunnen worden opgevraagd en binnengehaald.

Een data lake daarentegen wordt vaak gebruikt voor dataopslag en verwerking, maar ook om inzicht te krijgen in data. Een datalake is niet alleen een opslagmedium, maar zorgt er ook voor dat de verschillende datastructuren onderling kunnen communiceren. Een datalake kan ook goed omgaan met datastructuren van verschillende soorten en grootten zoals email, video en foto’s. Dit wordt wel samengevat in het begrip big data.

De belangrijkste verschillen op een rij

Data Lake          

Data warehouse

Transformeert de economie van het
opslaan van grote hoeveelheden gegevens

Eén keer transformeren, atlijd hergebruiken

Ondersteunt programmeerframeworks
op hoog niveau (Pig, HiveQL)

Geschoonde, veilige en beveiligde data

Schaalbaar voor uitvoering op tienduizenden servers

Biedt één bedrijfsbreed overzicht van data uit meerdere bronnen

Gebruik elke tool mogelijk

Data is makkelijk te gebruiken

De analyse beginnen zodra de data binnenkomt

Hoge concurrency

Maakt het gebruik van gestructureerde en ongestructureerde data vanuit één punt 

Consistente prestaties

Ondersteunt agile modellering door gebruikers in staat te stellen modellen, apps en query's te wijzigen

Snelle reactietijden

In een datawarehouse wordt ACID gewerkt en dat ontbreekt bij een datalake. Hieronder vertellen we wat dat is.

Wat betekent de term ACID als het gaat om databases?

ACID staat voor Atomic, Consistent, Isolated en Durable. Dat wil zeggen dat je transacties in een database moet kunnen uitvoeren die atomair zijn (alles of niets), consistent zijn (het resultaat is altijd hetzelfde), geïsoleerd zijn (de transactie heeft geen invloed op andere transacties) en durable zijn (eenmaal uitgevoerd, blijft het resultaat bewaard).

Dit is belangrijk omdat je hiermee de integriteit van je database kunt garanderen. ACID maakt het mogelijk dat ‘concurrent’ gebruikers van de database elkaars wijzigingen niet zien of meekrijgen, waardoor gelijktijdige mutaties elkaar niet overschrijven en er geen ongewenste fouten optreden.

Daarnaast weet je zeker dat, als je een transactie uitvoert, het resultaat hiervan ook echt bewaard blijft. Als er iets fout gaat met de database, kun je altijd terugvallen op een eerdere versie van de database, die nog intact is. Dit is de consistentie die ACID biedt.

Datawarehouse vs database

Het verschil tussen een datawarehouse en een database

Een datawarehouse en een database verschillen in meerdere opzichten. Een belangrijk verschil is dat een database voornamelijk bedoeld is voor het opslaan van data, terwijl een datawarehouse ook gebruikt kan worden voor het verwerken van data.

Een datawarehouse is eigenlijk een database met een specifiek gebruik, namelijk het opslaan en ter beschikking stellen van (geaggregeerde) data die gebruikt kan worden voor het maken van rapportages en analyses. Een database is een algemeen begrip dat gebruikt wordt voor een plek waar (gestructureerde) data opgeslagen wordt.

De verschillende datawarehouse tools

Er worden bij data warehouse tools onderscheid gemaakt tussen tools die (onderdelen) van het data warehouse maken (de DWH-generatie tools) en tools die data uit het datawarehouse halen, de zogenaamde data analyse tools.

De datawarehouse generatie tools

In deze categorie van tools zit tooling om het ETL-proces te ondersteunen.

Voorbeelden zijn: 

1. Ab Initio

2. IBM InfoSphere DataStage

3. Informatica Powercenter

4. Oracle Data Integrator

5. SAP Data Service (hardware assisted database)

6. IBM Cognos Data Manager

7. Microsoft SQL Server Integration Services 

Datawarehouse automation tools

Ook vallen hier tools onder die het (automatisch) vervaardigen van een dataware house ondersteunen, zoals de datawarehouse automation tools. 

Er zijn veel tools die je kunnen helpen bij het ontsluiten van de bronnen, het transformeren van de data en uiteindelijk de opslag in een datawarehouse. 

Voorbeelden daarvan zijn:

1. Tibco

2. TimeXtender

Natuurlijk wordt ook SQL nog veel gebruikt, om dit proces te automatiseren.

De belangrijkste voordelen zijn:

  • Verbeterde kwaliteit en precisie bij het maken van een datawarehouse
  • Het veel sneller kunnen realiseren van eindresultaten
  • Snellere doorlooptijd bij veranderingen
  • Het datawarehouse is veel eenvoudiger uitbreidbaar dan bij de traditionele benaderingswijze
  • De documentatie is ‘altijd op orde’. Dus de data lineage is gegarandeerd

De data analyse tools

Dit zijn data analytics tools die al dan niet in-memory data verwerken om meer diepgaande inzichten te krijgen. Moderne datawarehouse tools kunnen vaak ook data lakes ontsluiten en ondersteunen machine learning. 

Deze tools zetten data om in bruikbare informatie. Ze kunnen zowel on premises, hybride cloud, maar ook als volwaardige Cloud oplossing worden geïmplementeerd. 

Voorbeelden hiervan zijn: 

1. PowerBI

2. Qlik

3. MicroStrategy

4. Tableau

De rol van de data warehouse architect

Datawarehouse rollen binnen een organisatie

Een datawarehouse omgeving wordt beheerd en in de lucht gehouden door verschillende soorten medewerkers met verschillende rollen.

De belangrijkste rollen zijn:

1. De datawarehouse specialist

2. De ETL-ontwikkelaar

3. De databron beheerder

4. De data analist of businessanalist

Aan de big data kant zijn er nog rollen te vinden als big data engineer en data scientist.

Waar moet je op letten als je een datawarehouse architect in wilt huren?

Als je een datawarehouse architect of een consultant inhuurt, is het belangrijk om te kijken naar zijn of haar ervaring met de verschillende componenten van een datawarehouse.

De DWH-architect dient ervaring te hebben met ontsluiten van bronnen, ETL-processen en het maken van datamarts. Daarnaast moet de consultant kennis hebben van data visualisatietools zoals PowerBI.

Tot slot is het belangrijk dat de consultant ook kennis heeft van meta data management en data security. Ook big data en data lake, met grote hoeveelheden data, komen steeds vaker voor in het datawarehouse landschap. Een goede consultant zal op de hoogte zijn van deze ongestructureerde data ontwikkelingen.

De rol van BI in een datawarehouse

De definitie van Business Intelligence (BI)

Business intelligence (BI) is een verzameling van processen, technieken, methoden en tools die bedoeld zijn om informatie uit data te halen en deze te gebruiken voor het nemen van betere beslissingen.

BI maakt het mogelijk om snel inzicht te krijgen in de prestaties van een organisatie en deze te vergelijken met de doelstellingen van dezelfde organisatie.

BI kan worden gebruikt door iedereen binnen een organisatie, van het management tot aan de medewerkers.

Dit proces begint met het verzamelen van data uit verschillende bronnen, zoals databases, bestanden, CRM-systemen en ERP-systemen. Deze data wordt vervolgens geanalyseerd en in rapportages of dashboards weergegeven.

Raakvlak van BI met de datawarehouse

Waar data warehousing veel meer als een tool wordt gezien is business intelligence het bovenliggende proces om een organisatie op een eenduidige en juiste manier aan te sturen.

De rol van BI een datawarehouse

 

Business intelligence wordt ook wel uitgedrukt in de zogenaamde DIKW pyramide. Het begint bij data, wanneer je hier context aan toevoegt, dan ontstaat er informatie.

Wanneer die informatie wordt geconsumeerd door een gebruiker, dan ontstaat er kennis (knowledge) en wanneer de persoon die de kennis heeft er daadwerkelijk iets mee gaat doen ontstaat er verandering (wishdom). Dan wordt alles pas echt relevant. Alleen met actie/verandering heeft de opzet van de gehele pyramide dus zin.

Dus zonder actie is het hebben van kennis, informatie en data volgens mij compleet zinloos en kan het BI-proces daarvoor dan beter ook worden gestopt!

Met deze KPI’s meet je de success van een datawarehouse implementatie

  • In hoeverre voldoen we eraan dat we binnen de afgesproken tijd zitten en binnen het afgesproken budget?
  • In hoeverre voldoet het nieuwe systeem aan de oorspronkelijke eisen en doelstellingen?
  • In hoeverre voldoen we aan alle van tevoren opgestelde requirements?
  • In de evaluatie, hoe tevreden zijn de gebruikers met het nieuwe systeem?
  • Hoe tevreden zijn de gebruikers met de begeleiding tijdens de implementatie?
  • Bij software implementatie kan het vinden van fouten door het testen een indicatie zijn van de betrokkenheid van de medewerkers bij het implementatieproces.
  • Hoeveel medewerkers zijn betrokken bij het proces en hoeveel tijd is er voor het implementatietraject vrijgemaakt?

Dit zijn enkele van de KPI’s die kunnen worden gebruikt om het succes van een implementatie te meten. Projectleiders en eindverantwoordelijken vinden dat vaak wel lastig. Het meten van het succes van een implementatie is niet altijd goed hard te maken en ook tijdens een implementatieproces veranderen de wensen en de eisen. Deze moeten allemaal ingeschat en vastgelegd worden, wat lastig kan zijn.

Daar staat tegenover dat wanneer je het succes niet meet, je geen mogelijkheden hebt om tijdens het implementatietraject duidelijkheid te geven over het succes van de implementatie en het gestructureerd daarop sturen onmogelijk wordt.

Te vaak zijn onduidelijke implementatiedoelstellingen en verwachtingen er de oorzaak van dat implementatietrajecten mislukken, met alle gevolgen van dien.

Toch is de sterke oproep om wel een poging te wagen van om het succes van de implementatie meetbaar te maken. Misschien lukt het niet voor 100%, maar 80% is altijd nog beter dan helemaal niets doen. Het advies: start er mee, en waar nodig, stuur bij.

Datawarehouse in de Cloud zoals Azure

Cloud data warehouse oplossingen

De laatste jaren is er een verschuiving te zien naar het opslaan van datawarehouses in de Cloud. Deze trend wordt gedreven door verschillende factoren, waaronder de schaalbaarheid van Cloud-gebaseerde oplossingen, het pay-as-you-go factureringsmodel en het uitbesteden van onderhoudstaken.

Er zijn echter ook enkele nadelen aan deze aanpak, zoals het feit dat gegevens niet on premises worden opgeslagen en de mogelijkheid van vendor lock-in.

Datawarehouse in Azure

Er zijn ook hybride oplossingen waarbij verkopers hun eigen omgeving kunnen opzetten in een publieke cloudprovider zoals Microsoft Azure of Amazon AWS. Uiteindelijk hangt de beslissing om een datawarehouse al dan niet in de Cloud op te slaan af van de specifieke behoeften en vereisten van een organisatie.

Bekende spelers als Microsoft met Azure, Google met Big Query, Amazon redshift en zeker ook Snowflake Cloud bieden deze SAAS-diensten aan.

Ook zijn er leveranciers zoals Microstrategy die SAAS aanbieden boven op de PAAS of IAAS-modellen van de hiervoor genoemde levernanciers.

Waar het in het verleden maanden duurde om een ‘lege’ datawarehouse omgeving neer te zetten (on premises), is dat nu gemiddeld genomen binnen een uur mogelijk.

FAQ over datawarehouse

Hoe past SQL in een datawarehouse omgeving?

In een datawarehouse omgeving is SQL vaak de taal waarin data wordt gemanipuleerd. Door de vele standaardisaties die er zijn, is het makkelijk om met SQL te werken en is deze uitwisselbaar tussen verschillende database omgevingen. SQL is ook een veelgebruikte taal in data warehouses.

Het is eigenlijk de standaard taal van een RDBMS (Relationeel DataBase Management Systeem). Dit komt omdat de DDL (Data Definition Language) in SQL is vastgelegd. Hierdoor is het gemakkelijk om data in een datawarehouse op te slaan en weer te gebruiken, vaak onafhankelijk van het gebruikte RDBMS, zoals Microsoft SQL server of Oracle.

Er is nu ook steeds meer een trend gaande om met SQL ongestructureerde data te benaderen. De laatste tijd zijn er veel library’s in Python en R bijgekomen die dit ondersteunen. SQL is al lang niet meer alleen de taal die alleen binnen een database wordt toegepast.

Wat zijn de belangrijkste boeken over data warehousing?

De drie belangrijkste boeken over data warehousing zijn Agile Data Warehousing Design van Lawrence Corr en Jimm Stratnitto, The Data Warehouse Toolkit van Ralph Kimball en Margy Ross en Data Architecture: A primer for the data scientist door William Inmon en Dan Lindtstedt.

Er zijn natuurlijk veel meer boeken over dit onderwerp geschreven, maar dit zijn wel de meest toonaangevende.

Datawarehouse oplossing PowerBI een vloek of een zegen voor een organisatie?

PowerBI kan een vloek of een zegen zijn voor een organisatie. Het hangt ervan af hoe de organisatie ermee omgaat. Als het alleen wordt gebruikt om mooie grafieken en rapportages te maken, is het een zegen.

Maar als er niet goed wordt nagedacht over de componenten van een datawarehouse, kan PowerBI een vloek zijn. PowerBI wordt dan een soort Excel ‘on steroids’ en dat is niet de bedoeling.

Je kan PowerBI prima gebruiken voor pilots en om te kijken of de te ontsluiten data je de juiste informatie biedt, maar wil je echt met data aan de slag, dan is het hebben van een aparte datawarehouse omgeving een must en kan daarboven PowerBi prima gebruikt worden als visualisatietool.

SCHAKEL EEN DATAWAREHOUSE ARCHITECT IN

Maak vrijblijvend een afspraak om
jouw datawarehouse uitdagingen te bespreken

Vrijblijvend contact