Bonden Data

Data jargon uitgelegd: datawarehouse en datalake

2 juli 2024
Data jargon uitgelegd: datawarehouse en datalake

Elke bond die datagedreven werkt, krijgt op een zeker moment te maken met de opslag van data voor analyse. Er zijn verschillende oplossingen om dit te doen, zoals een datawarehouse of datalake. In dit artikel lees je wat deze oplossingen zijn en hoe je de juiste keuzes maakt.

Data ontstaat door dagelijkse activiteiten

Bonden en verenigingen gebruiken gezamenlijke systemen voor ledenadministratie. De marketingafdeling verzamelt gegevens van fans via de website. Events worden geregistreerd in een CRM-systeem en embedded scientists leggen meetgegevens vast. Deze operationele systemen ondersteunen je bij je dagelijkse werkzaamheden.

Data uit verschillende systemen combineren

Voor analyses wil je data uit verschillende systemen combineren en er snel bij kunnen. Door data periodiek uit operationele systemen te halen en centraal op te slaan, kunnen organisaties nieuwe inzichten verkrijgen die niet zichtbaar zijn wanneer de bronnen apart van elkaar worden bekeken.

Centraal en gestructureerd opslaan

Je kunt natuurlijk proberen om bestanden op te slaan op een gedeelde schijf. Je herkent vast dat dit snel onoverzichtelijk wordt. Na verloop van tijd weet je niet meer wat je hebt, waar het staat en of het nog klopt. Een betere oplossing is het centraal en gestructureerd opslaan van gegevens in een datawarehouse of een datalake.

Een datawarehouse is een gecentraliseerd systeem dat data gestructureerd opslaat en organiseert voor efficiënte analyse en rapportage. In een datawarehouse structureer je data volgens een vaste methode en sla je alleen op wat je écht nodig hebt.

Een datalake is een opslagsysteem dat grote hoeveelheden ruwe, onbewerkte data in diverse formaten bewaart, geschikt voor flexibele verwerking en analyse. In een datalake wordt veel verschillende onbewerkte data opgeslagen, waarbij het vooraf nog niet altijd duidelijk is of de data ook nodig is.

De juiste vorm van opslag kiezen 

Verschillende sportbonden hebben al stappen gezet in het opzetten van een data-infrastructuur voor analyse. De aanpak verschilt per bond, afhankelijk van hun specifieke behoeften en beschikbare middelen.  

Als je wilt starten, zijn hier een aantal overwegingen om aan te denken: 

  • Waarvoor wil je het inzetten? Het begint bij de vraag of er binnen de bond concrete gebruiksvoorbeelden en doelen zijn waarvoor een oplossing voor dataopslag nodig is. Welke vragen en vervolgvragen wil je continu kunnen beantwoorden? Hebben jullie complexe en tijdrovende analyses? Gestructureerde opslag kan hierbij helpen, omdat het ervoor zorgt dat je rapportages vlot en geautomatiseerd kunt samenstellen. 
  • Waar te beginnen? Het komt voor dat er eerst een afdeling binnen een organisatie is die er het meest bij te winnen heeft. Dit kan dienen als startpunt en helpen bij het overtuigen van de rest van de organisatie. Houd wel in gedachten dat je het in de toekomst voor de hele organisatie wilt kunnen inrichten. 
  • Wat past het meest bij ons? Elke bond bevindt zich in een andere ontwikkelingsfase. Wat voor de ene bond een goede oplossing is, hoeft dat voor een andere bond niet te zijn. Veel organisaties starten met een datawarehouse en bouwen gefaseerd door aan een oplossing die passend blijft. Laat de keuze afhangen van de specifieke inzet en behoeften. 
  • Kan je het onderhouden? Zorg ervoor dat de inrichting van de opslag van data goed te onderhouden is. Dit betekent bijvoorbeeld dat operationele systemen aangesloten moeten kunnen worden en dat er voldoende kennis en expertise beschikbaar is. Heb je deze kennis zelf in huis of moet je die aantrekken of extern inhuren? 

Deel dit artikel op social media: