Een begrip dat bij veel mensen onbekend is, maar dat bij iedereen voor herkenbare problemen zorgt: een datasilo. In deze blog ontdek je wat een datasilo precies is, welke problemen die met zich meebrengt op gebied van data analytics en hoe je die voorkomt.
Wat is een datasilo?
Een datasilo is een verzameling van data afkomstig uit één of meerdere databronnen die geïsoleerd is van de rest van de organisatie. In deze situatie ontbreken er belangrijke connecties met andere data in de organisatie. Daarnaast is de data niet zomaar voor iedereen toegankelijk en is de data in de ene datasilo vaak op een andere manier gestructureerd dan data in de andere datasilo. Dit heeft als gevolg dat het erg ingewikkeld, kostbaar én tijds- en arbeidsintensief is om goede inzichten te krijgen uit deze waardevolle bedrijfsdata. Een datasilo wordt ook wel eens een informatiesilo genoemd.
“Een datasilo is een verzameling van data afkomstig uit één of meerdere databronnen die geïsoleerd is van de rest van de organisatie.”
De problemen die datasilo’s met zich meebrengen
Datasilo’s zorgen voor verschillende problemen wat betreft data management. Hierdoor is het moeilijk om kwalitatief goede data analytics toe te passen. Hieronder lichten we de vijf grootste problemen toe die datasilo’s met zich meebrengen.
1. Geen 360-graden inzicht van de organisatie
Het woord ‘silo’ zegt het eigenlijk al: data in een datasilo is niet verbonden met data uit andere databronnen. Je hebt hierdoor geen holistisch beeld van de gehele organisatie. Dit levert problemen op met het maken van dashboards en rapportages en met het verkrijgen van inzichten om datagedreven beslissingen te kunnen nemen.
Als de benodigde data in verschillende databronnen staat, is het lastig om deze data met elkaar te combineren in één KPI dashboard. Het is vaak ook nodig om steeds weer handmatige exports te maken vanuit de verschillende datasilo’s. Deze data moet je vervolgens handmatig correct structureren, combineren én analyseren op de manier zoals jij dit wil. Dit moet je iedere keer dat je de rapportage wil maken opnieuw doen.
Plan een adviesgesprek in op een dag en tijd naar keuze
2. Data in de verschillende databronnen is anders gestructureerd
Een ander probleem dat datasilo’s met zich meebrengen is het feit dat data in de verschillende databronnen anders gestructureerd is. Denk bijvoorbeeld aan datumvelden. De datum kan je schrijven als 19-06-2023, maar bijvoorbeeld ook als 19 juni 2023 of 19-jun-2023. Ook telefoonnummers kunnen op verschillende manieren zijn gestructureerd:
- 06-xxxxxxxx
- 06xxxxxxxx
- 06 xx xx xx xx xx
Naast de datum en het telefoonnummer zijn er nog vele voorbeelden van data die op verschillende manieren kunnen zijn gestructureerd en hierdoor niet eenvoudig in relatie tot elkaar te visualiseren en analyseren zijn.
Artikelnummers in inkoopsysteem en verkoopsysteem
Een ander voorbeeld zijn bijvoorbeeld artikelnummers in in verschillende systemen, zoals het verkoopsysteem en het inkoopsysteem. Deze wijken vaak van elkaar af en zijn daarom niet met elkaar te combineren. Door de data te verzamelen in een datawarehouse link je deze artikelnummers in beide systemen integraal aan elkaar.
Om de data uit de verschillende databronnen te kunnen gebruiken, moet je deze data hetzelfde structureren. Vaak betekent dit dat je naast de handmatige exports uit voorbeeld 1, de data ook iedere keer handmatig moet herstructureren. Dit zorgt voor een extra arbeidsintensieve en foutgevoelige werkwijze die je veelal handmatig moet uitvoeren.
Datawarehouse opzetten
Datawarehouse
Staat de data in datasilo’s en worden deze handmatig geëxporteerd wanneer dit nodig is voor analyses of rapportages? Dit kan veel eenvoudiger, veiliger én efficiënter. Welkom in de wereld van het datawarehouse.
3. Data is niet voor iedereen beschikbaar
De meeste organisaties maken gebruik van veel verschillende tools die allemaal data produceren en bevatten. Niet iedereen binnen de organisatie heeft echter toegang tot al deze tools. Hierdoor kan niet iedereen bij de data. Ook het eenvoudig delen van data is hierdoor niet mogelijk, omdat een collega eerst moet inloggen in de tool om bij de data te kunnen. Als deze collega echter niet over de juiste rechten bezit, kan deze de gedeelde data niet bereiken.
4. Datasilo’s creëren verspilde opslagcapaciteit
In veel organisaties waar datasilo’s bestaan heeft ieder team zijn eigen database met informatie die relevant is voor de desbetreffende afdeling. Vaak is dezelfde data echter voor meerdere afdelingen relevant. Ieder team slaat dezelfde data op in zijn eigen database. Hierdoor ontstaat een veelvoud van de gebruikte opslagcapaciteit wat extra kosten met zich meebrengt. Door datasilo’s te voorkomen, bespaar je op het beheer én op de kosten van extra opslagcapaciteit.
Whitepaper
Onze visie op een Dataplatform
Vrijwel iedere organisatie beschikt over enorme hoeveelheden data. Uit die data is veel informatie te halen. In een dataplatform verzamel en structureer je al deze data.
5. Datasilo’s zorgen voor inconsistente informatie
Naast het feit dat datasilo’s opslagcapaciteit verspillen omdat je dezelfde data op verschillende plekken opslaat, zorgt het ook vaak op twee manieren voor inconsistente informatie.
1. Eigen databewerkingen
Ten eerste bewerkt iedere afdeling de data op haar eigen manier, bijvoorbeeld door bepaalde filters of bewerkingen toe te passen op de data die voor de desbetreffende afdeling van belang zijn. Wanneer je deze data vervolgens deelt met een andere afdeling, kan relevante informatie voor die afdeling ontbreken omdat dit is uitgefilterd door de eerste afdeling.
Het komt ook voor dat er hierdoor twee versies van de waarheid ontstaan: de ene afdeling heeft bepaalde informatie verwijderd omdat deze voor haar niet relevant was. Als de andere afdeling niet van deze databewerking op de hoogte is, gaat deze afdeling uit van verkeerde en incomplete informatie. Dit heeft tot gevolg dat je kostbare, verkeerde beslissingen neemt.
2. Informatie wordt niet gesynchroniseerd tussen databronnen
Ten tweede wordt informatie in de ene informatiebron bijgewerkt, maar niet in de andere. Als de marketingafdeling een adres wijzigt in het CRM-systeem, wordt dit niet automatisch bijgewerkt in het facturatiesysteem en andersom. Inconsistentie in informatie tussen verschillende datasilo’s komt in veel meer situaties voor. Dit heeft tijd, moeite en kosten tot gevolg om uit te zoeken waarom de data inconsistent is, om dit vervolgens handmatig op te lossen.
Plan een adviesgesprek in op een dag en tijd naar keuze
Hoe voorkom je problemen als gevolg van datasilo’s?
Er zijn verschillende manieren om te voorkomen dat je bovenstaande problemen ervaart. Het belangrijkste is om te voorkomen dat er datasilo’s in je organisatie ontstaan. Er moet binnen de organisatie een cultuur ontstaan waarbij iedereen zich bewust is van het belang van goed gestructureerde en complete data.
Zo kan je je collega’s vragen om data altijd onbewerkt in databases op te slaan. Ook vraag je collega’s om wijzigingen en mutaties die zij in IT-systemen doorvoeren, ook door te geven aan andere afdelingen. Of beter nog, om deze wijzigingen ook direct door te voeren in andere IT-systemen waar deze data in opgeslagen is.
Dit is een erg arbeidsintensief en foutgevoelig proces waarbij veel focus benodigd is om iedere collega scherp te houden. Er hoeft immers maar één collega te zijn die zich door tijdsdruk of uit gewoonte vergeet zich aan dit proces te houden, en de waardevolle data binnen je organisatie is weer vervuild.
“Door datasilo’s ontstaan er in organisaties vaak meerdere versies van de waarheid.”
Voorkom datasilo’s met een datawarehouse of dataplatform
Een datawarehouse of dataplatform is een structurele oplossing om problemen als gevolg van datasilo’s te voorkomen. In een datawarehouse verzamel je alle beschikbare databronnen in de organisatie, correct en consequent gestructureerd en gesynchroniseerd. Al deze data is 24/7 beschikbaar voor iedereen binnen de organisatie en vormt de basis van dashboards volgens het Practical Performance Measurement (PPM) principe. Deze dashboards bouw je in BI-tools zoals Power BI, MicroStrategy of Tableau.
Dankzij deze dashboards heb je altijd inzicht in de voor jou belangrijkste KPI’s en ververs je de data met één druk op de knop. Ook het maken van nieuwe dashboards is eenvoudig, omdat alle data al correct gestructureerd en actueel in het dataplatform staat.
Meer weten?
Wil je meer weten over het verhelpen en voorkomen van datasilo’s? Eén van onze specialisten neemt zo snel mogelijk contact met je op voor meer informatie. Geen zin om te wachten en heen-en-weer te mailen voor het vinden van een geschikt tijdstip voor een afspraak? Plan dan zelf een gratis adviesgesprek op een dag en tijd naar keuze.