Snel naar content
alles over de risico's van datasilo's

Wat is een datasilo en waarom zorgt een datasilo voor problemen?

Een begrip dat bij veel mensen onbekend is, maar dat bij iedereen voor herkenbare problemen zorgt: een datasilo. In deze blog ontdek je wat een datasilo precies is, welke problemen die met zich meebrengt op gebied van data analytics en hoe je die voorkomt.

Wat is een datasilo?

Een datasilo is een verzameling van data afkomstig uit één of meerdere databronnen die geïsoleerd is van de rest van de organisatie. In deze situatie ontbreken er belangrijke connecties met andere data in de organisatie. Daarnaast is de data niet zomaar voor iedereen toegankelijk en is de data in de ene datasilo vaak op een andere manier gestructureerd dan data in de andere datasilo. Dit heeft als gevolg dat het erg ingewikkeld, kostbaar én tijds- en arbeidsintensief is om goede inzichten te krijgen uit deze waardevolle bedrijfsdata. Een datasilo wordt ook wel eens een informatiesilo genoemd.

Een datasilo is een verzameling van data afkomstig uit één of meerdere databronnen die geïsoleerd is van de rest van de organisatie.

De problemen die datasilo’s met zich meebrengen

Datasilo’s zorgen voor verschillende problemen wat betreft data management. Hierdooris het moeilijk om kwalitatief goede data analytics toe te passen. Hieronder lichten we de vijf grootste problemen toe die datasilo’s met zich meebrengen.

1. Geen 360-graden inzicht van de organisatie

Het woord ‘silo’ zegt het eigenlijk al: data in een datasilo is niet verbonden met data uit andere databronnen. Je hebt hierdoor geen holistisch beeld van de gehele organisatie. Dit levert problemen op met het maken van dashboards en rapportages en met het verkrijgen van inzichten om datagedreven beslissingen te kunnen nemen. Als de benodigde data in verschillende databronnen staat, is het vaak lastig om deze data eenvoudig met elkaar te combineren in één dashboard of rapportage. Het is vaak ook nodig om steeds weer handmatige exports te maken vanuit de verschillende datasilo’s. Deze data moet je vervolgens handmatig correct structureren, combineren én analyseren op de manier zoals jij dit wil. Dit moet je iedere keer dat je de rapportage wil maken opnieuw doen.

2. Data in de verschillende databronnen is anders gestructureerd

Een ander probleem dat datasilo’s met zich meebrengen is het feit dat data in de verschillende databronnen anders gestructureerd is. De datum kan je schrijven als 19-06-2021, maar bijvoorbeeld ook als 19 juni 2021 of 19-jun-2021. Ook telefoonnummers kunnen op verschillende manieren zijn gestructureerd:

  • 06-xxxxxxxx
  • 06xxxxxxxx
  • 06 xx xx xx xx xx

Naast de datum en het telefoonnummer zijn er nog vele voorbeelden van data die op verschillende manieren zijn gestructureerd en hierdoor niet eenvoudig in relatie tot elkaar te visualiseren en analyseren zijn.

Artikelnummers in inkoopsysteem en verkoopsysteem
Een ander voorbeeld  zijn artikelnummers in het verkoopsysteem en artikelnummers in het inkoopsysteem. Deze wijken vaak van elkaar af en kan je daarom niet met elkaar comibineren. Door de data te verzamelen in een datawarehouse link je deze artikelnummers in beide systemen integraal aan elkaar.

Om de data uit de verschillende databronnen te kunnen gebruiken, moet je deze data hetzelfde structureren. Vaak betekent dit dat je naast de handmatige exports uit voorbeeld 1, de data ook iedere keer handmatig moet herstructureren. Dit zorgt voor een extra arbeidsintensieve en foutgevoelige werkwijze die je veelal handmatig moet uitvoeren.

Lees meer: Inergy adviseert over de juiste aanpak, ontwerpt en bouwt het dataplatform voor PostNL.

3. Data in datasilo’s is niet voor iedereen beschikbaar

De meeste organisaties maken gebruik van veel verschillende tools die allemaal data bevatten. Niet iedereen binnen de organisatie heeft echter toegang tot al deze tools. Hierdoor kan niet iedereen bij de data. Ook het eenvoudig delen van data is hierdoor niet mogelijk, omdat een collega eerst moet inloggen in de tool om bij de data te kunnen. Als deze collega echter niet over de juiste rechten bezit, kan deze de gedeelde data niet bereiken.

Onze visie op een Dataplatform

Whitepaper

Onze visie op een Dataplatform

Vrijwel iedere organisatie beschikt over enorme hoeveelheden data. Uit die data is veel informatie te halen. In een dataplatform verzamel en structureer je al deze data.

Download whitepaper

4. Datasilo’s creëren verspilde opslagcapaciteit

In veel organisaties waar datasilo’s bestaan heeft ieder team zijn eigen database met informatie die relevant is voor de desbetreffende afdeling. Vaak is dezelfde data echter voor meerdere afdelingen relevant. Ieder team slaat dezelfde data op in zijn eigen database. Hierdoor ontstaat een veelvoud van de gebruikte opslagcapaciteit wat extra kosten met zich meebrengt. Door datasilo’s te voorkomen, bespaar je op het beheer én op de kosten van extra opslagcapaciteit.

5. Datasilo’s zorgen voor inconsistente informatie

Naast het feit dat datasilo’s opslagcapaciteit verspillen omdat je dezelfde data op verschillende plekken opslaat, zorgt het ook vaak op twee manieren voor inconsistente informatie.

1. Eigen databewerkingen
Ten eerste bewerkt iedere afdeling de data op haar eigen manier, bijvoorbeeld door bepaalde filters of bewerkingen toe te passen op de data die voor de desbetreffende afdeling van belang zijn. Wanneer je deze data vervolgens deelt met een andere afdeling, kan relevante informatie voor die afdeling ontbreken omdat dit is uitgefilterd door de eerste afdeling.
Het komt ook voor dat er hierdoor twee versies van de waarheid ontstaan: de ene afdeling heeft bepaalde informatie verwijderd omdat deze voor haar niet relevant was. Als de andere afdeling niet van deze databewerking op de hoogte is, gaat deze afdeling uit van verkeerde en incomplete informatie. Dit heeft tot gevolg dat je kostbare, verkeerde beslissingen neemt.

2. Informatie wordt niet gesynchroniseerd tussen databronnen
Ten tweede wordt informatie in de ene informatiebron bijgewerkt, maar niet in de andere. Als de marketingafdeling een adres wijzigt in het CRM-systeem, wordt dit niet automatisch bijgewerkt in het facturatiesysteem en andersom. Inconsistentie in informatie tussen verschillende datasilo’s komt in veel meer situaties voor. Dit heeft tijd, moeite en kosten tot gevolg om uit te zoeken waarom de data inconsistent is, om dit vervolgens handmatig op te lossen.

Hoe voorkom je problemen als gevolg van datasilo’s?

Er zijn verschillende manieren om te voorkomen dat je bovenstaande problemen ervaart. Het belangrijkste is om te voorkomen dat er datasilo’s in je organisatie ontstaan. Er moet binnen de organisatie een cultuur ontstaan waarbij iedereen zich bewust is van het belang van goed gestructureerde en complete data. Zo kan je je collega’s vragen om data altijd onbewerkt in databases op te slaan. Ook vraag je collega’s om wijzigingen en mutaties die zij in IT-systemen doorvoeren, ook door te geven aan andere afdelingen. Of beter nog, om deze wijzigingen ook direct door te voeren in andere IT-systemen waar deze data in opgeslagen is.

Dit is een erg arbeidsintensief en foutgevoelig proces waarbij veel focus benodigd is om iedere collega scherp te houden. Er hoeft immers maar één collega te zijn die zich door tijdsdruk of uit gewoonte vergeet zich aan dit proces te houden, en de waardevolle data binnen je organisatie is weer vervuild.

Door datasilo’s ontstaan er in organisaties vaak twee versies van de waarheid.

Voorkom datasilo’s met een datawarehouse of dataplatform

Een datawarehouse of dataplatform is een structurele oplossing om problemen als gevolg van datasilo’s te voorkomen. In een datawarehouse verzamel je alle beschikbare databronnen in de organisatie, correct en consequent gestructureerd en gesynchroniseerd. Al deze data is 24/7 beschikbaar voor iedereen binnen de organisatie en vormt de basis van dashboards volgens het Practical Performance Measurement (PPM) principe. Deze dashboards kan je bouwen in tools zoals Power BIMicroStrategy of Tableau.

Dankzij deze dashboards heb je altijd inzicht in de voor jou belangrijkste KPI’s en ververs je de data met één druk op de knop. Ook het maken van nieuwe dashboards is eenvoudig, omdat alle data al correct gestructureerd en actueel in het dataplatform staat.

Meer dan 20 jaar ervaring met data management

Inergy helpt organisaties al meer dan 20 jaar om alle waarde uit hun data te halen. Samen met 150 collega’s zetten wij ons 24/7 in om impact te maken met jouw data. Wij bieden full service, non-stop data management en data analytics op basis van de meest effectieve en efficiënte technologieën van dit moment. We zijn officieel Microsoft Gold Partner en Snowflake Select Partner. Daarnaast zijn we ISAE3402 en ISO 27001 gecertificeerd, waardoor jouw data gegarandeerd veilig is.

Wil je meer weten? Vul dan het contactformulier in en één van onze specialisten neemt zo snel mogelijk contact met je op voor meer informatie over het voorkomen en verhelpen van datasilo’s.

Blijf op de hoogte

De auteur

Inergy
Inergy

Wij eten, drinken en ademen data – en wat je ermee kan doen. Dat delen we graag met jou. Meer weten over Inergy? Neem contact met ons op via 0348 45 76 66 of info@inergy.nl.

Meer berichten

Alle berichten

Even kennismaken met onze nieuwste IT-Auditor Sem te Velde

Even kennismaken met onze nieuwste IT-Auditor Sem te Velde

Sinds 1 juli werkt Sem te Velde als junior IT-Auditor bij Inergy. Hoe heeft hij zijn eerste maanden in deze rol beleefd? We vroegen het hem en hij legde ook gelijk uit wat het werk van een IT-Auditor nu eigenlijk precies inhoudt.

Lees verder

Petra Molenaars en Evelien Okken over hun passie voor privacy

Petra Molenaars en Evelien Okken over hun passie voor privacy

Privacy Consultants Petra Molenaars en Evelien Okken ondersteunen onze klanten bij informatiebeveiliging en privacy. Met hun kennis staan ze klaar om overheidsorganisaties te helpen bij implementatie en naleving van informatiebeveiliging. We vroegen waar hun passie voor privacy vandaan komt en wat mensen eigenlijk te verbergen hebben op het gebied van privacy.

Lees verder

5 redenen waardoor meerdere versies van de waarheid ontstaan

5 redenen waardoor meerdere versies van de waarheid ontstaan

Iedereen kent het wel: verschillende collega's hebben verschillende cijfers voor dezelfde KPI. We noemen dit ook wel "meerdere versies van de waarheid". In dit artikel bespreken we 5 oorzaken van meerdere versies van de waarheid en ontdek je hoe je in je organisatie tot één versie van de waarheid komt.

Lees verder