1-7-2021 Data Analytics

Waarom datasilo’s voor problemen zorgen

Een begrip dat bij veel mensen onbekend is, maar dat bij iedereen voor herkenbare problemen zorgt: een datasilo. In deze blog leggen we uit wat een datasilo precies is, welke problemen die met zich meebrengt op gebied van data analytics en hoe je die kan voorkomen.

Wat is een datasilo?

Laten we beginnen met de vraag wat een datasilo precies is. Een datasilo, ook wel informatiesilo genoemd, is een verzameling van data afkomstig uit één of meerdere databronnen die geïsoleerd is van de rest van de organisatie. In deze situatie ontbreken er belangrijke connecties met andere data in de organisatie, is de data niet zomaar voor iedereen toegankelijk en is de data in de ene datasilo vaak op een andere manier gestructureerd dan data in de andere datasilo. Dit heeft als gevolg dat het erg ingewikkeld, kostbaar én tijds- en arbeidsintensief is om goede inzichten te krijgen uit deze waardevolle bedrijfsdata.

Een datasilo is een verzameling van data afkomstig uit één of meerdere databronnen die geïsoleerd is van de rest van de organisatie.

De problemen die datasilo’s met zich meebrengen

Datasilo’s zorgen voor verschillende problemen wat betreft data management waardoor het moeilijk is om kwalitatief goede data analytics toe te passen. Hieronder lichten we de vijf grootste problemen toe die datasilo’s met zich meebrengen.

1. Geen 360-graden inzicht van de organisatie

Het woord ‘silo’ zegt het eigenlijk al: data in een datasilo is niet verbonden met data uit andere databronnen. Je hebt hierdoor geen holistisch beeld van de gehele organisatie. Dit levert problemen op met het maken van rapportages en met het verkrijgen van inzichten om datagedreven beslissingen te kunnen nemen. Als de benodigde data in verschillende databronnen staat, is het vaak lastig om deze data eenvoudig met elkaar te combineren in één dashboard of rapportage. Het is vaak ook nodig om steeds weer handmatige exports te maken vanuit de verschillende datasilo’s, om deze data vervolgens correct te structuren, combineren én analyseren op de manier zoals jij dit wil. Dit moet je iedere keer dat je de rapportage wil maken opnieuw doen.

2. Data in de verschillende databronnen is anders gestructureerd

Een ander probleem dat datasilo’s met zich meebrengen is het feit dat data in de verschillende databronnen anders gestructureerd is. De datum kan je schrijven als 19-06-2021, maar bijvoorbeeld ook als 19 juni 2021 of 19-jun-2021. Ook telefoonnummers kunnen op verschillende manieren zijn gestructureerd:

  • 06-xxxxxxxx
  • 06xxxxxxxx
  • 06 xx xx xx xx xx

Naast de datum en het telefoonnummer zijn er nog vele voorbeelden van data die op verschillende manieren zijn gestructureerd en hierdoor niet eenvoudig in relatie tot elkaar te visualiseren en analyseren zijn.

Artikelnummers in inkoopsysteem en verkoopsysteem
Een ander voorbeeld  zijn artikelnummers in het verkoopsysteem en artikelnummers in het inkoopsysteem. Deze wijken vaak van elkaar af en kan je daarom niet met elkaar comibineren. Door de data te verzamelen in een dataplatform of datawarehouse kan je deze artikelnummers in beide systemen integraal aan elkaar linken.

Om de data uit de verschillende databronnen te kunnen gebruiken, moet je deze data hetzelfde structureren. Vaak betekent dit dat naast de handmatige exports die je in voorbeeld 1 ziet, je de data ook iedere keer handmatig moet herstructureren. Dit zorgt voor een extra arbeidsintensieve en foutgevoelige werkwijze die je veelal handmatig moet uitvoeren.

Lees meer: Inergy adviseert over de juiste aanpak, ontwerpt en bouwt het dataplatform voor PostNL.

3. Data in datasilo’s is niet voor iedereen beschikbaar

De meeste organisaties maken gebruik van veel verschillende tools die allemaal data bevatten. Niet iedereen binnen de organisatie heeft echter toegang tot al deze tools. Hierdoor kan niet iedereen bij de data. Ook het eenvoudig delen van data is hierdoor niet mogelijk, omdat een collega eerst moet inloggen in de tool om bij de data te kunnen. Als deze collega echter niet over de juiste rechten bezit, kan deze de gedeelde data niet bereiken.

Whitepaper

Onze visie op een Dataplatform

Vrijwel iedere organisatie beschikt over enorme hoeveelheden data. Uit die data is veel informatie te halen. In een dataplatform verzamel en structureer je al deze data.

Download whitepaper

4. Datasilo’s creëren verspilde opslagcapaciteit

In veel organisaties waar datasilo’s bestaan heeft ieder team zijn eigen database met informatie die relevant is voor de desbetreffende afdeling. Vaak is dezelfde data echter voor meerdere afdelingen relevant. Ieder team slaat dezelfde data op in zijn eigen database. Hierdoor ontstaat een veelvoud van de gebruikte opslagcapaciteit wat extra kosten met zich meebrengt. Door datasilo’s te voorkomen, bespaar je op het beheer én op de kosten van extra opslagcapaciteit.

5. Datasilo’s zorgen voor inconsistente informatie

Naast het feit dat datasilo’s opslagcapaciteit verspillen omdat je dezelfde data op verschillende plekken opslaat, zorgt het ook vaak op twee manieren voor inconsistente informatie.

1. Eigen databewerkingen
Ten eerste bewerkt iedere afdeling de data op haar eigen manier, bijvoorbeeld door bepaalde filters of bewerkingen toe te passen op de data die voor de desbetreffende afdeling van belang zijn. Wanneer je deze data vervolgens deelt met een andere afdeling, kan relevante informatie voor die afdeling ontbreken omdat dit is uitgefilterd door de eerste afdeling.
Het kan ook voorkomen dat er hierdoor twee versies van de waarheid ontstaan: de ene afdeling kan bepaalde informatie verwijderd hebben omdat deze voor haar niet relevant was. Als de andere afdeling niet van deze databewerking op de hoogte was, gaat deze afdeling van verkeerde en incomplete informatie uit. Dit heeft tot gevolg dat je kostbare, verkeerde beslissingen neemt.

2. Informatie wordt niet gesynchroniseerd tussen databronnen
Ten tweede wordt informatie in de ene informatiebron bijgewerkt, maar niet in de andere. Als de marketingafdeling bijvoorbeeld een adres wijzigt in het CRM-systeem, wordt dit niet automatisch bijgewerkt in het facturatiesysteem. Inconsistentie in informatie tussen verschillende datasilo’s komt in veel meer situaties voor. Dit heeft tijd, moeite en kosten tot gevolg om uit te zoeken waarom de data inconsistent is, om dit vervolgens handmatig op te lossen.

Door datasilo’s ontstaan er in organisaties vaak twee versies van de waarheid

Hoe voorkom je problemen als gevolg van datasilo’s?

Er zijn verschillende manieren om te voorkomen dat je bovenstaande problemen ervaart. Het belangrijkste is om te voorkomen dat er datasilo’s in je organisatie ontstaan en dat er binnen de organisatie een cultuur ontstaat waarbij iedereen zich bewust is van het belang van goed gestructureerde en complete data. Zo kan je je collega’s vragen om data altijd onbewerkt in databases op te slaan en om wijzigingen en mutaties die zij in IT-systemen doorvoeren, ook door te geven aan andere afdelingen of om deze wijzigingen ook direct door te voeren in andere IT-systemen waar deze data in opgeslagen is.

Dit is een erg arbeidsintensief en foutgevoelig proces waarbij veel focus benodigd is om iedere collega scherp te houden. Er hoeft immers maar één collega te zijn die zich door tijdsdruk of uit gewoonte vergeet zich aan dit proces te houden, en de waardevolle data binnen je organisatie is weer vervuild.

Het is belangrijk dat er binnen de organisatie een cultuur ontstaat waarbij iedereen zich bewust is van het belang van goed gestructureerde en complete data.

Voorkom datasilo’s met een datawarehouse of dataplatform
Een datawarehouse of dataplatform is een structurele oplossing om problemen als gevolg van datasilo’s te voorkomen. In een dataplatform verzamel je alle beschikbare databronnen in de organisatie, correct en consequent gestructureerd en gesynchroniseerd. Al deze data is 24/7 beschikbaar voor iedereen binnen de organisatie en vormt de basis van dashboards volgens het Practical Performance Measurement (PPM) principe. Deze dashboards kan je bouwen in tools zoals Power BI, MicroStrategy of Tableau.

Dankzij deze dashboards heb je altijd inzicht in de voor jou belangrijkste KPI’s en ververs je de data met één druk op de knop. Ook het maken van nieuwe dashboards is eenvoudig, omdat alle data al correct gestructureerd en actueel in het dataplatform staat.


Inergy

Wij eten, drinken en ademen data – en wat je ermee kan doen. Dat delen we graag met jou. Meer weten over Inergy? Neem contact met ons op via 0348 45 76 66 of info@inergy.nl.

Deel dit artikel

Peter Boumans

Voorkom datasilo's met een dataplatform

Wil je graag meer weten over het voorkomen of verhelpen van datasilo’s of over ons dataplatform in het algemeen? Neem dan gerust contact met ons op.

Bel ons op 0348 45 76 66

Mail Peter Boumans via peter.boumans@inergy.nl





    Lees gerust verder...

    4-8-2021

    Een dag uit het leven van Lina Nsoni-Zau, Young Professional

    30-7-2021

    Data analytics voor bedrijven: meegaan of stilstaan?

    Altijd op de hoogte

    Schrijf je in voor onze nieuwsbrief en ontvang maandelijks een update.