In zijn vorige blog liet Berend Wijte, Data Scientist bij Inergy, zien wat je allemaal met jouw Spotify data kan doen. Spotify is natuurlijk niet de enige app die je data opslaat. Het bedrijf dat waarschijnlijk het meeste over jou weet is natuurlijk Google. Deze keer onderzoekt hij zijn eigen data historie van één van zijn favoriete apps: Google Maps.

“Ik heb het al eens gezegd en ik blijf het zeggen, de APG opent veel mogelijkheden voor nerds die graag met hun eigen getalletjes spelen. Vergeleken met andere bedrijven heeft Google het opvragen van data heel netjes geregeld”, vertelt Berend. “Als je ingelogd bent op Google maps kan je naar je profiel gaan waar je je data kan opvragen, die je vervolgens dezelfde dag nog binnenkrijgt. Het probleem is wel dat ik me niet kan herinneren dat ik Google toestemming heb gegeven om die data te verzamelen. Maar met één druk op de knop kan je ervoor zorgen dat je niet meer getrackt wordt.”

Coördinaten verzamelen
“In de meeste gevallen is de data van Google maps erg fijn gestructureerd voor Data Scientists. Dat wil zeggen: je kan er op het eerste gezicht niks mee, totdat je het schoonmaakt en in het juiste formaat zet”, legt Berend uit. “Bij Google Maps is dat niet anders: elke observatie heeft een geschatte locatie en elke geschatte locatie heeft ook weer schattingen over je vervoersmiddel (auto, trein of de oude vertrouwde benenwagen). De data staat namelijk in JSON-formaat.”

“Aan de hand van de gegevens die je hebt kan je van alles te weten komen. Ten eerste heb je natuurlijk longitudes en latitudes om de coördinaten te bepalen”, gaat Berend verder. “Je hebt de tijd van de locatie en tenslotte schattingen van je vervoersmiddel. Hiermee heb je alles wat je nodig hebt om tot een aantal interessante inzichten te komen.”

Power BI
“Voordat je begint met bouwen vraag je jezelf af wat je wil weten”, vervolgt Berend. “Ik wilde bijvoorbeeld eerst een kaartje met daarop al mijn locaties, zodat ik zelf rond kan kijken. Daarnaast klagen mijn vrienden dat ik te hard rijd, zeker een analyse waard lijkt me. Ook wil ik weten hoe vaak ik op verschillende plekken kom zoals de sportschool, het buitenland of mijn opa en oma.”

Aan de hand van deze vragen komt hij op drie pagina’s voor zijn Power BI-rapport:

  1. Waar ben ik geweest?
  2. Hoe vaak kom ik op plekken?
  3. Wat is mijn snelheid?

Kaarten in Power BI
“Binnen Power BI zijn er veel manieren om locatiedata te tonen. Zo heb je de simpele Map en de Filled Map. De Shape Map visual is momenteel in preview en als je écht een geavanceerde visual wil, kan je de ArcGIS Maps for Power BI visual proberen. Het is erg leuk om met de features van deze visuals te spelen. Zelf heb ik het bij de simpele Map visual gelaten, het ging mij immers om het laten zien van mijn coördinaten. De mogelijkheden van verschillende map visuals zijn een mooi onderwerp voor een volgende blog.”

Analyse tijd
“Tijd om mijn vragen te beantwoorden. De eerste vraag: waar ben ik geweest? Op de kaart vallen direct een paar plekken op: Amerika en Japan. De data is redelijk accuraat, ik zie in welke steden ik ben geweest”, vertelt Berend. “Als je mobiele data uitstaat heeft Google overigens wel problemen om je te volgen”, voegt hij eraan toe. Te zien is dat hij zich in april goed aan de coronamaatregelen heeft gehouden: hij is niet buiten Brabant geweest.

Vervolgens onderzoekt Berend de tweede vraag: hoe vaak kom ik op bepaalde plekken? “Als ik kijk naar het aantal dagen in het buitenland springt 2017 eruit. Dit klopt helemaal, want ik heb in het voorjaar van 2017 in Londen gewoond. Verder ben ik dit jaar vanwege corona veel minder op vakantie geweest. Een te verwachten trend. Daarnaast zie ik dat ik minder naar de sportschool ga dan verwacht. Twee keer per maand lijkt weinig, máár ik hockey ook drie keer per week. Ik zie in ieder geval geen reden om mijn patroon aan te passen. Ten slotte zie ik dat ik geregeld bij mijn opa en oma op bezoek ga. Dat kan ik uiteraard nog meer doen”, grapt hij.

De laatste vraag gaat over zijn snelheid. “De screenshots delen gaat me (om juridische redenen) iets te ver, maar ik kan de conclusies delen. Ik kan bijvoorbeeld duidelijk zien wanneer ik ben begonnen bij Inergy. Tijdens mijn vakanties is mijn snelheid een stuk lager. In 2019 hield ik me behoorlijk goed aan de snelheidsregels en in 2020 rijd ik gemiddeld langzamer dan in 2019.”

Je eigen data
“Zelf vind ik het geweldig om mijn eigen data in te kunnen zien”, concludeert Berend tevreden. “Het maken van een Power BI-rapport is een goede eerste stap om je data inzichtelijk te maken. Je kan echter nog veel meer analyses doen met data en dan komt data science om de hoek kijken. In mijn volgende blog duik ik dieper in mijn data zodat ik routes kan identificeren én meer!”

 

 

Wil jij ook de nieuwsbrief ontvangen? Schrijf je hier in!

Nieuwsbrief

Altijd op de hoogte zijn van het laatste nieuws van Inergy? Schrijf je in voor onze Data & Analtycis en/of LIAS nieuwsbrief en ontvang maandelijks een update.

Geschreven door Berend Wijte op

Ik ben Berend Wijte en ik werk als Data Scientist bij Inergy. Wil jij graag meer weten over dit onderwerp? Neem gerust contact met me op via berend.wijte@inergy.nl