Remo Schimmel, Young Professional bij Inergy, begon in 2019 met racefietsen als afwisseling op het trainen in een sportschool. Aan het begin van de lockdown kocht hij een nieuwe racefiets en is hij zijn data actief gaan bijhouden in Strava. Gevoelsmatig gaan zijn prestaties vooruit. Maar is dat ook zo? In deze blog neemt hij je mee in de analyse van zijn Strava data in een Power BI dashboard.
Slechts één Google zoekopdracht had ik nodig om erachter te komen dat het mogelijk is al je Strava data te downloaden via een account. Zelfs zonder fietscomputer gekoppeld aan je Strava account wordt er alsnog gigantisch veel data verzameld. Natuurlijk over de routes die je hebt gefietst, maar ook over je volgers, je kudos (likes), je favoriete routes en segmenten en ga zo maar door. Om te filteren wat voor mij interessant was om te weten stelde ik mezelf de volgende vraag: wat wil ik precies weten en wat heb ik daarvoor nodig? De hoofdvraag was natuurlijk vrij simpel:
Ben ik daadwerkelijk sneller gaan fietsen?
Om deze vraag te beantwoorden ben ik vanuit de volgende vragen aan de slag gegaan:
- Is mijn gemiddeld gereden snelheid omhoog gegaan?
- Is mijn gemiddeld gereden afstand omhoog gegaan?
“Om een duidelijk overzicht te krijgen heb ik een driemaandelijks gemiddelde voor de afstand en gemiddelde snelheid berekend en in een lijngrafiek geplot naast mijn maandelijks gemiddelde.”
Omdat het antwoord hierop vrij eenvoudig terug te vinden is in de data heb ik mezelf ook uitgedaagd door me af te vragen of ik niet iets te veel ‘een mooi weer fietser’ ben. Fiets ik alleen met lekker weer en altijd hetzelfde ‘makkelijke’ rondje? Hiervoor heb ik de volgende twee vragen opgesteld:
- Hoe is het weer op de dagen dat ik op de fiets zit?
- Waar fiets ik het meest naartoe?
Stijgende trend
Voor de eerste twee vragen was de Strava data over mijn activiteiten al voldoende. Na het downloaden heb ik deze data ingeladen en in Power BI opgeschoond. Vervolgens vond ik hier onder andere in terug wat mijn gemiddelde afstand per activiteit was en wat de totale afstand van de activiteit was. Hier maakte ik verschillende visualisaties van. Allereerst keek ik naar het aantal kilometers dat ik per maand heb gefietst. Los van de uitschieters april (fiets net gekocht), mei (begin lockdown, sportschool dicht) en augustus (vier dagen in de Eiffel op fietsvakantie geweest zonder Strava te gebruiken) zie ik een stijgende trend in het aantal kilometers dat ik maandelijks fiets.
Lees meer: Laat je Power BI omgeving reviewen door Inergy
Lijngrafiek
Om een duidelijk overzicht te krijgen heb ik een driemaandelijks gemiddelde voor de afstand en gemiddelde snelheid berekend en in een lijngrafiek geplot naast mijn maandelijks gemiddelde. Hieruit maak ik op dat ik sinds april bijna 5 km/h gemiddeld harder ben gaan fietsen! Dit bevestigt dus mijn vermoedens wat betreft de snelheid. Bij de gereden afstand ligt het driemaandelijks gemiddelde voor alle maanden (behalve april) tussen de 35 en 40 kilometer per rit. Er is geen sprake van een duidelijke stijging.
Weer
Voor het antwoord op de vraag of ik alleen met mooi weer aan het fietsen ben, heb ik wat extra data nodig. Gelukkig biedt het KNMI alle weerdata per weerstation openbaar aan sinds 1901. Gezien ik in Utrecht-Oost woon en meestal rond de Bilt aan het fietsen ben, koos ik ervoor de data van dit weerstation te gebruiken voor mijn analyse. Na het wederom downloaden en opschonen van de data had ik de dagelijkse gemiddelde temperatuur, windkracht, regenval en zonuren ter beschikking in Power BI. Strava vraagt altijd na een activiteit hoe intensief je deze vond en het leek me leuk te kijken of dit enig verband hield met de weercondities op die trainingsdag.
Door middel van een aantal filters een staafdiagrammen kon ik duidelijk zien dat ik meestal fiets op de dagen met weinig of geen regenval, een gemiddelde temperatuur van rond de 15 graden en windkracht 1 tot 2 en toch wel redelijk wat zonuren. Dit lijkt er op te duiden dat ik voornamelijk fiets met mooi weer. Als ik inzoom op mijn zelf-toegekende scores voor intensiteit dan zie ik dat dit niet per se verband houdt met bepaalde weercondities.
Favoriete routes
Voor de vraag waar ik het meest naartoe fiets heb ik mijn gps data nodig. Deze levert Strava ook mee, maar deze .gpx bestanden zijn niet direct geschikt voor analyse. Om hiermee te kunnen werken heb ik een kort Python script van internet afgehaald waarmee ik deze bestanden kon omzetten naar een csv bestand met 120.000 rijen met het activiteitnummer, tijdstippen en lengte-en breedtegraad. Na enkele databewerkingen kon ik ook met deze data aan de slag. Power BI geeft de mogelijkheid je gps data te plotten in een zogeheten heatmap. Die liet zien dat ik het meest heb gefietst langs de N237 (naar Zeist en Soesterberg), de Achterdijk richting Wijk bij Duurstede (aanradertje, want geen stoplichten!) en tussen de Lek en Schalkwijk, maar dat ik eigenlijk het hele gebied ten oosten van Utrecht wel meepak.
Hiermee heb ik een antwoord gevonden op alle vier mijn vragen en een tool ontwikkeld waar ik volgend jaar rond deze tijd met minimale moeite eenzelfde analyse kan doen om mijn voortgang te bekijken!
Power BI Review
Maak je al gebruik van Power BI en wil je graag weten of je jouw Power BI-dashboards al optimaal hebt ingericht of dat er nog verbeterpunten zijn? Met het Power BI Consult van Inergy krijg je inzicht in de sterke en zwakke punten van je huidige Power BI-omgeving.
We reviewen jouw Power BI omgeving op 58 punten en brengen advies uit om je Power BI dashboards nog verder te verbeteren.