Snel naar content
foto van laptop met spotify beginscherm

Kan ik mijn eigen Spotify jaaroverzicht reproduceren?

Het einde van 2021 nadert en Spotify geeft ons als kerstkadootje een overzicht van je streamgedrag van genaamd ‘Wrapped 2021’. Naar alle waarschijnlijkheid generen ze dit overzicht aan de hand van een algoritme wat door je streaminggeschiedenis heen akkert en hier onder andere de top 5 meest geluisterde nummers en artiesten uit naar voren haalt. Zo ingewikkeld moet dat allemaal niet zijn, dacht ik begin november en daarom leek het me leuk om de proef op de som te nemen.

Data opvragen

Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen. Dus na één google search had ik in mijn profiel mijn eigen datadump opgevraagd. Enkele dagen later ontving ik een linkje naar een download waar ik mijn data in json-formaat kon downloaden. Hiervan heb ik vervolgens de voor mij relevante informatie ingeladen in Power BI.

Spotify leverde een lijst aan met gestreamde items, een lijst met welke nummers je in welke playlist hebt opgeslagen en welke searches je hebt gedaan, op welke momenten. Daarnaast ook, voor dit doeleinde minder relevante, maar wel interessante data, bijvoorbeeld binnen welke marketingcategorieën ik volgens Spotify val.
In dit bestandje genaamd ‘Inferences’ (wat je in het Nederlands zou kunnen vertalen naar gevolgtrekking of conclusie) kon ik bijvoorbeeld zien dat ik muziek stream in de auto, een Peugeot rijd, wel eens op een Sonos speaker heb gestreamd en nog tal van andere zaken op basis waarvan Spotify mij gepersonaliseerde reclame kan sturen.

Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen.

Dimensionele data ontbreekt

Na het inladen en opschonen van de aangeleverde data kwam ik al snel tot de conclusie dat de analyses die ik kon doen redelijk beperkt waren. De in datawarehouse-termen genoemde dimensionele data ontbreekt. Ik kon dus wel zien dat ik een bepaald nummer had afgespeeld, hoe lang ik naar dit nummer had geluisterd en op welk moment, maar niet binnen welk genre dat nummer viel of bijvoorbeeld andere kenmerken van een artiest. Alleen de meest basale dimensionele data, naam van het nummer en de naam van de artiest werden in de streaminggeschiedenis meegegeven.

Doordat ik data miste om zelf deze dimensies te maken, kon ik onmogelijk overkoepelende analyses doen omdat ik mijn streaminggeschiedenis en mijn playlists niet aan elkaar kon knopen door dimensies die door beiden tabellen werden gedeeld. Zo kon ik bijvoorbeeld niet analyseren naar welke playlist ik het meest had geluisterd. Ik heb me daarom gefocust op mijn streaminggeschiedenis. Hiermee zou ik immers de voornaamste zaken uit de ‘Wrapped 2021’ van Spotify moeten kunnen reproduceren.

Ook interessant: Help ik word getracked. Wat Google Maps allemaal weet over jou.

Verschillen

Natuurlijk moet ik hier vooraf een aantal kanttekeningen bij plaatsen: ik weet niet welke datumrange Spotify heeft gebruikt voor het generen van hun overzicht, maar ik gok 1 januari tot 1 december 2021. Ik heb begin november mijn data opgevraagd en zal daarom ook net iets andere resultaten hebben. Daarnaast kan ik me voorstellen dat Spotify artiesten die op een bepaald nummer voorkomen, maar niet als hoofdartiest, ook meerekent in hun overzicht. Ik heb simpelweg de artiestennaam gepakt die werd aangegeven als hoofdartiest. En zo zijn er misschien nog wel meer verschillen waar ik geen zicht op heb.

Dan… de resultaten!

Om gelijk maar met de deur in huis te vallen, hieronder zie je het overzicht dat Spotify voor mij heeft gegenereerd.

Op zich kan ik me wel herkennen in deze cijfers. Ik luister inderdaad veel naar een kleine selectie aan Reggeaton nummers gemaakt door onder andere Ozuna en Bad Bunny. Het genre dat ik voor mijn gevoel het meest luister is Techno. Maar nu de vraag, strookt dit met mijn eigen analyse?

Vergelijking met ‘Wrapped’

Mijn eigen overzicht heb ik in het jasje van de Spotify webplayer gestoken en met het menuutje aan de linkerkant kan je ook daadwerkelijk navigeren naar de extra pagina’s searches en playlists die ik ook had gemaakt. Ik zie op mijn ‘Home’ pagina dat het aantal gestreamde minuten redelijk overeenkomt, 67,581 om 67,077 en ook de topartiesten en topnummers zie ik in mijn eigen data terugkomen. Weliswaar net op een andere plek en in een andere volgorde. Ofwel ‘Wrapped 2021’ neemt mij niet in de mailing.

Aanvullende overzichten

Ik heb drie extra analyses gemaakt met de aangeleverde data. Eentje om in te zoomen per artiest, eentje om te kijken naar mijn ‘searches’ en eentje die de verhoudingen tussen mijn playlists laat zien. Hieronder een indruk van de pagina met een doorsnede per artiest.


Wil je meer weten?
Heb je een vraag over mijn bijzondere muzieksmaak of wil je meer weten over hoe ik dit heb aangepakt kan je me altijd een mailtje sturen.

Blijf op de hoogte

De auteur

Inergy
Inergy

Wij eten, drinken en ademen data – en wat je ermee kan doen. Dat delen we graag met jou. Meer weten over Inergy? Neem contact met ons op via 0348 45 76 66 of info@inergy.nl.

Meer berichten

Alle berichten

Tips voor veilig online shoppen

Tips voor veilig online shoppen

Online shoppen biedt ons het gemak van winkelen vanuit huis, met een eindeloze selectie aan leuke kleding, schoenen, accessoires en spullen voor in huis. Met slechts een paar klikken kunnen we dit enorme assortiment aan producten vinden en bestellen. Ondanks dit gemak, is het belangrijk om ons bewust te zijn van potentiële risico’s die gepaard gaan met online shoppen.

Lees verder

Inergy implementeerde Microsoft Fabric: dit ontdekte onze expert

Inergy implementeerde Microsoft Fabric: dit ontdekte onze expert

De wereld van data analytics is in rep en roer. De reden? Microsoft Fabric. Dit splinternieuwe data analytics platform brengt alle losse analytics tools van Microsoft samen. Veel specialisten experimenteren ermee, maar heeft iemand het platform al bij een klant geïmplementeerd? Wij wel! In dit blog vertelt Merijn wat hij van de implementatie van Microsoft Fabric heeft geleerd.

Lees verder

Veilig (online) de vakantie door

Veilig (online) de vakantie door

Ga je binnenkort op vakantie? Een heerlijk tijd van ontspanning en plezier, maar volgens onze informatieveiligheid experts ook een periode...

Lees verder