Het einde van 2021 nadert en Spotify geeft ons als kerstkadootje een overzicht van je streamgedrag van genaamd ‘Wrapped 2021’. Naar alle waarschijnlijkheid generen ze dit overzicht aan de hand van een algoritme wat door je streaminggeschiedenis heen akkert en hier onder andere de top 5 meest geluisterde nummers en artiesten uit naar voren haalt. Zo ingewikkeld moet dat allemaal niet zijn, dacht ik begin november en daarom leek het me leuk om de proef op de som te nemen.
Data opvragen
Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen. Dus na één google search had ik in mijn profiel mijn eigen datadump opgevraagd. Enkele dagen later ontving ik een linkje naar een download waar ik mijn data in json-formaat kon downloaden. Hiervan heb ik vervolgens de voor mij relevante informatie ingeladen in Power BI.
Spotify leverde een lijst aan met gestreamde items, een lijst met welke nummers je in welke playlist hebt opgeslagen en welke searches je hebt gedaan, op welke momenten. Daarnaast ook, voor dit doeleinde minder relevante, maar wel interessante data, bijvoorbeeld binnen welke marketingcategorieën ik volgens Spotify val.
In dit bestandje genaamd ‘Inferences’ (wat je in het Nederlands zou kunnen vertalen naar gevolgtrekking of conclusie) kon ik bijvoorbeeld zien dat ik muziek stream in de auto, een Peugeot rijd, wel eens op een Sonos speaker heb gestreamd en nog tal van andere zaken op basis waarvan Spotify mij gepersonaliseerde reclame kan sturen.
Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen.
Dimensionele data ontbreekt
Na het inladen en opschonen van de aangeleverde data kwam ik al snel tot de conclusie dat de analyses die ik kon doen redelijk beperkt waren. De in datawarehouse-termen genoemde dimensionele data ontbreekt. Ik kon dus wel zien dat ik een bepaald nummer had afgespeeld, hoe lang ik naar dit nummer had geluisterd en op welk moment, maar niet binnen welk genre dat nummer viel of bijvoorbeeld andere kenmerken van een artiest. Alleen de meest basale dimensionele data, naam van het nummer en de naam van de artiest werden in de streaminggeschiedenis meegegeven.
Doordat ik data miste om zelf deze dimensies te maken, kon ik onmogelijk overkoepelende analyses doen omdat ik mijn streaminggeschiedenis en mijn playlists niet aan elkaar kon knopen door dimensies die door beiden tabellen werden gedeeld. Zo kon ik bijvoorbeeld niet analyseren naar welke playlist ik het meest had geluisterd. Ik heb me daarom gefocust op mijn streaminggeschiedenis. Hiermee zou ik immers de voornaamste zaken uit de ‘Wrapped 2021’ van Spotify moeten kunnen reproduceren.
Ook interessant: Help ik word getracked. Wat Google Maps allemaal weet over jou.
Verschillen
Natuurlijk moet ik hier vooraf een aantal kanttekeningen bij plaatsen: ik weet niet welke datumrange Spotify heeft gebruikt voor het generen van hun overzicht, maar ik gok 1 januari tot 1 december 2021. Ik heb begin november mijn data opgevraagd en zal daarom ook net iets andere resultaten hebben. Daarnaast kan ik me voorstellen dat Spotify artiesten die op een bepaald nummer voorkomen, maar niet als hoofdartiest, ook meerekent in hun overzicht. Ik heb simpelweg de artiestennaam gepakt die werd aangegeven als hoofdartiest. En zo zijn er misschien nog wel meer verschillen waar ik geen zicht op heb.
Dan… de resultaten!
Om gelijk maar met de deur in huis te vallen, hieronder zie je het overzicht dat Spotify voor mij heeft gegenereerd.
Op zich kan ik me wel herkennen in deze cijfers. Ik luister inderdaad veel naar een kleine selectie aan Reggeaton nummers gemaakt door onder andere Ozuna en Bad Bunny. Het genre dat ik voor mijn gevoel het meest luister is Techno. Maar nu de vraag, strookt dit met mijn eigen analyse?
Vergelijking met ‘Wrapped’
Mijn eigen overzicht heb ik in het jasje van de Spotify webplayer gestoken en met het menuutje aan de linkerkant kan je ook daadwerkelijk navigeren naar de extra pagina’s searches en playlists die ik ook had gemaakt. Ik zie op mijn ‘Home’ pagina dat het aantal gestreamde minuten redelijk overeenkomt, 67,581 om 67,077 en ook de topartiesten en topnummers zie ik in mijn eigen data terugkomen. Weliswaar net op een andere plek en in een andere volgorde. Ofwel ‘Wrapped 2021’ neemt mij niet in de mailing.
Aanvullende overzichten
Ik heb drie extra analyses gemaakt met de aangeleverde data. Eentje om in te zoomen per artiest, eentje om te kijken naar mijn ‘searches’ en eentje die de verhoudingen tussen mijn playlists laat zien. Hieronder een indruk van de pagina met een doorsnede per artiest.
Wil je meer weten?
Heb je een vraag over mijn bijzondere muzieksmaak of wil je meer weten over hoe ik dit heb aangepakt kan je me altijd een mailtje sturen.