Snel naar content
foto van laptop met spotify beginscherm

Kan ik mijn eigen Spotify jaaroverzicht reproduceren?

Het einde van 2021 nadert en Spotify geeft ons als kerstkadootje een overzicht van je streamgedrag van genaamd ‘Wrapped 2021’. Naar alle waarschijnlijkheid generen ze dit overzicht aan de hand van een algoritme wat door je streaminggeschiedenis heen akkert en hier onder andere de top 5 meest geluisterde nummers en artiesten uit naar voren haalt. Zo ingewikkeld moet dat allemaal niet zijn, dacht ik begin november en daarom leek het me leuk om de proef op de som te nemen.

Data opvragen

Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen. Dus na één google search had ik in mijn profiel mijn eigen datadump opgevraagd. Enkele dagen later ontving ik een linkje naar een download waar ik mijn data in json-formaat kon downloaden. Hiervan heb ik vervolgens de voor mij relevante informatie ingeladen in Power BI.

Spotify leverde een lijst aan met gestreamde items, een lijst met welke nummers je in welke playlist hebt opgeslagen en welke searches je hebt gedaan, op welke momenten. Daarnaast ook, voor dit doeleinde minder relevante, maar wel interessante data, bijvoorbeeld binnen welke marketingcategorieën ik volgens Spotify val.
In dit bestandje genaamd ‘Inferences’ (wat je in het Nederlands zou kunnen vertalen naar gevolgtrekking of conclusie) kon ik bijvoorbeeld zien dat ik muziek stream in de auto, een Peugeot rijd, wel eens op een Sonos speaker heb gestreamd en nog tal van andere zaken op basis waarvan Spotify mij gepersonaliseerde reclame kan sturen.

Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen.

Dimensionele data ontbreekt

Na het inladen en opschonen van de aangeleverde data kwam ik al snel tot de conclusie dat de analyses die ik kon doen redelijk beperkt waren. De in datawarehouse-termen genoemde dimensionele data ontbreekt. Ik kon dus wel zien dat ik een bepaald nummer had afgespeeld, hoe lang ik naar dit nummer had geluisterd en op welk moment, maar niet binnen welk genre dat nummer viel of bijvoorbeeld andere kenmerken van een artiest. Alleen de meest basale dimensionele data, naam van het nummer en de naam van de artiest werden in de streaminggeschiedenis meegegeven.

Doordat ik data miste om zelf deze dimensies te maken, kon ik onmogelijk overkoepelende analyses doen omdat ik mijn streaminggeschiedenis en mijn playlists niet aan elkaar kon knopen door dimensies die door beiden tabellen werden gedeeld. Zo kon ik bijvoorbeeld niet analyseren naar welke playlist ik het meest had geluisterd. Ik heb me daarom gefocust op mijn streaminggeschiedenis. Hiermee zou ik immers de voornaamste zaken uit de ‘Wrapped 2021’ van Spotify moeten kunnen reproduceren.

Ook interessant: Help ik word getracked. Wat Google Maps allemaal weet over jou.

Verschillen

Natuurlijk moet ik hier vooraf een aantal kanttekeningen bij plaatsen: ik weet niet welke datumrange Spotify heeft gebruikt voor het generen van hun overzicht, maar ik gok 1 januari tot 1 december 2021. Ik heb begin november mijn data opgevraagd en zal daarom ook net iets andere resultaten hebben. Daarnaast kan ik me voorstellen dat Spotify artiesten die op een bepaald nummer voorkomen, maar niet als hoofdartiest, ook meerekent in hun overzicht. Ik heb simpelweg de artiestennaam gepakt die werd aangegeven als hoofdartiest. En zo zijn er misschien nog wel meer verschillen waar ik geen zicht op heb.

Dan… de resultaten!

Om gelijk maar met de deur in huis te vallen, hieronder zie je het overzicht dat Spotify voor mij heeft gegenereerd.

Op zich kan ik me wel herkennen in deze cijfers. Ik luister inderdaad veel naar een kleine selectie aan Reggeaton nummers gemaakt door onder andere Ozuna en Bad Bunny. Het genre dat ik voor mijn gevoel het meest luister is Techno. Maar nu de vraag, strookt dit met mijn eigen analyse?

Vergelijking met ‘Wrapped’

Mijn eigen overzicht heb ik in het jasje van de Spotify webplayer gestoken en met het menuutje aan de linkerkant kan je ook daadwerkelijk navigeren naar de extra pagina’s searches en playlists die ik ook had gemaakt. Ik zie op mijn ‘Home’ pagina dat het aantal gestreamde minuten redelijk overeenkomt, 67,581 om 67,077 en ook de topartiesten en topnummers zie ik in mijn eigen data terugkomen. Weliswaar net op een andere plek en in een andere volgorde. Ofwel ‘Wrapped 2021’ neemt mij niet in de mailing.

Aanvullende overzichten

Ik heb drie extra analyses gemaakt met de aangeleverde data. Eentje om in te zoomen per artiest, eentje om te kijken naar mijn ‘searches’ en eentje die de verhoudingen tussen mijn playlists laat zien. Hieronder een indruk van de pagina met een doorsnede per artiest.


Wil je meer weten?
Heb je een vraag over mijn bijzondere muzieksmaak of wil je meer weten over hoe ik dit heb aangepakt kan je me altijd een mailtje sturen.

Blijf op de hoogte

De auteur

Inergy
Inergy

Wij eten, drinken en ademen data – en wat je ermee kan doen. Dat delen we graag met jou. Meer weten over Inergy? Neem contact met ons op via 0348 45 76 66 of info@inergy.nl.

Meer berichten

Alle berichten

Effectief begroten bij de lokale overheid: Focus op programma’s én teams

Effectief begroten bij de lokale overheid: Focus op programma’s én teams

Als lokale overheid sta je voor een constante uitdaging bij het beheren van je budgetten. Door te sturen op team- en afdelingsniveau anticipeer je beter op uitdagingen. Dit geeft een breder inzicht in de prestaties van jouw gemeente en het zorgt ervoor dat je jouw programmadoelen realistischer en effectiever behaald.

Lees verder

Hoe transformeert data de machine-industrie met supply chain-optimalisatie?

Hoe transformeert data de machine-industrie met supply chain-optimalisatie?

In de machine-industrie, waar efficiëntie en precisie cruciaal zijn, maakt een goed geoptimaliseerde supply chain het verschil tussen winstgevendheid en stilstand. Supply chai-optimalisatie gaat niet alleen over het stroomlijnen van processen, maar ook over het verminderen van kosten, verbeteren van levertijden, en verhogen van de flexibiliteit.

Lees verder

Hoe data inzetten helpt bij het verhogen van klanttevredenheid in de machine-industrie

Hoe data inzetten helpt bij het verhogen van klanttevredenheid in de machine-industrie

Dataplatforms spelen een essentiële rol in het verhogen van klanttevredenheid door jou in staat te stellen meer gepersonaliseerde, efficiënte en proactieve klankinteracties te bieden.

Lees verder