Snel naar content
foto van laptop met spotify beginscherm

Kan ik mijn eigen Spotify jaaroverzicht reproduceren?

Het einde van 2021 nadert en Spotify geeft ons als kerstkadootje een overzicht van je streamgedrag van genaamd ‘Wrapped 2021’. Naar alle waarschijnlijkheid generen ze dit overzicht aan de hand van een algoritme wat door je streaminggeschiedenis heen akkert en hier onder andere de top 5 meest geluisterde nummers en artiesten uit naar voren haalt. Zo ingewikkeld moet dat allemaal niet zijn, dacht ik begin november en daarom leek het me leuk om de proef op de som te nemen.

Data opvragen

Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen. Dus na één google search had ik in mijn profiel mijn eigen datadump opgevraagd. Enkele dagen later ontving ik een linkje naar een download waar ik mijn data in json-formaat kon downloaden. Hiervan heb ik vervolgens de voor mij relevante informatie ingeladen in Power BI.

Spotify leverde een lijst aan met gestreamde items, een lijst met welke nummers je in welke playlist hebt opgeslagen en welke searches je hebt gedaan, op welke momenten. Daarnaast ook, voor dit doeleinde minder relevante, maar wel interessante data, bijvoorbeeld binnen welke marketingcategorieën ik volgens Spotify val.
In dit bestandje genaamd ‘Inferences’ (wat je in het Nederlands zou kunnen vertalen naar gevolgtrekking of conclusie) kon ik bijvoorbeeld zien dat ik muziek stream in de auto, een Peugeot rijd, wel eens op een Sonos speaker heb gestreamd en nog tal van andere zaken op basis waarvan Spotify mij gepersonaliseerde reclame kan sturen.

Spotify is wettelijk verplicht de data die ze over je verzamelen beschikbaar te stellen.

Dimensionele data ontbreekt

Na het inladen en opschonen van de aangeleverde data kwam ik al snel tot de conclusie dat de analyses die ik kon doen redelijk beperkt waren. De in datawarehouse-termen genoemde dimensionele data ontbreekt. Ik kon dus wel zien dat ik een bepaald nummer had afgespeeld, hoe lang ik naar dit nummer had geluisterd en op welk moment, maar niet binnen welk genre dat nummer viel of bijvoorbeeld andere kenmerken van een artiest. Alleen de meest basale dimensionele data, naam van het nummer en de naam van de artiest werden in de streaminggeschiedenis meegegeven.

Doordat ik data miste om zelf deze dimensies te maken, kon ik onmogelijk overkoepelende analyses doen omdat ik mijn streaminggeschiedenis en mijn playlists niet aan elkaar kon knopen door dimensies die door beiden tabellen werden gedeeld. Zo kon ik bijvoorbeeld niet analyseren naar welke playlist ik het meest had geluisterd. Ik heb me daarom gefocust op mijn streaminggeschiedenis. Hiermee zou ik immers de voornaamste zaken uit de ‘Wrapped 2021’ van Spotify moeten kunnen reproduceren.

Ook interessant: Help ik word getracked. Wat Google Maps allemaal weet over jou.

Verschillen

Natuurlijk moet ik hier vooraf een aantal kanttekeningen bij plaatsen: ik weet niet welke datumrange Spotify heeft gebruikt voor het generen van hun overzicht, maar ik gok 1 januari tot 1 december 2021. Ik heb begin november mijn data opgevraagd en zal daarom ook net iets andere resultaten hebben. Daarnaast kan ik me voorstellen dat Spotify artiesten die op een bepaald nummer voorkomen, maar niet als hoofdartiest, ook meerekent in hun overzicht. Ik heb simpelweg de artiestennaam gepakt die werd aangegeven als hoofdartiest. En zo zijn er misschien nog wel meer verschillen waar ik geen zicht op heb.

Dan… de resultaten!

Om gelijk maar met de deur in huis te vallen, hieronder zie je het overzicht dat Spotify voor mij heeft gegenereerd.

Op zich kan ik me wel herkennen in deze cijfers. Ik luister inderdaad veel naar een kleine selectie aan Reggeaton nummers gemaakt door onder andere Ozuna en Bad Bunny. Het genre dat ik voor mijn gevoel het meest luister is Techno. Maar nu de vraag, strookt dit met mijn eigen analyse?

Vergelijking met ‘Wrapped’

Mijn eigen overzicht heb ik in het jasje van de Spotify webplayer gestoken en met het menuutje aan de linkerkant kan je ook daadwerkelijk navigeren naar de extra pagina’s searches en playlists die ik ook had gemaakt. Ik zie op mijn ‘Home’ pagina dat het aantal gestreamde minuten redelijk overeenkomt, 67,581 om 67,077 en ook de topartiesten en topnummers zie ik in mijn eigen data terugkomen. Weliswaar net op een andere plek en in een andere volgorde. Ofwel ‘Wrapped 2021’ neemt mij niet in de mailing.

Aanvullende overzichten

Ik heb drie extra analyses gemaakt met de aangeleverde data. Eentje om in te zoomen per artiest, eentje om te kijken naar mijn ‘searches’ en eentje die de verhoudingen tussen mijn playlists laat zien. Hieronder een indruk van de pagina met een doorsnede per artiest.


Wil je meer weten?
Heb je een vraag over mijn bijzondere muzieksmaak of wil je meer weten over hoe ik dit heb aangepakt kan je me altijd een mailtje sturen.

Blijf op de hoogte

De auteur

Inergy
Inergy

Wij eten, drinken en ademen data – en wat je ermee kan doen. Dat delen we graag met jou. Meer weten over Inergy? Neem contact met ons op via 0348 45 76 66 of info@inergy.nl.

Meer berichten

Alle berichten

Een dag uit het leven van Krystle Villaflor, Cloud & DevOps Engineer bij Inergy

Een dag uit het leven van Krystle Villaflor, Cloud & DevOps Engineer bij Inergy

Als Cloud & DevOps Engineer bij Inergy maak ik deel uit van een team van meer dan 170 collega’s. In mijn rol zorg ik ervoor dat onze infrastructuur soepel draait en dat klanten kunnen vertrouwen op stabiele, veilige en efficiënte cloudomgevingen door middel van geautomatiseerde processen en continue optimalisatie.

Lees verder

Toegankelijkheid is geen luxe, maar een basisvoorwaarde voor inclusiviteit

Toegankelijkheid is geen luxe, maar een basisvoorwaarde voor inclusiviteit

In een samenleving waarin de overheid er voor iedereen is, ligt er een duidelijk verantwoordelijkheid bij diezelfde overheid om toegankelijk te zijn voor al haar burgers. Dit betekent niet alleen fysiek toegankelijke gebouwen, maar ook toegankelijke digitale documentatie. Of je nu een beleidsdocument, een begroting, of een ander P&C-publicatie schrijft, het is cruciaal dat deze documenten voor iedereen te begrijpen en te gebruiken zijn - ongeacht eventuele beperkingen.

Lees verder

Leonard vertelt over de nieuwe LIAS Risico-applicatie

Leonard vertelt over de nieuwe LIAS Risico-applicatie

Heb je ooit gewenst dat je publicaties consistenter en professioneler waren, zonder urenlang te moeten sleutelen aan elke zin? Met de LIAS Tekstassistent wordt dit realiteit. Laten we je meenemen in de praktische toepassingen die jouw werk als schrijver aanzienlijk eenvoudiger maken.

Lees verder