Vorig weekeinde heb ik doorgebracht op PyData Amsterdam 2016.

congres pydata.png

Python is een beetje aan het bovendrijven als een soort lingua franca voor data analyse (in de meest brede zin van het woord), scripting, “big data” en aanverwante zaken. Vorig jaar ben ik begonnen me hier in te verdiepen, als een soort extensie van m’n interesse in Hadoop/Spark en dergelijke. PyData leek me de uitgelezen mogelijkheid om daar wat verder in te leren.

Wat is PyData?

PyData is a gathering of users and developers of data analysis tools in Python. The goals are to provide Python enthusiasts a place to share ideas and learn from each other about how best to apply our language and tools to ever-evolving challenges in the vast realm of data management, processing, analytics, and visualization. We aim to be an accessible, community-driven conference, with tutorials for novices, advanced topical workshops for practitioners, and opportunities for package developers and users to meet in person. A major goal of the conference is to provide a venue for users across all the various domains of data analysis to share their experiences and their techniques, as well as highlight the triumphs and potential pitfalls of using Python for certain kinds of problems.

Het is veel meer een community-gedreven effort dan eerdere conferenties waar ik ben geweest. Kleinschaliger, maar ook … gezelliger. De locatie hielp daar enorm in mee (NDSM-eiland, zie hier voor impressies).

Ook het feit dat de WiFi erg slecht was en het eten fenomenaal goed droeg daar aan bij. Heb ik dan ook wat geleerd? Ja, zeker! Met meer Python ervaring had ik d’r vast meer uit kunnen halen, maar het was een enorm goede onderdompeling. Het ging veel over statistiek, machine learning (logisch, gezien de naam van het event), maar ook breder: PySpark, Jupyter, Data Science naar productie brengen. De lijst van dingen die ik uit wil zoeken en begrijpen naar aanleiding van dit event is lang.

data.png

Een paar linkjes:

Do Angry People Have Poor Grammar?

From Data Science to Production – deploy, scale, enjoy!

The Duct Tape of Heroes: Bayes Rule

Pandas: from bdate_range to wide_to_long