Blog archives

Met bijna 200 nerds hacken in een oude gasfabriek: de Wikimedia Hackathon 2023

Panoramafoto van de deelnemers. đŸ“· Fuzheado / CC-BY-SA 4.0

In het weekend van 19, 20 en 21 mei was ik aanwezig bij de Wikimedia Hackathon in Athene. Zo’n 200 mensen die zich bezighouden met de Wikimedia-projecten (zoals Wikipedia) kwamen drie dagen bij elkaar om samen dingen te bouwen, te praten, discussiĂ«ren en bier te drinken. Het was de eerste keer sinds 2019 dat het evenement weer fysiek plaatsvond. Alleen al daarom een goede reden om weer eens te gaan. Zo ontmoette ik bijvoorbeeld Annie Rauwerda (van het social media-fenomeen Depths of Wikipedia), met wie ik eerder een presentatie maakte voor de Wikicon van 2021.

De hackathon vond plaats op Technopolis, een cultureel park op het voormalige terrein van een gasfabriek, vergelijkbaar met het Westergasterrein in Amsterdam. De locatie was prachtig, maar helaas waren er op vrijdag en zaterdag wel de hele dag soundchecks en optredens van respectievelijk een concert voor en van mensen met een beperking (“Cool Crips”, ja echt) en een indiepopband. Dat werd gelukkig gecompenseerd door het geweldige Griekse eten. Wist u overigens dat de Grieken de meeste olijfolie consumeren ter wereld? Misschien dat het daarom zo lekker is.

Depictor

Wat doe je zoal op zo’n hackathon? In 2018 was ik de laatste keer bij een Wikimedia Hackathon (die was toen in Barcelona). Ik merkte toen dat het weinig zin heeft om veel plannen te maken. Voor je het weet heb je een uur lang een interessant gesprek of ben je iets heel anders aan het uitzoeken dan dat je oorspronkelijk had bedacht.

Mijn enige “plan” was om “iets” te doen met Depictor, mijn tool om gestructureerde metadata toe te voegen aan de plaatjes op Wikimedia Commons. Die tool bestaat nu bijna twee jaar en heeft meer dan een miljoen edits opgeleverd (waaronder een half miljoen van een zĂ©Ă©r actieve Poolse gebruiker). Tijdens de hackathon paste ik het tooltje aan zodat de plaatjes een stuk sneller laden. Mijn mede-hackathonner Siebrand (tevens trouwe lezer van deze nieuwsbrief) werd daar zo door gestimuleerd dat hij de afgelopen week meer dan 11.000 edits maaktte. Voor de toekomst ben ik van plan Depictor uit te breiden met meer datasets. Ik kreeg via Wikimedia-medewerker Matthias een dataset met 87 miljoen mogelijke “kandidaten”, dus Siebrand en mijn Poolse gebruiker zijn de komende tijd nog niet uitgedepictored.

The intangible

Nu we het toch over Siebrand hebben, hij organiseerde de showcase van de hackathon. Iedereen mag dan presenteren wat ze afgelopen dagen hebben gebouwd. Een nieuw onderdeel van die showcase, dat ik half samen met Siebrand bedacht, was iets dat hij the intangible (“het ontastbare”) noemde: wat waren de dingen die mensen hadden meegemaakt die zich niet lieten vertalen in geschreven regels code of opgeloste bugs? Het zorgde voor een rijke stroom aan prachtige anekdotes, verhalen en complimenten. Er was bijvoorbeeld iemand die vertelde hoe dit zijn eerste Wikimedia-bijeenkomst ooit was en hoe fijn hij door iedereen was ontvangen. Ik kan iedereen aanraden die een dergelijke conferentie organiseert om ook een intangible presentatie te doen.

Naast het coden waren er ook lezingen, waaronder eentje die ik zelf hield. Ik vertelde vooral over wat ik allemaal heb geleerd in de afgelopen negen jaar als tool developer. U kunt hier de notities teruglezen (er zijn geen video-opnames gemaakt).

Na die lezing werd ik aangesproken door een studente kunstgeschiedenis van de Ionische Universiteit op Corfu. Of ik nog tips had hoe zij als Wikipedian in Residence in een museum aan de slag kon (ik was zelf in 2013 de eerste Nederlandse Wikipedian in Residence). Ik drukte haar op het hart om vooral te kijken of ze binnen kon komen via de afdeling registraties of datamanagement. Informatieprofessionals snappen Wikipedia vaak beter dan curatoren of de directie.

AI

Een onderwerp van veel lezingen was hoe de gemeenschap om moet gaan met de snelle opkomst van AI. De data van Wikipedia wordt veel gebruikt om AI-modellen te trainen, maar ironisch genoeg doet de gemeenschap er zelf nog vrij weinig mee. Betrouwbaarheid is Ă©Ă©n van de belangrijkste pijlers onder de projecten. Dat laat zich lastig combineren met taalmodellen die nog wel eens zelf bronnen “fabriceren”. Een taalmodel dat allĂ©Ă©n is gevoed met Wikimedia-content is helaas geen optie, daarvoor is zelfs die enorme hoeveelheid data niet voldoende.

Kansen zijn er echter genoeg. Bijvoorbeeld het samenvatten van lange stukken tekst. Of dat een goed idee is bij Wikipedia-artikelen weet ik nog niet. Maar voor de ellenlange discussies kan het mogelijk heel interessant zijn. Discussies op de encyclopedie hebben regelmatig de lengte van een universiteitsscriptie, als een AI dat een beetje zou kunnen samenvatten zou dat wellicht mijn enthousiasme om meer deel te nemen aan die discussies kunnen bevorderen.

Het ongrijpbare resultaat

Wat levert drie dagen hacken nou op? Dat zijn niet de meetbare resultaten, zoals het aantal geschreven regels code of het aantal gefixte bugs. Het is het feit dat ik na zo’n evenement thuiskom en zin heb om nieuwe dingen te gaan maken. Of terugdenk aan hoe tof het is om met een internationale groep van kennisnerds samen te werken. The intangible dus.

Mijn reis en verblijf werd bekostigd met een beurs van Wikimedia Nederland, waarvoor mijn hartelijke dank.

Add a comment