Blog archives

Tag dingen met Depictor

4 comments
Foto’s: Theo Crazzolara (CC-BY) / Joaquim Alves Gaspar (CC-BY-SA)

Ik hou me veel bezig met de Wikimedia-projecten, zoals Wikipedia, Wikidata en Wikimedia Commons. Commons is de mediabank van de Wikimedia-projecten: op het moment van schrijven staan daar meer dan 76 miljoen foto’s, video’s en andere mediabestanden op. Al die bestanden kun je gratis en voor niks gebruiken omdat ze onder een vrije licentie vallen. Je hoeft je dus niet druk te maken over, zomaar een hypothetisch scenario, een groot persbureau dat dreigbrieven stuurt met boetes van €450 vanwege een onbedoelde auteursrechtenschending.

Het was wel lastig om op Commons goede metadata toe te voegen aan de bestanden. Tot vrij recent ging dat nogal rudimentair: met veel tekst en eindeloos veel categorieën. Je hebt bijvoorbeeld categorieën als “emmers met levende krabben” en “badkuipen gebruikt als voederbakken voor dieren”. Het zou veel handiger zijn als je zelf zo’n selectie kan samenstellen: “geef me alle afbeeldingen met levende krabben in een emmer”. En dat je dan makkelijk “krabben” kunt vervangen met “schildpadden”. Of “emmer” met “terrarium”. Maar je kunt moeilijk voor elke mogelijke diersoort een categorie “emmers met levende <x>” maken.

Gestructureerde metadata

De oplossing is gestructureerde metadata, en die kun je sinds een paar jaar toevoegen op Commons dankzij Structured Data on Commons (filmpje). Je kan nu plaatjes koppelen aan items op Wikidata. Deze items beschrijven van alles: van diersoorten tot schilderijen en van personen tot sterrenstelsels. En eigenschappen van die items, zoals de Latijnse naam van een diersoort of de geboorteplaats van een architect.

Op Wikidata staan al bijna honderd miljoen van dit soort items. Je kunt het dus gebruiken als een soort gigantische thesaurus. En omdat items op Wikidata weer veel metadata hebben kun je ook hele specifieke afbeeldingen opsporen, bijvoorbeeld ‘alle afbeeldingen van mensen die zijn geboren in Tilburg, architect zijn én getrouwd zijn met iemand van adel maar zelf niet van adel zijn’. Waarom je dat soort bizar specifieke dingen zou willen opzoeken zou ik niet zo snel weten. Maar ik ben zo iemand die van alleen al het idee dat het mogelijk is enthousiast wordt.

Er is één probleem: die 76 miljoen mediabestanden op Commons moeten nog wel de juiste metadata krijgen. Op het meest basale niveau is dat ‘dit plaatje toont dat’. Een zogenaamd depictsstatement. De afbeeldingen staan vaak in een categorie, en die zijn wél vaak gekoppeld aan Wikidata-items.

Je zou dus kunnen zeggen: er is een categorie ‘Vincent van Gogh’, die is gekoppeld aan het Wikidata-item over de persoon Van Gogh, dus alle plaatjes in die categorie tonen Vincent van Gogh.

Alleen is dat te kort door de bocht. Afbeeldingen in zo’n categorie kunnen van alles zijn. “De aardappeleters” is bijvoorbeeld wel een schilderij van Van Gogh maar toont niet de persoon Van Gogh. Een zelfportret is van Van Gogh, maar toont hem ook. Een grafsteen of een handtekening toont Van Gogh dan weer niet. De enige manier om er zeker van te zijn dat zo’n depictsstatement klopt is dus toch door al die afbeeldingen handmatig door te nemen. 76 miljoen keer.

Tooltje

Dat kan een stuk sneller, dankzij een handig nieuw tooltje dat ik heb gebouwd met de weinig tot de verbeelding sprekende naam Depictor. Je kunt het tooltje alleen gebruiken als je een account hebt op één van de Wikimedia-sites (dus bijvoorbeeld op Wikipedia). Je logt in, drukt op ‘start’ en je krijgt een persoon toegewezen uit een willekeurig geboortejaar. Vervolgens krijg je de simpele vraag: zie je die persoon op de weergegeven foto? Elke keer als je op ‘Ja’ klikt voeg je op de achtergrond een depicts-statement toe aan Wikimedia Commons.

Iets meer dan twee weken geleden heb ik het tooltje online gezet. Tot nu toe hebben zo’n 150 mensen meer dan 40.000 statements toegevoegd. Ik hou een scorebord bij, en iemand uit Polen heeft al meer dan 6.000 keer een foto beoordeeld. Zelf heb ik er slechts een paar honderd. Het verbaast me altijd weer hoe ontzettend fanatiek mensen kunnen zijn als je ze de juiste tools geeft.

Overigens kan Depictor ook gebruikt worden voor meer dan alleen mensen uit willekeurige geboortejaren. Willekeurige Commons-categorieën werken ook (mits gekoppeld aan een Wikidata-item), net zoals SPARQL-queries (dat iets te ingewikkeld is om hier snel uit te leggen maar lees vooral dit artikel). Ik werk nu aan een mogelijkheid om challenges toe te voegen. Zodat bijvoorbeeld erfgoedinstellingen de tool kunnen gebruiken om kleine competities te organiseren: wie kan de meeste afbeeldingen depicten?

Enthousiast geworden? Wilt u zelf aan de slag? Log in met uw Wikimedia-account en ga lekker depicten!

PS: De Tilburger George van Heukelom, architect van De Inktpot in Utrecht, was getrouwd met jonkvrouw Henriëtte van den Brandeler. Leuk dat je het vraagt!

Add a comment

4 comments