Wasstraat archeologische data

Opdrachtgever
Archeologie Delft
Periode
2023
Rol
Senior data-analist en modelontwerper
Resultaat
Geharmoniseerde dataset, kwaliteitsrichtlijnen en herhaalbaar verrijkingsproces

Opgave

Archeologisch veldwerk in Delft, en in Nederland breed, levert grote hoeveelheden gegevens op: vondstenlijsten, contextbeschrijvingen, coördinaten, classificaties. Die data worden vastgelegd in uiteenlopende formaten, met verschillende conventies per opgravingsperiode en per opgraver. Voor onderzoek is dat hanteerbaar; voor hergebruik, beleidsanalyse en publiekspresentatie niet. Archeologie Delft wilde een aanpak waarmee bestaande datasets stelselmatig opschoonbaar en aanvulbaar werden, niet als eenmalige schoonmaakactie maar als herhaalbaar proces.

Wat we bouwden

Het project leverde een semi-geautomatiseerde ‘wasstraat’ op: een herhaalbare keten van stappen die een ruwe archeologische dataset inleest, valideert, harmoniseert tegen een gedeeld vocabulaire, en verrijkt met afgeleide kenmerken. Aan de voorkant staat een informatiemodel van archeologische begrippen (vondst, context, periode, materiaal, locatie) met daaraan gekoppelde validatieregels. Aan de achterkant staan richtlijnen voor nieuwe vastlegging, zodat data die na het project wordt aangeleverd vanaf het begin al aan de kwaliteitseisen voldoet. De wasstraat is publiek beschikbaar op wasstraat.e-space.nl.

Belangrijkste ontwerpkeuzes

  • Proces boven eenmalige schoonmaak. Een opgeschoonde dataset is morgen alweer verontreinigd als er geen proces is. De wasstraat is daarom het échte product; de opgeschoonde dataset is er een uitkomst van.
  • Vocabulaire als ankerpunt. Harmonisatie begint bij een expliciet vocabulaire van archeologische termen en hun relaties. Dat maakt mapping tussen datasets mogelijk zonder steeds opnieuw te hoeven discussiëren over betekenis.
  • Richtlijnen voor het primaire vastleggingsproces. De beste wasstraat is die welke je niet hoeft te gebruiken. Richtlijnen voor nieuw veldwerk zorgen dat toekomstige data direct bruikbaar is.

Resultaat en gebruik

Het project leverde een geharmoniseerde dataset van archeologische gegevens met verbeterde kwaliteit en herbruikbaarheid, een herhaalbare verrijkingspipeline, en een richtlijn voor toekomstige datavastlegging. De pipeline draait publiek op wasstraat.e-space.nl en is generiek genoeg om, met aanpassingen, in andere erfgoedcontexten toegepast te worden.

Waar te vinden

dataharmonisatie cultureel erfgoed datakwaliteit archeologie