Het Nationaal Archief stelt zoveel mogelijk archiefcollecties beschikbaar als open data(sets). De manieren waarop wetenschappers en journalisten deze open data kunnen gebruiken, delen we graag. Ook willen we het gesprek aangaan met de gebruikers van onze digitale archieven: hoe kunnen wij deze data beter beschikbaar stellen? Het symposium De waarde van open data op 14 april stond in het teken van deze vraagstukken.
Toepassingen van open data
Het dagprogramma was gevuld met presentaties over toepassingen van open data, zoals datajournalistiek en augmented reality. Daarnaast lichtten sprekers de waarde van open data toe op strategisch niveau. En konden bezoekers deelnemen aan een interactieve workshop over de (linked) open data bij het Nationaal Archief. Of gezamenlijk brainstormen over ons contact met open-datagebruikers.
Terugkijken? In het overzicht hieronder staan links naar de presentaties.
Presentaties |
---|
Gesprek over de waarde van open data Tom De Smet/Kirsten Paulus |
Open data nu is zo 1980 - Een pleidooi voor actieve open data dienstverlening |
Inzet van open data bij de ontwikkeling van het narratief en de visuele stijl van speelfilms Ariadne Asimakopoulos en Edward Liddiard |
Netwerk Digitaal Erfgoed staat voor open en verbonden erfgoed Wilbert Helmus |
Unsilencing Colonial Archives Mrinalini Luthra en Charles Jeurgens |
Plaatsen, Punten en Veelhoeken: Het in kaart brengen van plaatsnamen als Linked Open Data Simon Kemper |
VOC Data Experience Dirk Bertels |
Datajournalistiek Jerry Vermanen |
Kunstmatige intelligentie toegepast op beeld Nanne van Noord |
Een revolutie in geschiedvorsing: HTR-transcripties van koloniale archieven Gerhard de Kok |
Open kan niet zonder FAIR Ingrid Dillo |
Project GLOBALISE Lodewijk Petram |
Sprekers en presenties
Bekijk hier de sprekers en hun presentaties op het symposium.
#
Tom De Smet/Kirsten Paulus
Bekijk de presentatie van Kirsten Paulus en Tom De Smet
Dagvoorzitter Kirsten Paulus gaat in gesprek met Tom De Smet, directeur Archieven, Dienstverlening & Innovatie van het Nationaal Archief. Ze spreken over de waarde van open data in het algemeen en in het erfgoedveld in het bijzonder.
#Paul Suijkerbuijk en Frank Verschoor - Open data nu is zo 1980 - Een pleidooi voor actieve open data dienstverlening
Bekijk de presentatie van Paul Suijkerbuijk en Frank Verschoor
Paul (opa data) en Frank (professioneel twijfelaar) nemen een loopje met de open-dataovertuigingen van weleer. En geven met hun ervaringen uit het verleden richting aan het heden. Een aanrader voor iedereen die in 2022 het organiseren, delen en inzetten van open data serieus neemt.
Toen Paul Suijkerbuijk vanaf 2009 vanuit het ministerie van BZK pleitte voor het publiceren van open data, en Frank Verschoor in dezelfde periode vanuit het ministerie van EZ het hergebruik van open data aanjaagde. Toen waren Paul en Frank het al niet eens met elkaar. En nu nog steeds niet. Juist daarom zijn ze gaan samenwerken in The Green Land. Nog steeds.
#Nanne van Noord -Kunstmatige intelligentie toegepast op beeld
Bekijk de presentatie van Nanne van Noord
Kunstmatige intelligentie toegepast op beeld is het speelveld van Computer Vision (CV). Dit veld is de afgelopen jaren enorm gegroeid. Een belangrijke drijfkracht achter deze groei is de beschikbaarheid van visuele data. Desondanks zijn de voornaamste toepassingen van CV nog steeds gericht op commerciële applicaties, zoals: zelfrijdende auto’s, kwaliteit inspectie, en content-analyse. Steeds meer zien we echter ook de toepassing van CV binnen de erfgoedsector. In deze presentatie gaat Nanne van Noord in op wat CV is, waar het voor wordt ingezet, welke data hierbij gebruikt worden, en welke meerwaarde CV biedt voor de culturele en erfgoedsectoren.
Nanne van Noord is universitair docent in het Multimedia Analytics lab van de University van Amsterdam. Zijn onderzoek richt zich op beeldanalysetechnologie voor visuele cultuur.
#
Ingrid Dillo - Open kan niet zonder FAIR
Bekijk de presentatie van Ingrid Dillo
Open Science is de beweging in de wetenschap die staat voor een meer open onderzoekspraktijk waarbij publicaties, data, software en andere vormen van wetenschappelijke informatie in een zo vroeg mogelijk stadium gedeeld worden. En voor hergebruik beschikbaar gesteld worden. Maar het open beschikbaar stellen van data alleen is niet voldoende om de herbruikbaarheid van data te garanderen. Daarvoor is het nodig dat de data vindbaar, toegankelijk, interoperabel en herbruikbaar, kortom FAIR.
Dr. Ingrid Dillo is Deputy Director bij DANS (Data Archiving and Networked Services) in Nederland. Ze is gepromoveerd in de geschiedenis en heeft de afgelopen dertig jaar gewerkt op het gebied beleidsontwikkeling, onder meer als senior beleidsadviseur bij het ministerie van Onderwijs, Cultuur en Wetenschap en de Koninklijke Bibliotheek (KB). Tot haar expertisegebieden behoren research-datamanagement en de certificering van digitale repositories. Ingrid is co-voorzitter van de Research Data Alliance (RDA) Council en lid van de raad van bestuur van CoreTrustSeal en DataCite. Ingrid is projectcoördinator van de Europese H2020-projecten FAIRsFAIR (2019-2022) en FAIR-IMPACT (2022-2025) en lid van de EOSC Task Force on Long term Data Preservation.
#Jerry Vermanen - Datajournalistiek
Bekijk de presentatie van Jerry Vermanen
Duizenden Joodse woningen zijn tijdens de Tweede Wereldoorlog onteigend en doorverkocht aan personen, bedrijven en gemeenten. Onderzoeksplatform Pointer (KRO-NCRV) doet al ruim twee jaar lang onderzoek naar de zogeheten Verkaufsbücher: een open dataset van het Nationaal Archief waarin de transacties van deze roofhandel staan beschreven. Het onderzoek heeft veel impact. Bijna honderd gemeenten doen nu onderzoek naar hun eigen (mogelijk dubieuze) rol in deze transacties. Familieleden die elkaar decennialang uit het oog zijn verloren, hebben elkaar dankzij dit onderzoek weer gevonden. En lezers kunnen een digitale wandeling maken door een gesloopte Amsterdamse sloppenwijk. Jerry Vermanen legt uit hoe Pointer verhalen in datasets vindt, en hoe je dat voortaan zelf kunt doen.
Jerry Vermanen is data- en onderzoeksjournalist bij Pointer, en co-auteur van het Handboek Internetresearch & Datajournalistiek.
#Gerhard de Kok - Een revolutie in geschiedvorsing: HTR-transcripties van koloniale archieven
Bekijk de presentatie van Gerhard de Kok
Handwritten Text Recognition (HTR) zorgt voor een revolutie in het historisch onderzoek. Dankzij het project De IJsberg Zichtbaar Maken, loopt het Nationaal Archief bij die ontwikkelingen in de voorhoede. Computergegenereerde transcripties van koloniale archieven uit het Nationaal Archief hebben al veel onderzoekers tot nieuwe inzichten gebracht. Gerhard de Kok laat in deze presentatie zien hoe hij gebruikmaakt van deze door het Nationaal Archief gepubliceerde transcripties. Voor zijn onderzoek ontwikkelde hij een eigen ‘koloniale zoekmachine’. Daarnaast maakt hij gebruik van Natural Language Processing (NLP) om met de ongeëvenaarde rekenkracht van computers tot nieuwe historische inzichten te komen.
Gerhard de Kok is maritiem historicus. Hij werkt als onderzoeker voor het Huygens/ING en als docent voor de Universiteit Leiden.
#Mrinalini Luthra en Charles Jeurgens - Unsilencing Colonial Archives
Project van Mrinalini Luthra, Konstantin Todorov, Giovanni Colavizza, Charles Jeurgens.
Bekijk de presentatie van Mrinalini Luthra en Charles Jeurgens
Koloniale archieven staan volop in de belangstelling. Het zijn belangrijke maar tegelijkertijd complexe en problematische bronnen vanwege de diepe en deels onoverbrugbare kloof tussen wat deze archieven bieden en de behoeften van hedendaagse gebruikers die op zoek zijn naar sporen van hun persoonlijke geschiedenis. Nazaten van gekoloniseerde en tot slaafgemaakte mensen die op zoek zijn naar een glimp van hun eigen verleden worden niet alleen geconfronteerd met de offensieve taal van de bronnen, maar ook met vele drempels die geslecht moeten worden alvorens toegang te krijgen tot de schaarse aanwezige sporen. De bestaande hulpmiddelen, in de vorm van inventarissen en indexen, zijn vrijwel nooit gemaakt met het doel om de gekoloniseerde en tot slaafgemaakte mensen die in deze archieven figureren vindbaar te maken. Voor zover aanwezig blijven ze verborgen in de massa aan documenten.
Sinds het Nationaal Archief steeds meer archieven via HTR-technologie machine-leesbaar maakt, wordt het mogelijk geheel andere vormen van toegang te ontwikkelen. Het project Unsilencing Colonial Archives richt zich op het vindbaar maken van deze verborgen sporen met behulp van entity recognition. Voor dit doel is een annotatietypologie ontworpen die de basis vormt voor deze nieuwe wijze van indexering. In onze bijdrage bespreken we de werkwijze en resultaten (toegepast op een VOC-archief). En het belang van het corpus van 70.000 annotaties dat in dit project is vervaardigd en beschikbaar wordt gesteld voor gebruikers.
Mrinalini Luthra (MSc) is digital humanities onderzoeker en docent aan de Universiteit van Amsterdam. Haar interesses liggen op het snijvlak van technologie, ethiek en design.
Charles Jeurgens is hoogleraar archiefwetenschap aan de Universiteit van Amsterdam en adviseur bij het Nationaal Archief.
#Dirk Bertels - VOC Data Experience
Bekijk de presentatie van Dirk Bertels
Studio Bertels ontwerpt en ontwikkelt new-media-installaties en ervaringen. Design en technologie zijn hun artistiek medium om complexe informatie, big data en maatschappelijke vraagstukken invoelbaar te maken voor een breed publiek. Zo maken ze transformatieve ervaringen voor een breder perspectief op de veranderende wereld.
De big data van het Nationaal Archief over de Verenigde Oost-Indische Compagnie geven een kijkje achter de schermen bij deze economische machine. Maar dat niet alleen. Achter de kille administratie gaan verhalen schuil, verhalen van mensen van vlees en bloed, over migratie, uitbuiting en ongekende sterfte.
Met spectaculaire visualisaties in augmented reality (AR) laat de VOC Data Experience de gegevens van de VOC tot leven komen. Wat onthullen de datasets over de bejubelde en beruchte geschiedenis van de VOC?
#Edward Liddiard en Ariadne Asimakopoulos - Inzet van open data bij de ontwikkeling van het narratief en de visuele stijl van speelfilms
Bekijk de presentatie van Edward Liddiard en Ariadne Asimakopoulos
Edward Liddiard studeerde geschiedenis aan de UvA en was als researcher nauw betrokken bij de ontwikkeling en productie van de speelfilm De Oost van regisseur Jim Taihuttu. Voor het bijbehorende educatieprogramma De Wereld van de Oost deed hij samen met een team van toegewijde makers (beeld)research en schreef hij teksten.
Zijn fascinatie voor koloniale geschiedenis hangt nauw samen met de plekken waar hij opgroeide en de vriendjes waarmee hij op straat speelde. Edward zal ingaan op de wijze waarop open data kunnen worden ingezet bij de ontwikkeling van het narratief en de visuele stijl van speelfilms.
Als creative/impactproducer werkte Ariadne Asimakopoulos aan verschillende impact producties waaronder De Wereld van de Oost, de verdieping bij de film De Oost. Daarnaast is Ariadne docent op de Reinwardt Academie voor cultureel erfgoed. Ze behaalde haar MA Conflict Studies en Human Rights aan de Universiteit Utrecht, regisseerde de documentaire No Place for a Rebel en werkte voor diverse vredesorganisaties voordat ze zich toelegde op het vertellen van verhalen met maatschappelijke impact.
#Lodewijk Petram - Project GLOBALISE
Bekijk de presentatie van Lodewijk Petram
Het project GLOBALISE (2022-2026) gaat ervoor zorgen dat het voor iedereen op de wereld makkelijker wordt om onderzoek te doen in de Overgekomen Brieven en Papieren. Dit is een belangrijke serie documenten uit het VOC-archief, die bijna vijf miljoen pagina’s beslaat. De serie bevat kopieën van lokale administraties van de vele vestigingen van de VOC–verslagen, brieven, goederenlijsten en andere documenten, alles handgeschreven. Over een periode van twee eeuwen geven ze niet alleen een beeld van de organisatie van de VOC en de samenlevingen onder haar bewind, maar ook van de gebieden waar zij mee in contact kwam. Scans van de hele serie zijn recent door het Nationaal Archief toegankelijk gemaakt.
Lodewijk Petram, in 2011 gepromoveerd op een VOC-gerelateerd onderwerp en sinds 2016 werkzaam bij het Huygens Instituut, vertelt hoe het GLOBALISE-team de open data van het Nationaal Archief gebruikt en gaat verrijken. Met een combinatie van taaltechnologische computermodellen en handwerk worden entiteiten (zoals personen, plaatsen, goederen en schepen), gebeurtenissen (zoals diplomatieke missies, scheepsreizen, oorlogen en opstanden) en dateringen in de tekst herkend en gekoppeld aan relevante contextuele informatie. Onderzoekers en het bredere geïnteresseerde publiek, in het bijzonder ook uit regio’s in Azië waarover de VOC-archieven informatie bevatten, worden bij het project betrokken om aanvullingen en correcties te maken. Alle verrijkingen worden open-access toegankelijk gemaakt.
GLOBALISE is een samenwerking van het Huygens Instituut met het Internationaal Instituut voor Sociale Geschiedenis, de afdeling Digital Infrastructure van het KNAW Humanities Cluster, de Vrije Universiteit, de Universiteit van Amsterdam en het Nationaal Archief.
#
Wilbert Helmus - Netwerk Digitaal Erfgoed staat voor open en verbonden erfgoed
Bekijk de presentatie van Wilbert Helmus
Het Nationaal Archief is als actieve partner in het Netwerk Digitaal Erfgoed nauw betrokken bij de uitvoering van de Nationale Strategie Digitaal Erfgoed. Doel van het netwerk is om mensen makkelijker hun weg te laten vinden in onze digitale erfgoedcollecties. Het verbinden van erfgoedinformatie staat daarin centraal en open data is cruciaal. Wat is er sinds 2015 zoal bereikt en wat staat er de komende jaren op de gezamenlijke netwerkagenda? Welke rol kunnen archieven daarin spelen? De Nationale Strategie is immers niet alleen een strategie voor digitalisering, maar vooral ook een strategie voor verdere samenwerking.
Wilbert Helmus werkt vanuit het Nederlands Instituut voor Beeld en Geluid als netwerkmanager voor het Netwerk Digitaal Erfgoed.
#Simon C. Kemper - Plaatsen, Punten en Veelhoeken: Het in kaart brengen van plaatsnamen als Linked Open Data
Bekijk de presentatie van Simon Kemper
Sinds kort is het mogelijk om plaatsnamen op grote schaal uit geschreven bronnen, inventarissen en kaarten te vissen. Maar een lijst van steden, dorpen, polders en residenties is zonder coördinaten maar beperkt bruikbaar. Simon C. Kemper legt uit hoe binnen het Nationaal Archief plaatsnamen automatisch uit digitale transcripties, nadere toegangen (NT) en inventarissen worden gefilterd. De resulterende puntenmassa wordt verrijkt met lagen aan geo-informatie van historische grenzen en landschappen die onder andere uit de kaartencollectie van het Nationaal Archief zijn onttrokken. Door deze verschillende databronnen binnen een enkel geosysteem aan elkaar te koppelen, wordt het door de gebruikers van het Nationaal Archief niet alleen makkelijker om plaatsen te vinden. Maar ook de daar aan verwante personen, documenten en kwantitatieve gegevens. De digitale kaart brengt het hele archief in beeld.
Simon C. Kemper is de datawetenschapper van de afdeling Dienstverlening op het Nationaal Archief. Hij is gespecialiseerd in handgeschreven tekstherkenning, geografische visualisatie, entiteitenherkenning en andere vormen van computationele taalkunde. In het verleden heeft hij meerdere digitalisering en dataverwervingsprojecten opgezet en geleid voor instituten als de British Library, de Koninklijke Bibliotheek en de Universiteitsbibliotheek van de Technische Universiteit Delft.
Workshop en brainstormsessie
Workshop: Introductie in het gebruik van de (linked) open data van het Nationaal Archief. Deze workshop geeft een overzicht van de open data die wij als Nationaal Archief beschikbaar stellen. En hoe je deze data zelf kan ophalen, bijvoorbeeld door een csv of xml te downloaden of via het OAI-PMH endpoint dat we beschikbaar stellen. Ook presenteren we de stand van zaken van de ontwikkelingen op het gebied van linked open data bij het Nationaal Archief. We staan stil bij de modellen die het Nationaal Archief hanteert. Ook de vocabulaires en de techniek waarmee deze LOD beschikbaar gemaakt wordt, zoals binnenkort de fotocollectie, komen aan bod. Lees een verslag van de workshop op KIA.
Brainstorm: Het gebruik van open data. In deze brainstorm gaan we het gesprek aan: hoe kan je als organisatie relaties met open-datagebruikers leggen? Hoe bieden we open data het best aan, zodat het gebruik ervan toeneemt? Ook richten we ons op het vinden van nieuwe use cases met open data. Welke ideeën leven er in de erfgoedsector? Met wie kan het Nationaal Archief samenwerken om nieuwe interessante toepassingen te ontwikkelen? Lees een verslag van de brainstorm op KIA.