Op 20 juli waren Picturae en Clean Code te gast bij het Nationaal Archief. De feestelijke bijeenkomst bezegelde de samenwerking voor de doorontwikkeling van een projectwebsite van het Nationaal Archief.
Projectwebsite transcripties
Deze projectwebsite wordt speciaal ontworpen voor het zoeken in handgeschreven documenten die machineleesbaar zijn gemaakt; transcripties. De projectwebsite is naar verwachting eind mei 2021 klaar voor gebruik. Dan kan iedereen zelf twee miljoen getranscribeerde documenten doorzoeken. De projectwebsite is waar mogelijk open source en bruikbaar voor andere erfgoedinstellingen.
Waarom doorontwikkelen?
Verdere ontwikkeling van een prototype is nodig om zo gebruiksvriendelijk mogelijk te kunnen zoeken in transcripties. Het gaat om het doorzoeken van twee miljoen scans van historische handgeschreven documenten van de VOC uit de 17e en 18e eeuw en notariële archieven uit de 19e eeuw van het Noord-Hollands Archief en andere Regionaal Historische Centra. Deze worden sinds 2019 binnen het project De ijsberg zichtbaar maken automatisch getranscribeerd met kunstmatige intelligentie.
Voor deze doorontwikkeling werden begin dit jaar drie prototypes opgeleverd in een innovatiecompetitie. Het Nationaal Archief voerde die uit met steun van het ministerie van Economische Zaken en Klimaat, Rijksdienst voor Ondernemend Nederland en het ministerie van Onderwijs, Cultuur en Wetenschap.
Wie gaan het doen?
Voor de selectie van leveranciers voor de doorontwikkeling is een aanbestedingsprocedure uitgevoerd. Picturae bleek de beste partij voor de ontwikkeling van de achterkant van de projectwebsite. Picturae is een bekende in de erfgoedwereld met onder andere producten als het crowdsourcing platform Vele Handen en digitalisering van archieven. Ze zijn verantwoordelijk voor de verbetering en modernisering van de transcripties, het toekennen van entiteiten en het ontwikkelen van een transcriptie beheersysteem.
Sioux Technologies is als onderaannemer aangesloten voor de kunstmatige intelligentie. Aincient is betrokken vanwege de kennis van kunstmatige intelligentie, het erfgoedveld en projectmanagement.
Clean Code gaat de voorkant van de projectwebsite ontwikkelen, inclusief de inrichting van de zoekmachine. Clean Code is een klein, innovatief bedrijf uit Amsterdam dat zich richt op user interfaces en data analyse. De expertise van onderaannemer Duizendvijftig is het grafisch ontwerp en het coderen.