Automatische handschriftherkenning en historisch onderzoek

25 juni 2020

Het Nationaal Archief is in het project De IJsberg zichtbaar maken, samen met het Noord-Hollands Archief en verschillende RHC`s, bezig om met automatische transcriptietechniek oude handschriften leesbaar te maken. Om te kijken hoe je die nieuwe transcriptietechniek kan inzetten, namen we de proef op de som met een onderzoekje naar de achtergrond van een slavencomplot op Banda Neira in 1710. 

Historisch onderzoek vooruit helpen

De bedoeling van het project De IJsberg zichtbaar maken is om met behulp van het programma Transkribus automatisch gemaakte transcripties van archiefmateriaal online aan te bieden. Deze nieuwe manier van bronnen ontsluiten zal het historisch onderzoek ongetwijfeld enorm vooruit helpen. 

Van scans naar transcripties

We weten dat door de militaire aanwezigheid op het eiland Banda Neira verzet door slaafgemaakten nauwelijks voorkwam. Toch was er een poging tot een opstand in 1710. Wat zette de slaven tot die wanhoopsdaad aan?
Normaal gesproken zou het onderzoekers maanden kosten om op de studiezaal de VOC-missiven (brieven) uit Banda te onderzoeken. In dit geval hebben we met behulp van Transkribus alle scans uit de periode 1700 tot 1710 (zo’n 10.000 stuks) getranscribeerd met behulp van het transcriptiemodel “IJsberg”, dat gemaakt is door het Nationaal Archief in samenwerking met het Noord-Hollands Archief. Het programma had hier slechts een werkweek voor nodig. De transcripties die dit oplevert zijn weliswaar niet geheel foutloos, maar toch uitstekend te gebruiken. Binnen Transkribus kun je bovendien slim zoeken op woorden in de transcripties. Wil je echter uitgebreider onderzoek doen in zo’n groot tekstbestand dan is het (voorlopig) handiger om een text mining tool te gebruiken.

Onderzoek in transcripties

Voor de text mining gebruikten we Voyant Tools. Dit platform maakte van de vanuit Transkribus gedownloade transcripties één bestand waarin gezocht kan worden op woordfrequenties en verbanden Wat in dit bestand meteen opviel was dat het gebruik van het woord ‘slaven‘ in de missiven vanaf 1700 afnam, en vanaf 1703 enorm toenam, waarna het rond 1708 weer nivelleerde. Het lukte echter niet om met veel voorkomende combinaties van woorden hiervoor een verklaring te vinden. Hier kwam toch weer het handwerk van de historisch onderzoeker om de hoek kijken.

De ‘analoge’ historicus

Door zelf te zoeken in de context waarin het woord ’slaven‘ voorkwam werd al snel duidelijk waarom het door de jaren zo varieerde. Zo bleek dat er tussen 1700 en 1703 sprake was van een grote sterfte door een pokkenepidemie onder slaafgemaakten. Vele perkeniers (plantage-eigenaren) meldden sterfgevallen onder hun werkkrachten. Tegelijk zagen zij hierdoor hun opbrengsten kelderen. Men klaagde over het gebrek aan goede arbeidskrachten. Vanaf 1704 is te lezen dat de perkeniers jarenlang op zeer grote schaal en vaak nieuwe slaafgemaakten begonnen in te voeren. 

Aanleiding tot de opstand

In die enorme aanvoer van slaafgemaakten vinden we waarschijnlijk de aanleiding voor de explosieve situatie in 1710. Ontheemd en beroofd van hun familie moesten zij zich zien te redden in een snel groeiende, onsamenhangende groep van Indische en Afrikaanse slaven. Tegelijk werden zij door de perkeniers onder grote druk gezet de productie van nootmuskaat weer op peil te brengen. Deze omstandigheden zorgden ongetwijfeld voor grote onrust en wantoestanden. Vanaf 1707 zagen we dan ook een toename van woorden zoals ‘weglopers’ en ‘gevluchten’ in de missiven. Op 16 februari 1710 was de maat vol en deden de slaven een poging tot een opstand. De perkeniers hadden met hun zucht naar meer productie de kiem voor opstandigheid gelegd. 

Bevindingen 

Dankzij Transkribus, bijgestaan door een text mining tool, is historisch onderzoek van maanden of langer terug te brengen tot dagen en weken. Simpelweg zoeken op woordfrequentie gaf in dit geval snel aanwijzingen naar mogelijke oorzaken van de verijdelde opstand. 
Over niet al te lange tijd kunnen historici zelf via het Nationaal Archief (en op termijn ook bij andere archieven) ondervinden hoe snel zij grote hoeveelheden transcripties van bronnenmateriaal met behulp van bovenstaande technieken kunnen doorzoeken en onderzoeken. Wie weet wat zij gaan ontdekken in de enorme berg tot nog toe onontsloten bronnen.