Wat zijn duurzame bestandsformaten?
Een bestandsformaat is een methode voor het opslaan van digitale informatie in een computerbestand. En zegt iets over de manier waarop die informatie gecodeerd is. Hierdoor kan het ook na creatie worden gebruikt door informatiesystemen of gebruikers. Denk bijvoorbeeld aan het opslaan van een document als PDF, een afbeelding als JPEG of een liedje als MP3.
Een bestandsformaat vertelt de computer met welke software het bestand moet worden geopend. Het kan daarom worden beschreven als een taal die alleen wordt gesproken door specifieke software. In het algemeen geldt dat hoe meer talen er zijn, en hoe minder mensen deze kunnen spreken, hoe moeilijker het wordt om de leesbaarheid en begrijpelijkheid van de taal te garanderen op de lange termijn. Het bestandsformaat moet blijvend ondersteund worden door beschikbare software. Anders kan de informatie hierin verloren gaan, of zijn ingrijpende maatregelen nodig om deze inzichtelijk te houden.
Ook zijn er bestandsformaten waarbij alleen het formaat slechts een deel van het verhaal vertelt, denk hierbij aan container bestanden zoals MPEG-4 en ZIP-bestanden, waarvan de inhoud enorm kan verschillen.
In deze norm beperken we ons zoveel mogelijk tot het opslaan van informatieobjecten in bestandsformaten die bekend staan als duurzaam toegankelijk. En waarvan het werkveld aangeeft dat zij deze goed kunnen beheren, bewaren en beschikbaar stellen: de duurzame bestandsformaten.
Digitale informatiesystemen en e-Depots kunnen meestal een grote verscheidenheid aan bestandsformaten opnemen en bewaren. Om de toegankelijkheid van informatieobjecten te optimaliseren, gaat de voorkeur uit naar duurzame bestandsformaten. Deze vragen namelijk de minste inspanning om te beheren en vergroten de kans op langdurige toegankelijkheid. Dit omdat de kans groter is dat er beschikbare tools en software bestaan om hen voor een lange tijd te beheren, bewaren en beschikbaar te stellen.
Ook is het aan te raden om de diversiteit aan verschillende bestandsformaten te beperken. Bestandsformaten en versies kunnen op den duur obsoleet worden wanneer ze niet meer worden ondersteund. Om te voorkomen dat de toegang tot bestanden in deze formaten verdwijnt, moet je deze risico’s en ontwikkelingen doorlopend in de gaten houden. Wanneer ondersteuning dreigt te verdwijnen, of al verdwenen is, moet je acties ondernemen om de leesbaarheid en beschikbaarheid te garanderen. Deze acties zijn ingewikkelder en duurder bij een grotere diversiteit aan bestandsformaten. Dit is ook het geval bij formaten die vrij onbekend en weinig in gebruik zijn.
Het is daarom belangrijk voor overheidsorganisaties om al bij de inrichting van informatiesystemen na te denken over de keuzes voor het opslaan in specifieke bestandsformaten. Hierdoor kan bij creatie van informatieobjecten al rekening gehouden worden met de duurzame toegankelijkheid van deze informatie. Ook vergemakkelijkt dit het proces van overbrenging naar een archiefinstelling, omdat zij al ervaring hebben met deze formaten. Als alle overheidsorganisaties gebruikmaken van de lijst, worden de aangeleverde bestandsformaten voor archiefinstellingen meer uniform.
In de wet is vastgelegd aan welke eisen het bestandsformaat waarin een informatieobject is opgeslagen moet voldoen. De Archiefregeling 2009 beschrijft deze. De eisen gelden voor alle permanent te bewaren informatieobjecten die op termijn worden overgebracht naar het Nationaal Archief of een andere archiefbewaarplaats.
In Artikel 26.1 van de Archiefregeling staat hierover het volgende:
‘Digitale archiefbescheiden (informatieobjecten) worden, uiterlijk op het tijdstip van overbrenging, opgeslagen in een valideerbaar en volledig gedocumenteerd bestandsformaat dat voldoet aan een open standaard, tenzij dit redelijkerwijs niet van de zorgdrager kan worden verlangd. Alsdan vindt met de beheerder van de voor overbrenging aangewezen archiefbewaarplaats overleg plaats over een alternatief bestandsformaat.’
De (kwaliteits)eisen van een bestandsformaat die hier worden geformuleerd zijn dus: valideerbaar, volledig gedocumenteerd en voldoen aan een open standaard. Hier is rekening mee gehouden bij de keuzes voor voorkeursformaten. Dit komt terug in de selectiecriteria.