Risico’s Gegevenskwaliteit by design

Handreiking Duurzame toegankelijkheid van gegevens

Als je aan de slag gaat met gegevenskwaliteit binnen jouw organisatie doe je dat bij ontvangst of bij het ontstaan van gegevens. Oftewel, by design. Dat is dan ook het moment om de kwaliteit en duurzame toegankelijkheid van de gegevens voor elkaar te krijgen. Wanneer dit niet gebeurt, loop je tegen risico’s aan en worden kansen niet benut. Ook scheelt het (kosten aan) herstelwerk.

We schetsen de genoemde risico’s aan de hand van vijf voorbeelden. Per voorbeeld:

  • geven we een introductie over de connectie tussen duurzame toegankelijkheid en gegevenskwaliteit;
  • koppelen van kwaliteitsattributen uit het Raamwerk Gegevenskwaliteit van NORA aan maatregelen voor duurzame toegankelijkheid;
  • beschrijven we implicaties.

De voorbeelden, risico’s en implicaties zijn niet-uitputtend en illustratief. 

Alles uitklappen

Duurzaam toegankelijke overheidsinformatie is essentieel om het handelen van de overheid te kunnen controleren. Die controle wordt uitgevoerd door burgers, de volksvertegenwoordiging en de overheid zelf. Dan moeten besluiten ook verantwoord worden en resultaten waar mogelijk worden gereproduceerd. En om dat te kunnen doen zijn gegevens van essentieel belang. Deze vormen de basis van de informatie waarop besluiten worden genomen. Denk bijvoorbeeld aan analyses.

Kwaliteitsattributen

Binnen gegevensmanagement draagt een aantal kwaliteitsattributen bij aan de controleerbaarheid van het overheidshandelen.

KwaliteitsattribuutKoppeling duurzame toegankelijkheid

Reproduceerbaarheid

(Dimensie : Traceerbaarheid)

De gegevens die de overheid gebruikt bij de uitvoering van taken, worden met name gevormd door (transformatie)regels. De documentatie van deze regels is van belang om de kwaliteit van de gegevens te kunnen bepalen. 

Historiecompleetheid

(Dimensie : Compleetheid)

Wanneer bij controle op overheidshandelen een gegevensset wordt gebruikt, wil je geen gaten in de historie van deze gegevensset. Elke relevante verandering in een gegevensset moet dan ook geregistreerd zijn. Anders zijn de gegevens niet interpreteerbaar en onbetrouwbaar.

Herleidbaarheid

(Dimensie : Traceerbaarheid)

Het attribuut herleidbaarheid draagt bij aan de betrouwbaarheid en interpreteerbaarheid. Dit attribuut geeft inzicht in de mate waarin informatie is vastgelegd over het gegeven. Inzicht in het wie of wat, waar, wanneer. Dit moet by design worden ingericht. Het kan niet achteraf worden toegevoegd.

Implicaties

  • Bepaal bij de inrichting van een informatiebron de informatiewaarde. Dat doe je door te inventariseren voor welke (potentiële) afnemers welke vorm van beschikbaarheid van gegevens nodig is en hoe die behoefte zich in de loop der tijd ontwikkelt. En welke eventuele beperkingen op de beschikbaarheid van toepassing zijn. Neem op basis hiervan passende maatregelen.
  • Stel gegevens beschikbaar in een gangbaar en open bestandsformaat. Hiervoor gebruik je de norm Voorkeursformaten.
  • Zorg dat gegevens in de toekomst gereproduceerd en gedeeld kunnen worden. 

Overheidsinformatie kan een asset kan zijn (iets dat economische waarde vertegenwoordigt). Des te meer als ze duurzaam toegankelijk is. Derden kunnen deze informatie gebruiken als grondstof voor hun eigen producten en diensten. Het stimuleert bijvoorbeeld (internationale) economische bedrijvigheid en een meer circulaire, innovatieve economie. Voor hergebruik van overheidsinformatie bestaat een wettelijk kader bestaande uit nationale en Europese wetgeving. Vanuit Europa kennen we onder andere de Open data richtlijn en de High Value Datasets Uitvoeringsverordening (HVD) en voor Nederland de Wet hergebruik van overheidsinformatie (Who) die de Europese Open data richtlijn doorvoert.

Kwaliteitsattributen

Binnen gegevensmanagement draagt een aantal kwaliteitsattributen bij aan hergebruik van gegevens.

KwaliteitsattribuutKoppeling duurzame toegankelijkheid

Formaatvaliditeit

(Dimensie : Validiteit)

Voor hergebruik moet je gegevenssets (en informatieobjecten) aanbieden in een specifiek formaat. Welke formaten dat zijn, bepaal je wanneer applicaties worden ingericht. Hiervoor gebruik je de norm Voorkeursformaten en pas je archiveren by design toe. De toegepaste voorkeursformaten leg je vast in een beleid. 

Formaatvaliditeit zorgt dat gegevens leesbaar zijn door gebruikers (mens/machine).

Reputatie

(Dimensie : Plausibiliteit)

De betrouwbaarheid van de bron die de gegevens aanlevert, draagt bij aan de betrouwbaarheid.

Metadata compleetheid

(Dimensie : Compleetheid)

Om de gegevens zo aan te bieden dat ze ook op de juiste manier worden geïnterpreteerd voor verwerking, zijn metagegevens nodig. De metagegevens moeten voldoen aan gestelde compleetheidseisen. In hoeverre de metagegevens aan deze eisen moeten voldoen, is afhankelijk van de context waarin de gegevens worden gebruikt. 

Implicaties

  • Houd bij het inrichten van applicaties rekening met technieken waarop gegevens beschikbaar gesteld kunnen worden voor hergebruik, zoals het gebruik van API’s
  • Stel gegevens beschikbaar in een vorm die geschikt is voor het beoogde (her)gebruik, bijvoorbeeld machine leesbare formaten.
  • Leg in een classificatieschema aspecten vast die van belang zijn bij hergebruik van bepaalde categorieën van overheidsinformatie, zoals geldende beperkingen of uitzonderingsgronden.
  • Tref, indien van toepassing, maatregelen voor het anonimiseren van gegevenssets.

Cultureel erfgoed laat zien waar we vandaan komen en is een bron van verhalen over onszelf en onze omgeving. Ook gegevens zijn een bron voor dergelijke verhalen. Dat kan op twee manieren:

  1. Digitaliseren van erfgoed en ontsluiten aan de hand van linked data;
  2. Toegankelijk maken van erfgoeddata.

Vooral in het tweede geval vraagt dat om acties voor gegevenskwaliteit die by design ingericht moeten worden. Daarbij kun je bijvoorbeeld denken aan referentiële integriteit. Dit laat zien of de verwijzingen tussen de gegevens nog kloppen en de bewijsbaarheid volstaat. Dus: of er bewijzen zijn die aantonen dat het gegeven juist is. Dat moet niet alleen zo zijn bij het ontstaan van gegevens. Maar ook blijvend gecheckt worden bij lang of blijvend te bewaren gegevens. Preservering op lang of blijvend te bewaren gegevens is dus noodzakelijk. 

Kwaliteitsattributen

Binnen gegevensmanagement draagt een aantal kwaliteitsattributen bij aan het behouden van erfgoed.

KwaliteitsattribuutKoppeling duurzame toegankelijkheid

Referentiële integriteit

(Dimensie: Consistentie)

Wanneer connecties tussen gegevens zijn gelegd, moeten deze ook behouden blijven. Dat geldt niet alleen voor het gebruik ervan door een overheidsorganisatie. Maar ook op het toekomstig gebruik door een bedrijf of persoon na overbrenging.

Historiecompleetheid

(Dimensie: Compleetheid)

Wanneer gegevens een object beschrijven, moet ook de historie met alle relevante wijzigingen weergegeven kunnen worden. Denk hierbij bijvoorbeeld aan de registraties in het kadaster. Historiecompleetheid maakt gegevens interpreteerbaar.

Implicaties

  • Pas beslisregels toe voor bewaartermijnen van gegevens. Focus daarbij op het gebruik van gegevens.
  • Vul bewaartermijnen aan bij ontstaan en gebruik van gegevens.
  • Zorg voor een preserveringsstrategie. Een preserveringsstrategie borgt dat gegevens die lang bewaard moeten worden in stand gehouden worden. Denk bijvoorbeeld aan maatregelen als conversie, migratie, emulatie of bitpreservering.

Duurzaam toegankelijke overheidsinformatie draagt bij aan internationale klimaat- en milieudoelstellingen, waaronder GreenIT en de Duurzame Ontwikkelingsdoelstellingen (Sustainable Development Goals) van de Verenigde Naties. Verantwoord gebruik van grondstoffen leidt tot kostenbesparingen (minder opslag, minder energieverbruik en minder fossiele grondstoffen). En bevordert de circulaire economie.

Denk aan maatregelen voor het ontdubbelen van gegevens. Of de keuze voor een opslagvorm waarbij het energieverbruik aansluit op de frequentie van raadpleging. Of apparatuur die voldoet aan duurzaamheidscriteria. Ook tijdige vernietiging draagt bij aan het verminderen van klimaatlast.

Kwaliteitsattributen

Binnen gegevensmanagement draagt een aantal kwaliteitsattributen bij aan het verminderen van het effect op het klimaat van dataopslag.

KwaliteitsattribuutKoppeling duurzame toegankelijkheid

Overcompleetheid

(Dimensie : Compleetheid)

Overcompleetheid van gegevens voorkom je met het consequent vernietigen van gegevens waarvan de bewaartermijn is verlopen. Wanneer de bewaartermijn van gegevensobjecten zijn verlopen, mogen ze niet meer worden gebruikt. Want het zijn per definitie overcomplete gegevens. Hiervoor moet je een vernietigingsproces en bewaartermijnen binnen applicaties inrichten. En deze toekennen aan gegevens op basis van het gebruik van deze gegevens. En de gegevens op regelmatige basis vernietigen.

Opslagprecisie

(Dimensie : Precisie)

Zorg voor de juiste resolutie. Als bij opslag een hogere resolutie wordt toegepast dan nodig voor het gebruik, wordt er onnodig beslag gelegd op opslagcapaciteit.

Metadata compleetheid

(Dimensie : Compleetheid)

Gegevensobjecten of datasets moeten gekoppeld worden aan metagegevens die het duurzame toegankelijke beheer mogelijk maken. Zoals aan een wettelijke bewaartermijn. Op die manier kunnen voor vernietiging vatbare gegevens geselecteerd worden.

Implicaties

  • Richt het applicatielandschap in op een manier die onnodige kopieerslagen voorkomt.  Haal bijvoorbeeld zoveel mogelijk gegevens direct op uit de bron, in plaats van een lokale kopie te maken.
  • Verzamel bij creatie niet meer gegevens dan noodzakelijk voor het beoogde doel.
  • Zorg dat de gegevens gerelateerd zijn aan de bewaartermijnen van de geldende selectielijst.
  • Zorg voor een vernietigingsfunctionaliteit binnen applicaties en zorg ervoor dat gegevens kunnen worden vernietigd.
  • Richt het vernietigingsproces in voor gegevens.
  • Overweeg verschillende opslagmethodes afhankelijk van de raadpleegfrequentie. Zoals cold storage voor gegevens die nauwelijks geraadpleegd worden, maar nog niet vernietigd mogen worden.

Overheden werken met elkaar samen in ketens om op die manier de maatschappij beter van dienst te kunnen zijn. Een belangrijke basis voor de samenwerking in deze ketens is duurzaam toegankelijke overheidsinformatie. Het komt de dienstverlening ten goede als organisaties dezelfde (bron)informatie gebruiken en hergebruiken. Hierdoor kan een overheidsorganisatie samen met haar ketenpartners betere en eenduidige producten en diensten leveren. Overheidsorganisaties kunnen ook informatie samenbrengen en toegankelijk maken op één plek, zodat afnemers niet langs meerdere loketten moeten. Een voorbeeld hiervan is het Omgevingsloket.

Kwaliteitsattributen

Binnen gegevensmanagement draagt een aantal kwaliteitsattributen bij aan ketensamenwerking.

KwaliteitsattribuutKoppeling duurzame toegankelijkheid

Referentiële integriteit

(Dimensie : Consistentie)

Als verwijzingen naar bestaande gegevens wegvallen in een tabel, gaat informatie verloren.

Herleidbaarheid

(Dimensie : Traceerbaarheid)

Als de herkomst van een gegeven niet goed is gedocumenteerd, is het verminderd interpreteerbaar en betrouwbaar.

Identificeerbaarheid

(Dimensie : Identificeerbaarheid)

Als gegevens niet uniek of stabiel identificeerbaar zijn, kunnen gegevens niet betrouwbaar of toekomstbestendig aan elkaar gerelateerd worden.

Metadata compleetheid

(Dimensie : Compleetheid)

Als beschrijvende gegevens niet onvoldoende aanwezig zijn, worden gegevens bijvoorbeeld minder interpreteerbaar of leesbaar.

Implicaties

  • Maak afspraken over het beheer en uitwisselen van metagegevens en zorg dat gegevens op dezelfde manier worden geïnterpreteerd.
  • Maak de kwaliteit inzichtelijk van de gegevens die worden gedeeld met samenwerkingspartners.
  • Maak data-lineage mogelijk in de samenwerking.