Kwaliteitsdimensies Raamwerk Gegevenskwaliteit NORA en DUTO-kenmerken

Handreiking Duurzame toegankelijkheid van gegevens

Het Raamwerk Gegevenskwaliteit biedt een gemeenschappelijke taal voor het beschrijven van gegevenskwaliteit. Dat gebeurt aan de hand van kwaliteitsdimensies. Dit zijn aspecten van gegevenskwaliteit waar gebruikers van gegevens waarde aan hechten [NORA]. Een voorbeeld hiervan is de dimensie ‘compleetheid’. Met ‘compleetheid’ kun je de mate aangegeven waarin gegevens aanwezig zijn. Een kwaliteitsdimensie heeft op haar beurt weer attributen. Dit zijn concreet meetbare aspecten binnen een kwaliteitsdimensie. De attributen ‘dataset compleetheid’, ‘historie compleetheid’ en ‘metadata compleetheid’ zijn voorbeelden van attributen die bij de kwaliteitsdimensie ‘compleetheid’ horen.

Het DUTO-raamwerk benoemt zes kenmerken waaraan overheidsinformatie moet voldoen om duurzaam toegankelijk te zijn: vindbaar, beschikbaar, leesbaar, interpreteerbaar, betrouwbaar en toekomstbestendig. Deze hebben in tegenstelling tot kwaliteitsdimensies geen attributen.

De DUTO-kenmerken en de kwaliteitsdimensies uit het NORA Raamwerk Gegevenskwaliteit komen niet altijd een-op-een overeen, maar kunnen elkaar wel versterken. Dit lichten we toe in een matrix.

SymboolBetekenis
+NORA en DUTO dragen aan elkaar bij
++NORA en DUTO dragen in hoge mate aan elkaar bij

Overzicht kwaliteitsdimensies en DUTO-kenmerken

 VindbaarBeschikbaarLeesbaarInterpreteerbaarBetrouwbaarToekomstbestendig
Juistheid      
Compleetheid+++ ++ 
Validiteit  ++   
Consistentie   +  
Actualiteit      
Precisie    ++ 
Plausibiliteit    ++ 
Traceerbaarheid      
Begrijpelijkheid  ++   

We werken deze relaties verder uit in de twee tabellen hieronder.. De relaties beschrijven we vanuit de DUTO-kenmerken én vanuit de kwaliteitsdimensies van NORA.

DUTO-kenmerken koppelen aan kwaliteitsdimensies

DUTO-kenmerkKwaliteitsdimensie(s) NORAToelichting relatie
Vindbaar:
Informatie kan snel en eenvoudig gevonden worden door gebruikers die daar recht toe hebben.
Compleetheid

Om de vindbaarheid van overheidsinformatie te verwezenlijken, moeten de gegevens compleet zijn. In het bijzonder de metagegevens. Die zijn essentieel voor de vindbaarheid. 

Beschikbaar:
Informatie is beschikbaar voor (her)gebruik, ongeacht het doel, het tijdstip en de actor, voor zo ver wettelijk en beleidsmatig is toegestaan.
Compleetheid

Voor doelmatig (her)gebruik moeten gegevens ten eerste aanwezig zijn om beschikbaar gesteld te kunnen worden. ’Compleetheid’ is hier een voorwaarde voor. 

Leesbaar:
Informatie is weer te geven en te verwerken door mensen en machines.
Begrijpelijkheid
Validiteit

Om de leesbaarheid te kunnen garanderen, is het voor zowel mens als machines noodzakelijk om gegevens te kunnen verwerken.

Begrijpelijkheid is te koppelen aan leesbaar voor menselijke lezers. 

Validiteit naar de leesbaarheid door machines.

Interpreteerbaar:
Het is duidelijk wat de betekenis van informatie is en wat de context is waarin die is ontvangen, gecreëerd en gebruikt.
Compleetheid
Contistentie

Voor de interpreteerbaarheid is het noodzakelijk dat gegevens compleet zijn. In het bijzonder de metagegevens. Deze zijn namelijk essentieel voor de interpretatie van gegevens en informatie.

Daarnaast zijn consistentie van gegevens van belang voor de interpreteerbaarheid. Vooral als het gaat om de samenhang tussen verschillende gegevens, dus om referentiële integriteit.  

Betrouwbaar:
Informatie is volledig en gebaseerd op gegevens die kwalitatief in orde zijn en die zijn wat ze beweren te zijn.
Plausibiliteit
Traceerbaarheid
Compleetheid
Voor betrouwbaarheid moet de plausibiliteit van gegevens zijn geborgd. Vooral wanneer we kijken naar het attribuut bewijsbaarheid. Daarnaast kan betrouwbaarheid alleen worden gegarandeerd als de gegevens traceerbaar en compleet zijn.  
Toekomstbestendig:
Informatie is nu en in de toekomst te verwerken voor iedereen die daar belang bij heeft, voor zo lang als noodzakelijk.
 

Toekomstbestendigheid is niet iets dat duidelijk naar voren komt in NORA. De nadruk ligt namelijk op het huidig gebruik van gegevens. En niet op het toekomstig gebruik op de lange termijn.

Voor gegevens die wel langdurig of blijvend bewaard moeten worden, is de toekomstbestendigheid wel noodzakelijk. DUTO levert dus een bijdrage leveren aan het verbeteren van de gegevenskwaliteit.

Kwaliteitsdimensies koppelen aan DUTO-kenmerken

Kwaliteitsdimensie NORADUTO-kenmerk(en)Toelichting relatie
Juistheid
De mate waarin gegevens de echte waarde goed weergeven.
 Juistheid is niet van wezenlijk belang voor duurzame toegankelijkheid.  Hier is dus geen raakvlak.
Compleetheid
De mate waarin gegevens aanwezig zijn.
Beschikbaar
Vindbaar
Interpreteerbaar
Betrouwbaar
Alleen complete gegevens zijn beschikbaar voor (her)gebruik. Kunnen worden geïnterpreteerd. En kunnen daadwerkelijk gevonden worden. Het gaat met name om de compleetheid van metadata.
Validiteit
De mate waarin gegevens voldoen aan de verwachte structuur en opslagvorm.
LeesbaarValide gegevens kunnen worden verwerkt door een machine. En leesbaarheid gaat over verwerking door zowel mens en machine.
Consistentie
De mate waarin gegevens vrij van tegenspraak zijn en samenhang vertonen met andere gegevens.
InterpreteerbaarDe samenhang van gegevens onderling is van belang om ze goed te kunnen interpreteren.
Actualiteit
De mate waarin gegevens recent genoeg zijn.
 Hoe recent de gegevens zijn, is niet direct van belang voor duurzame toegankelijkheid. Hier is dus geen raakvlak.
Precisie
De mate waarin gegevens exact of onderscheidend genoeg zijn.
 Hoe exact of onderscheidend gegevens zijn is niet van belang voor duurzame toegankelijkheid. Hier is dus geen raakvlak.
Plausibiliteit
De mate waarin gegevens worden beschouwd als waar en geloofwaardig door gebruikers.
BetrouwbaarOm gegevens als waar en geloofwaardig te beschouwen, moeten deze kwalitatief op orde zijn. En moeten de gegevens zijn wat ze beweren te zijn. Hiermee draag je bij aan betrouwbaarheid.
Traceerbaarheid
De mate waarin de totstandkoming en het gebruik van gegevens zijn vastgelegd.
BetrouwbaarBij betrouwbare informatie moet de kwaliteit van de onderliggende gegevens traceerbaar zijn.
Begrijpelijkheid
De mate waarin gegevens eenvoudig gelezen en geïnterpreteerd kunnen worden door gebruikers.
LeesbaarZowel menselijke als niet-menselijke gebruikers moeten gegevens kunnen lezen en interpreteren. Daarom moeten deze op een bepaald basisniveau weergegeven kunnen worden. 

Waar moet ik mee aan de slag?

De tabellen laten zien waar de kwaliteitsdimensies en de DUTO-kenmerken elkaar aanvullen en/of overlappen. Bijvoorbeeld bij compleetheid. Dat is ook logisch omdat er een duidelijke connectie met metadata is. Bij toekomstbestendigheid en de dimensies is juist geen overlap te zien. 

Je kunt de tabellen gebruiken om de werelden van gegevens en informatie dichter bij elkaar te brengen. Het laat onder andere zien dat vanuit DUTO een bijdrage geleverd kan worden aan de toekomstbestendigheid van gegevens. Het vormt een basis om de samenwerking aan te gaan en daarmee duurzame toegankelijkheid van gegevens te borgen.

Voor verdere verdieping kun je naar Risico’s gegevenskwaliteit by design gaan.