Het Raamwerk Gegevenskwaliteit biedt een gemeenschappelijke taal voor het beschrijven van gegevenskwaliteit. Dat gebeurt aan de hand van kwaliteitsdimensies. Dit zijn aspecten van gegevenskwaliteit waar gebruikers van gegevens waarde aan hechten [NORA]. Een voorbeeld hiervan is de dimensie ‘compleetheid’. Met ‘compleetheid’ kun je de mate aangegeven waarin gegevens aanwezig zijn. Een kwaliteitsdimensie heeft op haar beurt weer attributen. Dit zijn concreet meetbare aspecten binnen een kwaliteitsdimensie. De attributen ‘dataset compleetheid’, ‘historie compleetheid’ en ‘metadata compleetheid’ zijn voorbeelden van attributen die bij de kwaliteitsdimensie ‘compleetheid’ horen.
Het DUTO-raamwerk benoemt zes kenmerken waaraan overheidsinformatie moet voldoen om duurzaam toegankelijk te zijn: vindbaar, beschikbaar, leesbaar, interpreteerbaar, betrouwbaar en toekomstbestendig. Deze hebben in tegenstelling tot kwaliteitsdimensies geen attributen.
De DUTO-kenmerken en de kwaliteitsdimensies uit het NORA Raamwerk Gegevenskwaliteit komen niet altijd een-op-een overeen, maar kunnen elkaar wel versterken. Dit lichten we toe in een matrix.
Symbool | Betekenis |
---|---|
+ | NORA en DUTO dragen aan elkaar bij |
++ | NORA en DUTO dragen in hoge mate aan elkaar bij |
Overzicht kwaliteitsdimensies en DUTO-kenmerken
Vindbaar | Beschikbaar | Leesbaar | Interpreteerbaar | Betrouwbaar | Toekomstbestendig | |
---|---|---|---|---|---|---|
Juistheid | ||||||
Compleetheid | + | ++ | + | + | ||
Validiteit | ++ | |||||
Consistentie | + | |||||
Actualiteit | ||||||
Precisie | ++ | |||||
Plausibiliteit | ++ | |||||
Traceerbaarheid | ||||||
Begrijpelijkheid | ++ |
We werken deze relaties verder uit in de twee tabellen hieronder.. De relaties beschrijven we vanuit de DUTO-kenmerken én vanuit de kwaliteitsdimensies van NORA.
DUTO-kenmerken koppelen aan kwaliteitsdimensies
DUTO-kenmerk | Kwaliteitsdimensie(s) NORA | Toelichting relatie |
---|---|---|
Vindbaar: Informatie kan snel en eenvoudig gevonden worden door gebruikers die daar recht toe hebben. | Compleetheid | Om de vindbaarheid van overheidsinformatie te verwezenlijken, moeten de gegevens compleet zijn. In het bijzonder de metagegevens. Die zijn essentieel voor de vindbaarheid. |
Beschikbaar: Informatie is beschikbaar voor (her)gebruik, ongeacht het doel, het tijdstip en de actor, voor zo ver wettelijk en beleidsmatig is toegestaan. | Compleetheid | Voor doelmatig (her)gebruik moeten gegevens ten eerste aanwezig zijn om beschikbaar gesteld te kunnen worden. ’Compleetheid’ is hier een voorwaarde voor. |
Leesbaar: Informatie is weer te geven en te verwerken door mensen en machines. | Begrijpelijkheid Validiteit | Om de leesbaarheid te kunnen garanderen, is het voor zowel mens als machines noodzakelijk om gegevens te kunnen verwerken. Begrijpelijkheid is te koppelen aan leesbaar voor menselijke lezers. Validiteit naar de leesbaarheid door machines. |
Interpreteerbaar: Het is duidelijk wat de betekenis van informatie is en wat de context is waarin die is ontvangen, gecreëerd en gebruikt. | Compleetheid Contistentie | Voor de interpreteerbaarheid is het noodzakelijk dat gegevens compleet zijn. In het bijzonder de metagegevens. Deze zijn namelijk essentieel voor de interpretatie van gegevens en informatie. Daarnaast zijn consistentie van gegevens van belang voor de interpreteerbaarheid. Vooral als het gaat om de samenhang tussen verschillende gegevens, dus om referentiële integriteit. |
Betrouwbaar: Informatie is volledig en gebaseerd op gegevens die kwalitatief in orde zijn en die zijn wat ze beweren te zijn. | Plausibiliteit Traceerbaarheid Compleetheid | Voor betrouwbaarheid moet de plausibiliteit van gegevens zijn geborgd. Vooral wanneer we kijken naar het attribuut bewijsbaarheid. Daarnaast kan betrouwbaarheid alleen worden gegarandeerd als de gegevens traceerbaar en compleet zijn. |
Toekomstbestendig: Informatie is nu en in de toekomst te verwerken voor iedereen die daar belang bij heeft, voor zo lang als noodzakelijk. | Toekomstbestendigheid is niet iets dat duidelijk naar voren komt in NORA. De nadruk ligt namelijk op het huidig gebruik van gegevens. En niet op het toekomstig gebruik op de lange termijn. Voor gegevens die wel langdurig of blijvend bewaard moeten worden, is de toekomstbestendigheid wel noodzakelijk. DUTO levert dus een bijdrage leveren aan het verbeteren van de gegevenskwaliteit. |
Kwaliteitsdimensies koppelen aan DUTO-kenmerken
Kwaliteitsdimensie NORA | DUTO-kenmerk(en) | Toelichting relatie |
---|---|---|
Juistheid De mate waarin gegevens de echte waarde goed weergeven. | Juistheid is niet van wezenlijk belang voor duurzame toegankelijkheid. Hier is dus geen raakvlak. | |
Compleetheid De mate waarin gegevens aanwezig zijn. | Beschikbaar Vindbaar Interpreteerbaar Betrouwbaar | Alleen complete gegevens zijn beschikbaar voor (her)gebruik. Kunnen worden geïnterpreteerd. En kunnen daadwerkelijk gevonden worden. Het gaat met name om de compleetheid van metadata. |
Validiteit De mate waarin gegevens voldoen aan de verwachte structuur en opslagvorm. | Leesbaar | Valide gegevens kunnen worden verwerkt door een machine. En leesbaarheid gaat over verwerking door zowel mens en machine. |
Consistentie De mate waarin gegevens vrij van tegenspraak zijn en samenhang vertonen met andere gegevens. | Interpreteerbaar | De samenhang van gegevens onderling is van belang om ze goed te kunnen interpreteren. |
Actualiteit De mate waarin gegevens recent genoeg zijn. | Hoe recent de gegevens zijn, is niet direct van belang voor duurzame toegankelijkheid. Hier is dus geen raakvlak. | |
Precisie De mate waarin gegevens exact of onderscheidend genoeg zijn. | Hoe exact of onderscheidend gegevens zijn is niet van belang voor duurzame toegankelijkheid. Hier is dus geen raakvlak. | |
Plausibiliteit De mate waarin gegevens worden beschouwd als waar en geloofwaardig door gebruikers. | Betrouwbaar | Om gegevens als waar en geloofwaardig te beschouwen, moeten deze kwalitatief op orde zijn. En moeten de gegevens zijn wat ze beweren te zijn. Hiermee draag je bij aan betrouwbaarheid. |
Traceerbaarheid De mate waarin de totstandkoming en het gebruik van gegevens zijn vastgelegd. | Betrouwbaar | Bij betrouwbare informatie moet de kwaliteit van de onderliggende gegevens traceerbaar zijn. |
Begrijpelijkheid De mate waarin gegevens eenvoudig gelezen en geïnterpreteerd kunnen worden door gebruikers. | Leesbaar | Zowel menselijke als niet-menselijke gebruikers moeten gegevens kunnen lezen en interpreteren. Daarom moeten deze op een bepaald basisniveau weergegeven kunnen worden. |
Waar moet ik mee aan de slag?
De tabellen laten zien waar de kwaliteitsdimensies en de DUTO-kenmerken elkaar aanvullen en/of overlappen. Bijvoorbeeld bij compleetheid. Dat is ook logisch omdat er een duidelijke connectie met metadata is. Bij toekomstbestendigheid en de dimensies is juist geen overlap te zien.
Je kunt de tabellen gebruiken om de werelden van gegevens en informatie dichter bij elkaar te brengen. Het laat onder andere zien dat vanuit DUTO een bijdrage geleverd kan worden aan de toekomstbestendigheid van gegevens. Het vormt een basis om de samenwerking aan te gaan en daarmee duurzame toegankelijkheid van gegevens te borgen.
Voor verdere verdieping kun je naar Risico’s gegevenskwaliteit by design gaan.