2015-6 I Geo-Info
Gebruikersvraag
Producteisen
Kwaliteits
kenmerken
Prioritering
(MoSCoW1)
Kwaliteitseisen
Ik wil de locatie
kennen van
aanlegplaatsen
geometrie van
aanlegplaatsen
(points)
positionele
nauwkeurigheid
M
50 - 100m
omission
M
2%
comission
M
0%
actualiteit
M
1 jaar
Het moet duidelijk
Specificatie van
nauwkeurigheid
M
100%
zijn welk schip past
afmetingen:
compleetheid
M
100%
qua afmetingen
lengte, breedte,
diepte
actualiteit
S
2 jaar
Het moet up to date
Verversings
frequentie
actualiteit
M
1 jaar
zijn
temporele
nauwkeurigheid
M
Ik wil het gebruiken
brontype:
dataset
beschikbaarheid
C
1 week
in een app
metadata
bron/eigenaar
definitie van
klassen
beschikbaar
beschikbaar
Twee perspectieven
Kwaliteit zoals een producent van een dataset
dat ziet is meestal anders dan hoe een poten
tiële gebruiker er tegenaan kijkt. Op basis van
ervaring met projecten hebben we een raam
werk opgesteld met als doel dat gat tussen
producenten en consumenten te overbruggen.
Wat heb ik nodig?
Dit bestand heb ik
in de aanbieding
Figuur 1 - Twee verschillende perspectieven.
Met dat raamwerk willen we de communicatie
verbeteren tussen zowel de gebruiker als de
producent. De consument staat centraal in dit
raamwerk. Hij of zij heeft een vraag en vaak
liggen er impliciet kwaliteitscriteria aan ten
grondslag, maar daar is de consument niet
altijd helder in en vaker nog zich helemaal
niet van bewust. De producent heeft meestal
goed door wat de (interne) kwaliteit van zijn
databestand is, maar communiceert daar vaak
over in termen die voor leken niet begrijpelijk
zijn en vaak ook niet vindbaar, want ergens
verstopt in de lange lijst met metadata.
Behoeftenformulering
Het is zaak om erachter te komen wat de consu
ment precies bedoelt en de vraag als behoefte
te formuleren. Liefst zo dat er nagegaan kan
worden of er een dataset is die aan de behoefte
voldoet. Als een bestand vergezeld gaat van
metadata, bijvoorbeeld in ESRI-Geosticker-
format (zie fig.2), dan is het al mogelijk om een
idee over de bruikbaarheid te krijgen. Daarin
staat bijvoorbeeld wat het bestand beschrijft
(de thematiek), welk geografisch gebied het
betreft, welk coördinatensysteem is gebruikt en
over welke tijdsperiode de data iets zegt.
Maar met zo'n metadatabestand kan een
gebruiker alleen per item ja' of 'nee' conclude
ren over geschiktheid voor het gebruiksdoel.
Hoe kom je dan, alles overziende, tot een
eindoordeel?
Tabel 1 - De kwaliteitsvragenmatrix.
Gewichten
Geonovum heeft dat met het Nationaal
Georegister (NGR) als volgt aangepakt. NGR
gebruikt metadata bestanden om datasets te
kunnen laten zoeken via zoektermen. Zo biedt
de zoekterm "hoogte" ruim 5000 hits. Ook kan
gezocht worden met de invalshoeken Wat,
Waar en Wanneer, of op INSPIRE.
Vanuit een producentenperspectief taxeert
Geonovum de kwaliteit van de metadatabe-
standen die in het NGR zijn opgeslagen. NGR
kan alleen 100% kwaliteit leveren (naar NGR's
eigen maatstaven) als de partijen die een
databestand in het NGR onderbrengen alle
26 vragen naar eigenschappen goed hebben
ingevuld. NGR bepaalt het gewicht van elk
metadata onderdeel en vertaalt dat naar de
score voor een goed of een slecht antwoord.
Per item levert dat punten op, die worden
opgeteld tot een eindscore. Door dat regelma
tig te doen kan NGR volgen hoe de kwaliteit
van de aangeboden metadatasets zich ontwik
kelt en ingrijpen waar het verkeerd gaat.
Kwaliteit meten is dus een kwestie van scoren ten
opzichte van normen voor kwaliteitsaspecten.
Doorvragen
Ook gebruikers kunnen dat principe toepassen.
Eerst op een rij zetten welke data aspecten ze
1 MoSCoW: Must, Should, Could en Would have.
belangrijk vinden. Dan bedenken hoe ze de
waarde ervan kunnen beoordelen. En daarna
een norm stellen, een drempelwaarde voor
bruikbaarheid. Dit is niet zo makkelijk. Als je
iemand met een databehoefte vraagt welke
kwaliteitseisen hij of zij stelt aan de informatie,
levert dit vaak niet direct een bevredigend ant
woord op. Dat vergt verder doorvragen. Als een
persoon aangeeft dat hij informatie wil over
alle aanlegplaatsen voor de binnenvaart van
Nederland en hij heeft het gebruiksdoel scherp,
dan is te achterhalen wat de kwaliteitseisen
zijn. Onze expertisegroep heeft een matrix
opgesteld waarmee in een aantal case studies
een consument met een informatiebehoefte
bevraagd hebben. We wilden weten wat de
informatie vraag is, wat het doel/toepassing is,
wat de producteisen zijn, wat de bijbehorende
kwaliteitskenmerken zijn, de prioritering en
de normen. Een voorbeeld hiervan staat in
bovenstaande tabel. Uit de verschillende case
studies blijkt dat er maar een beperkt aantal
producteisen zijn en dat per producteis een
vast aantal kwaliteitskernmerken horen. Dat
maakt het bevragen eenvoudiger.
Communicatie
Aan de andere kant van het spectrum staat
de producent. Over het algemeen weet een
producent heel goed wat de kwaliteit is van
zijn of haar data. Maar hoe wordt daarover
gecommuniceerd met de consument? Voor
traditionele geo-producten die voorheen (of
nu ook nog) verkocht worden geldt dat de
identificatie Contacten Metametadata Dekking Kwaliteit Inhoud Distributie
Figuur 2 - Onderwerpsgroepen in het metadata-format van GeoSticker van EsriNL.