Aggregatieniveau
Voor sommige informatie is het belangrijk op welk aggre
gatieniveau de gegevens zijn weergegeven, bijvoorbeeld
wijkniveau, gemeenteniveau of provincieniveau. Het re
sultaat verkregen uit gegevens op wijkniveau kan sterk
afwijken van die op provincieniveau. Zo kan de mate van
ruimtelijke correlatie tussen twee parameters sterk wor
den beïnvloed door het aggregatieniveau. Dit „modifiable
areal unit problem" (MAUP) [18] is inzichtelijk te maken
met twee gegevensbestanden, werkloosheid en stem
gedrag, gerangschikt op een grid met gridgrootte 500 x
500 m. Voor de eenvoud van dit fictieve voorbeeld onder
kennen we bij elk van beide gegevensbestanden slechts
twee toestanden. Bij het werkloosheidsbestand geen
(0%) werkloosheid en volledige (100%) werkloosheid. Bij
het stemgedragbestand 100% PvdA-stemmers en 0%
PvdA-stemmers. Beide gegevensbestanden zijn grafisch
weergegeven in fig. 5a en 5b. Bij elk zwart hokje (100%)
in het werkloosheidsbestand hoort een wit hokje (0%) in
het stemgedragbestand. In dit sociaal-economisch onder
zoek wordt dus een perfecte negatieve correlatie tussen
de mate van werkloosheid en het stemmen op de PvdA
bepaald bij weergave van de gegevens op gridgrootte
500 x 500 m2. Herrangschikking van de gegevens op een
hoger niveau, zodanig dat vier cellen van 500 x 500 m2
worden samengevoegd tot één cel van 1000 x 1000 m2,
levert fig. 5c en 5d. De correlatie tussen beide bestanden
is nu sterk positief; precies tegenovergesteld aan het
resultaat bij representatie in cellen van 500 x 500 m2.
Gezien vanuit de signaalverwerking hangt dit probleem
samen met de keuze van de bemonsteringsfrequentie.
De juiste bemonsteringsfrequentie is afhankelijk van de
toepassing. Daarom zal er geen eenduidig antwoord
werkloosheid PvdA-stemmers
Fig. 5. Illustratie van hetmodifiable areal unit problem" (MAUP).
Werkloosheidsbestand (links) en stemgedragbestand
(rechts), weergegeven op twee verschillende aggregatie
niveaus. Bij gridcelgrootte 500 x 500 m2 (bovenste deel van
de figuur) bestaat een volledig negatieve correlatie tussen
beide bestanden, terwijl bij gridcelgrootte 1000 x 1000 m2
(onderste deel van de figuur) er een sterke positieve corre
latie te constateren valt.
mogelijk zijn op de vraag welk aggregatieniveau voor een
bepaald soort gegeven het meest optimale is. Men moet
daarvoor ook weten waarvoor de betreffende gegevens
worden gebruikt.
Actualiteit
Met het verstrijken van de tijd zal de situatie in werkelijk
heid steeds minder overeenstemming vertonen met de
situatie als weergegeven in het gegevensbestand. Wan-
NGT GEODESIA 93 - 9
Kwaliteits-
Beheersingsniveau
meta-
modellen
Informatie-
Produktieniveau
|-*f informatie
modellen
meta-
informatie
gegevens
meta
gegevens
Fig. 6. Voor alle vormen van afleiden van informatie uit gegevens
kan men niet volstaan met het bepalen van de informatie uit
de gegevens en dan te stellen dat de klus is geklaard. Het is
noodzakelijk, en voor elke geodeet is dat een tweede natuur
geworden, dat inzicht wordt verkregen in de kwaliteit van het
eindprodukt. Meta-gegevens en meta-modellen vormen
samen de basis om te komen tot kwaliteitsbeschrijving (meta-
informatie) van de geproduceerde informatie.
neer een bestand niet actueel is, bevat het feitelijk fouten.
Probleem hierbij is om te bepalen wanneer een bestand
dusdanig is verouderd, dat het niet meer bruikbaar is voor
het oorspronkelijke doel.
Perspectief
Complexiteit van het kwaliteitsprobleem
Dit artikel heeft laten zien dat de kwaliteit van de informa
tie geproduceerd door een GIS, een complexe aangele
genheid is. De kwaliteitsbepaling van de brongegevens,
waarin geodeten zich met betrekking tot de geometrische
aspecten hebben gespecialiseerd, vormt slechts een be
perkt gedeelte van de totale kwaliteitsmedaille.
Eén van de eerste vereisten om de doorwerking van de
variabiliteit in gegevens op de uiteindelijke informatie te
bepalen, is dat er geschikte methoden en gereedschap
pen beschikbaar zijn. Daarnaast zijn additionele gege
vens (meta-gegevens) nodig, die iets vertellen over de
kwaliteit van de opgeslagen gegevens.
Daar ook de modellen die de relatie leggen tussen de
gegevens en de gewenste informatie, behept zijn met
onvolkomenheden, zal het vaak nodig zijn rekening te
houden met deze onzekerheid. Daarom is het nodig dat
de onzekerheid in de gehanteerde modellen wordt gemo
delleerd. Deze modellering op meta-niveau kunnen we
beschouwen als meta-modellen. De meta-gegevens en
meta-modellen vormen samen de basis om te komen tot
kwaliteitsbeschrijving van de geproduceerde informatie
die we meta-informatie kunnen noemen (fig. 6).
Gordels om
Zoals voorheen gezegd, kunnen gecompliceerde bewer
kingen op gegevensbestanden in een GIS in een oog
wenk worden uitgevoerd. Dit nodigt de zorgeloze gebrui
ker uit operaties uit te voeren die, gezien de aard van de
gegevens, niet geoorloofd zijn. Deskundigen wijzen er in
dit verband op dat „we thans sneller en met meer ele
gantie rotzooi kunnen vervaardigen dan ooit tevoren"
[10]. Om foutieve en irrelevante bewerkingen te voor
komen, zouden regels moeten worden opgesteld. Deze
beperkingsregels dienen aan te geven welke bewerkin
gen op een bepaald gegevensbestand of combinatie van
gegevensbestanden zouden mogen worden uitgevoerd.
Zij dienen te fungeren als veiligheidsgordels om schade
bij botsingen te beperken of te voorkomen.
Presentatie van kwaliteitsinformatie
Eén van de kwaliteitseisen die we voorheen hebben
genoemd, betreft gebruikersvriendelijkheid. Binnen dit
411