Aggregatieniveau Voor sommige informatie is het belangrijk op welk aggre gatieniveau de gegevens zijn weergegeven, bijvoorbeeld wijkniveau, gemeenteniveau of provincieniveau. Het re sultaat verkregen uit gegevens op wijkniveau kan sterk afwijken van die op provincieniveau. Zo kan de mate van ruimtelijke correlatie tussen twee parameters sterk wor den beïnvloed door het aggregatieniveau. Dit „modifiable areal unit problem" (MAUP) [18] is inzichtelijk te maken met twee gegevensbestanden, werkloosheid en stem gedrag, gerangschikt op een grid met gridgrootte 500 x 500 m. Voor de eenvoud van dit fictieve voorbeeld onder kennen we bij elk van beide gegevensbestanden slechts twee toestanden. Bij het werkloosheidsbestand geen (0%) werkloosheid en volledige (100%) werkloosheid. Bij het stemgedragbestand 100% PvdA-stemmers en 0% PvdA-stemmers. Beide gegevensbestanden zijn grafisch weergegeven in fig. 5a en 5b. Bij elk zwart hokje (100%) in het werkloosheidsbestand hoort een wit hokje (0%) in het stemgedragbestand. In dit sociaal-economisch onder zoek wordt dus een perfecte negatieve correlatie tussen de mate van werkloosheid en het stemmen op de PvdA bepaald bij weergave van de gegevens op gridgrootte 500 x 500 m2. Herrangschikking van de gegevens op een hoger niveau, zodanig dat vier cellen van 500 x 500 m2 worden samengevoegd tot één cel van 1000 x 1000 m2, levert fig. 5c en 5d. De correlatie tussen beide bestanden is nu sterk positief; precies tegenovergesteld aan het resultaat bij representatie in cellen van 500 x 500 m2. Gezien vanuit de signaalverwerking hangt dit probleem samen met de keuze van de bemonsteringsfrequentie. De juiste bemonsteringsfrequentie is afhankelijk van de toepassing. Daarom zal er geen eenduidig antwoord werkloosheid PvdA-stemmers Fig. 5. Illustratie van hetmodifiable areal unit problem" (MAUP). Werkloosheidsbestand (links) en stemgedragbestand (rechts), weergegeven op twee verschillende aggregatie niveaus. Bij gridcelgrootte 500 x 500 m2 (bovenste deel van de figuur) bestaat een volledig negatieve correlatie tussen beide bestanden, terwijl bij gridcelgrootte 1000 x 1000 m2 (onderste deel van de figuur) er een sterke positieve corre latie te constateren valt. mogelijk zijn op de vraag welk aggregatieniveau voor een bepaald soort gegeven het meest optimale is. Men moet daarvoor ook weten waarvoor de betreffende gegevens worden gebruikt. Actualiteit Met het verstrijken van de tijd zal de situatie in werkelijk heid steeds minder overeenstemming vertonen met de situatie als weergegeven in het gegevensbestand. Wan- NGT GEODESIA 93 - 9 Kwaliteits- Beheersingsniveau meta- modellen Informatie- Produktieniveau |-*f informatie modellen meta- informatie gegevens meta gegevens Fig. 6. Voor alle vormen van afleiden van informatie uit gegevens kan men niet volstaan met het bepalen van de informatie uit de gegevens en dan te stellen dat de klus is geklaard. Het is noodzakelijk, en voor elke geodeet is dat een tweede natuur geworden, dat inzicht wordt verkregen in de kwaliteit van het eindprodukt. Meta-gegevens en meta-modellen vormen samen de basis om te komen tot kwaliteitsbeschrijving (meta- informatie) van de geproduceerde informatie. neer een bestand niet actueel is, bevat het feitelijk fouten. Probleem hierbij is om te bepalen wanneer een bestand dusdanig is verouderd, dat het niet meer bruikbaar is voor het oorspronkelijke doel. Perspectief Complexiteit van het kwaliteitsprobleem Dit artikel heeft laten zien dat de kwaliteit van de informa tie geproduceerd door een GIS, een complexe aangele genheid is. De kwaliteitsbepaling van de brongegevens, waarin geodeten zich met betrekking tot de geometrische aspecten hebben gespecialiseerd, vormt slechts een be perkt gedeelte van de totale kwaliteitsmedaille. Eén van de eerste vereisten om de doorwerking van de variabiliteit in gegevens op de uiteindelijke informatie te bepalen, is dat er geschikte methoden en gereedschap pen beschikbaar zijn. Daarnaast zijn additionele gege vens (meta-gegevens) nodig, die iets vertellen over de kwaliteit van de opgeslagen gegevens. Daar ook de modellen die de relatie leggen tussen de gegevens en de gewenste informatie, behept zijn met onvolkomenheden, zal het vaak nodig zijn rekening te houden met deze onzekerheid. Daarom is het nodig dat de onzekerheid in de gehanteerde modellen wordt gemo delleerd. Deze modellering op meta-niveau kunnen we beschouwen als meta-modellen. De meta-gegevens en meta-modellen vormen samen de basis om te komen tot kwaliteitsbeschrijving van de geproduceerde informatie die we meta-informatie kunnen noemen (fig. 6). Gordels om Zoals voorheen gezegd, kunnen gecompliceerde bewer kingen op gegevensbestanden in een GIS in een oog wenk worden uitgevoerd. Dit nodigt de zorgeloze gebrui ker uit operaties uit te voeren die, gezien de aard van de gegevens, niet geoorloofd zijn. Deskundigen wijzen er in dit verband op dat „we thans sneller en met meer ele gantie rotzooi kunnen vervaardigen dan ooit tevoren" [10]. Om foutieve en irrelevante bewerkingen te voor komen, zouden regels moeten worden opgesteld. Deze beperkingsregels dienen aan te geven welke bewerkin gen op een bepaald gegevensbestand of combinatie van gegevensbestanden zouden mogen worden uitgevoerd. Zij dienen te fungeren als veiligheidsgordels om schade bij botsingen te beperken of te voorkomen. Presentatie van kwaliteitsinformatie Eén van de kwaliteitseisen die we voorheen hebben genoemd, betreft gebruikersvriendelijkheid. Binnen dit 411

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

(NGT) Geodesia | 1993 | | pagina 7