model complexer is of wanneer de relatie tussen de ge
gevens en de gewenste informatie niet (quasi) lineair is,
dan is het bepalen van de variabiliteit van de afgeleide
informatie uit de gegevens een moeilijke, zoniet ondoen
lijke aangelegenheid [19]. Is de variabiliteit van de ge
gevens voldoende goed bekend, maar is het model sterk
niet-lineair, dan kan men een Monte Carlo simulatie toe
passen [17]. Hierbij wordt uit de bekende spreiding van
de gegevens, op de bekende waarden ruis gegenereerd
en de doorwerking op het eindresultaat bepaald (fig. 3).
Door vele malen ruis te genereren, wordt een beeld ver
kregen van de spreiding van het eindresultaat. Een na
deel is dat de methode rekenintensief is. Is de variabiliteit
van de gegevens niet bekend, dan zit er niets anders op
dan een redelijke afschatting te maken van de spreiding
en te kijken wat de invloed is op het eindresultaat. Deze
manier om de doorwerking van onzekerheid van gege
vens te bepalen, heet in de literatuur gevoeligheidsana
lyse [15]. Soms zal daarbij blijken dat een sterke sprei
ding in de gegevens slechts een geringe en acceptabele
spreiding in het eindresultaat oplevert [8].
Onvolkomenheden in de modellen
Modellen zijn veelal een vereenvoudiging van de werke
lijkheid, daar het nagenoeg onmogelijk is om natuurlijke
en sociaal-economische processen exact te beschrijven.
Aannamen en idealisaties zijn onvermijdelijk. Een voor
beeld uit de remote sensing is het bepalen van de bio
massa B(i,j) van elk pixel uit de multispectrale informatie
van een Landsat Thematic Mapper beeld [14], Naast het
beeld beschikken we over een aantal gebieden waarvan
de biomassa bekend is, de zogenaamde „ground truth".
Om de onbekende B(i,j)'s te schatten, wordt een lineaire
relatie verondersteld tussen de biomassa en de
vegetatie-index V, en wel als volgt: B aV waarbij
a en p worden geschat uit de ground truth. De vegetatie
index bepalen we uit de infrarode (gir) en rode (gr) band
van de Landsat-opname volgens: V (gir - gr)/(gir
gr). Bij het bepalen van de biomassa op deze wijze is
een aantal onzekere modelaannamen gedaan, waar
onder: de relatie tussen de biomassa en vegetatie-index
is lineair, en de ground truth is nauwkeurig genoeg om a
en p voldoende goed te schatten.
Onvolkomenheden in de computerimplementatie van
modellen
Fouten ontstaan ook door de (noodgedwongen) wijze van
implementatie in de computer. We lichten dit met twee
voorbeelden toe.
Differentiëren
Het bepalen van de afgeleide is een veel voorkomende
operatie bij de analyse van ruimtelijke gegevens. Een
voorbeeld is de bepaling van de terreinhelling uit een digi
taal hoogtemodel (DHM). Differentiëren in een continue
ruimte is wiskundig volledig gedefinieerd. Maar in de
computer hebben we te maken met rasterbestanden, dat
wil zeggen discrete ruimten. Het definiëren van differen
tiëren in discrete ruimten kan op meerdere manieren ge
beuren. Eén van deze manieren leidt tot de zogenoemde
Sobel-operator, waarbij 9 rasterelementen in een 3x3
venster betrokken zijn. De keuze van de operator zal
onder andere afhangen van gewenste nauwkeurigheid,
rekentijd en objectdichtheid.
Grotere vensters dan die van de Sobel-operator zullen
nauwkeurigere resultaten opleveren, maar vergen ook
ABC
Fig. 4. Drie manieren om een polygoon afkomstig uit een vector
bestand te combineren met een rasterbestand.
meer rekentijd. Daarnaast wordt bij grotere filters de
responsie beïnvloed door naburige objecten. Dit heeft
zowel gevolgen voor de sterkte als de richting van de
gradiënt. Bij grote objectdichtheid mogen daarom de
filters niet te groot worden gekozen of men moet speciale
voorzieningen treffen. In [12] is theoretisch onderzoek uit
gevoerd aangaande de Sobel-operator. Hieruit blijkt dat
de gradiëntsterkte maximaal 7% afwijkt en de gradiënt
richting maximaal 2° van de theoretische waarden.
Integratie van raster- en vectorgegevens
Het combineren van raster- en vectorgegevens is een
veel voorkomende operatie in een GIS. Een voorbeeld
vormt het bepalen van de inhoud van een object dat als
polygoon is opgeslagen door gebruik te maken van een
DHM. Deze operatie vergt dat de rasterelementen van
het DHM die worden bedekt door de polygoon uit
het rasterbestand worden gelicht. Dit kan op meerdere
manieren geschieden:
alleen de rasterelementen die in hun geheel binnen de
polygoon vallen, leveren een bijdrage (fig. 4a). Deze
operatie levert systematisch een te kleine waarde op;
alleen de rasterelementen waarvan 50% of meer van
het oppervlak binnen de polygoon valt, tellen mee
(fig. 4b). Bij grote aantallen zullen de positieve en
negatieve effecten elkaar veelal elimineren, maar het
is niet uitgesloten dat de verkregen waarde te groot of
te klein uitvalt;
de bijdrage van elk rasterelement wordt gewogen naar
de oppervlakte die binnen de polygoon valt (fig. 4c).
Deze wijze van berekenen levert het nauwkeurigste
resultaat, maar kost ook de meeste rekentijd.
Aard van de begrenzing
Een bron van fouten is ook de schijnbare precisie die
uitgaat van het tekenen van grenzen als dunne lijnen die
exact zijn gelokaliseerd [4]. Op bodem- en vegetatie-
kaarten bijvoorbeeld zullen deze lijnen geen scherp om
lijnde grenzen representeren, maar overgangszones.
Wanneer men deze lijnen digitaliseert en vervolgens be
handelt als grenzen die goed afgebakende topografische
elementen representeren, kan dit tot foutieve resultaten
leiden. Methoden om met dit type lijnen om te gaan, zijn
nog niet ontwikkeld, maar het gebruik van fuzzy logische
modellen lijkt een goede mogelijkheid. Hierbij kan een
object gedeeltelijk tot de ene verzameling en gedeeltelijk
tot een andere verzameling behoren. De mate waarin het
object tot een verzameling behoort, kan variëren van 0 tot
1Daar de grenzen overgangszones vormen tussen twee
typen, kunnen zij worden behandeld als behoren zij
gedeeltelijk tot de ene verzameling en gedeeltelijk tot de
andere verzameling. Probleem daarbij is vooral om de
aard van de overgangszone te bepalen en wiskundig te
beschrijven.
410
NGT GEODESIA 93 - 9