De nauwkeurigheid van gedassificeerde
kaarten
KARTOGRAFISCH TIJDSCHRIFT
ARTIKEL
J. K. Red
thematische kartografie, classificatie van kwantitatieve gegevens, visualisatie TREFWOORDEN
thematic cartography, Classification of quantative data, visualisation KEYWORDS
cartographie thematique, Classification des donnees quantitatives, visualisation MOTS-CLES
Kwantitatieve ruimtelijke gegevens kunnen worden geclassi-
ficeerd om reeds bekende patronen aan anderen over te bren-
gen, of om nog onbekende patronen te ontdekken. Om te
voorkomen dat onjuiste ruimtelijke patronen worden overge
bracht of ontdekt, zou een foutgevoelige gis uitkomst kun
nen bieden. Dit artikel laat zien hoe een gis of kartografisch
pakket door middel van een eenvoudige visualisatie en een
index informatie over de nauwkeurigheid van de gedassifi
ceerde kaart naar de gebruiker kan terugkoppelen. De ge-
bruiker kan daardoor beoordelen in hoeverre een classificatie
overeenkomt met de oorspronkelijke gegevens. En hoe beter
de classificatie is, hoe geringer de kans is op onjuiste ruimte
lijke patronen.
Inleiding
Dit artikel behandelt de nauwkeurigheid
van een klassenindeling die wordt toege-
past op een variabele voor afbeelding in
een thematische kaart. Volgens Bertin
kan er onderscheid worden gemaakt tus-
sen thematische en topografische nauw
keurigheid, waarbij hij steh dat themati
sche nauwkeurigheid belangrijker is. Een
onnauwkeurige thematische kaart zal,
wanneer deze wordt gebruikt als basis
voor besluiten, kunnen leiden tot siechte
besluiten, niet door een fout in de geo-
grafische positie, maar in de geografische
patronen [Bertin, 1983, p. 70]. Om een
betere basis voor besluitvorming te cree-
ren, heeft Bertin een serie 'regels' ont-
worpen om de grafische presentatie te ta
ten corresponderen met de karakteristie-
ken van de data [Bertin, 1981, 1983b]. Zo
dienen geordende of kwantitatieve gege
vens te worden uitgebeeld door corres-
ponderende visuele variabelen. Tegen-
woordig kan men er bijna altijd vanuit
gaan dat commerciele gis- en kartografi-
sche pakketten een functie hebben die
automatisch een bij het karakter van de
Jan Ketil Rad is AIO bij
het Geografisch Instituut,
Universiteit Trondheim,
Noorwegen (NTNU),
[t] 47 73 59 17 23,
[e] jan.ketil.rod@
gegevens passende visuele variabele toekent aan gedassificeerde
data (bijvoorbeeld: klassen met hogere waarden krijgen een
donkerder signatuur of grotere Symbolen).
Volgens Baudouin [1987] kan de indeling in klassen voor the
matische kaarten in drie componenten worden gesplitst: de
keuze van het aantal klassen, de keuze voor de klassengrenzen
en de keuze voor een wijze van grafische weergave. Mede
dankzij de erfenis van Bertin is de keuze voor een bepaalde
weergave al vrij ver in de grafische pakketten doorgevoerd. De
eerste twee keuzes daarentegen behoeven nog enige aandacht,
met name met betrekkmg tot de nauwkeurigheid van de classi
ficatie. Deze nauwkeurigheid zal het belangrijkste aandachts-
punt van dit artikel vormen.
De relatie tussen nauwkeurigheid en de twee bovengenoemde
componenten van de klassenindeling voor thematische kaarten
komt in de kartografische literatuur veelvuldig terug [Jenks,
1963,1977; Jenks Caspall, 1971; Evans, 1977]. In commercie
le pakketten is echter slechts een klein gedeelte hiervan gei'm-
plementeerd. Een van de methoden om de nauwkeurigheid
van een klassenindeling aan te geven, is een index waarin af te
lezen is in welke mate de gedassificeerde verdeling overeen
komt met de oorspronkelijke verdeling. De meest voorkomen-
de maat voor deze overeenkomst is de 'Goodness of Variance
Fit' (gvf). Dit artikel behandelt de berekening van de gvf in
het kort en zal vervolgens ingaan op de betekenis van deze
maat met een voorbeeld van de twee provincies Sor- en Nord-
Trondelag in Noorwegen (figuur 1).
De 'Goodness of Variance Fit'
De gvf is een maat voor de statistische overeenkomst tussen
de klassenindeling en de oorspronkelijke data. Hoe groter de
homogeniteit binnen de klassen (kleine spreiding) en tevens
hoe groter de heterogeniteit tussen de klassen (grote sprei
ding), hoe beter de classificatie is. De gvf wordt op de volgen-
de manier berekend [Dent, 1996, pp 136]:
Bereken het rekenkundig gemiddelde voor de variabele en tel
de gekwadrateerde afwijkingen tussen de observatiewaarden en
het gemiddelde bij elkaar op. Het resultaat wordt de sdam
47