r
a)
b)
50
KARTOGRAFISCH TIJDSCHRIFT
2OOO-XXVI-4
-I |x|
r 5^0«
n>"
CVF value
JTööd
Quantiles
Standard deviation
Nested Means
Arithmetic Progression
Geometrie progression
Natural Breaks
U the graph to the right 1$
similar to the one in the
'Sorted diagram' window.
the selected method
might be appropnate
Show sorted diagiam!I
Class limits are
determmed by givmg
dasses equal ränge
verdeling (figuur 4a) en de vorm die de verdeling idealiter zou
moeten hebben om geschikt te zijn voor een bepaalde klassen-
indeling (de theoretische curve, zie figuur 4b) kan de gebruiker
van kartografische pakketten helpen bij de keuze van een toe-
passelijke classificatiemethode. Wanneer de curve van de waar-
nemingen in een grafiek bijvoorbeeld gelijk is aan een lineaire
funetie is een indeling met gelijke klassenbreedten de juiste
keuze [Ormeling Kraak, 1987, pp 78, figuur 3-30].
Soms is de curve van de oorspronkelijke verdeling niet eendui-
dig visueel te interpreteren. In figuur 5 zijn drie curves voor
kwantitatieve reeksen weergegeven: (a) lineaire, (b) normale en
(c) progressief convexe verdeling van de gegevens. Deze ver-
delingen zijn achtereenvolgens geschikt voor: (a) gelijke klas
senbreedten, (b) standaard deviatie als classificatie-eenheid,
(c) meetkundige reeks. Visuele inspectie laat zien dat al deze
curves min of meer vergelijkbaar zijn met de oorspronkelijke
verdeling (figuur 4a). Bij dergelijke twijfel kan de gvf gebruikt
worden om uit te maken welke methode het beste past bij de
oorspronkelijke verdeling. De gvf's voor de drie classificatie-
methoden bij een indeling in vijf klassen zijn:
Gelijke klassenbreedten: 0,930
Standaard deviatie: 0,924
Meetkundige reeks (progressief convex): 0,923
Alhoewel alle indelingen een hoge gvf geven, gaat de voorkeur
uit naar de methode met de beste waarde: gelijke klassenbreed
ten.
Visualisering van de onnauwkeurigheid van
de classificatie
Een losstaand cijfer tussen o en 1 zal niet noodzakelijkerwijs
begrijpelijk zijn voor de gebruiker van een kartografisch pak-
ket. De gvf dient daarom vergezeld te gaan van een grafische
weergave die zijn betekenis duidelijk maakt. Dat kan bijvoor
beeld door middel van een gesorteerd staafdiagram dat de ver
deling van de variabele laat zien met de klassengrenzen en de
klassengemiddelden, en waarin met een bepaalde kleur wordt
getoond hoe de verschillende eenheden van deze gemiddelden
afwijken, zoals in de figuren 2c en 3c. In deze figuren is per
klasse de afwijking van het klassengemiddelde in rood weerge
geven. De oppervlakken van de afwijkingen per klasse vormen
bij elkaar de som van de afwijkingen over alle klassen, ofwel de
classificatiefout. De relatieve bijdrage van elke klasse aan de
classificatiefout is dus eveneens gevisualiseerd. Dit is overigens
niet hetzelfde is als de SDCMC-waarde (zie figuren 2b en 3b),
Figuur 4 - Een visu
eel hulpmiddel om
een geschikte classifi
catiemethode te kie-
zen. Links Staat de
oorspronkelijke verde
ling van de dataset,
rechts een dialoogven-
ster dat de ideale cur
ve voor een klassenin-
met gelijke
klassenbreedten weer-
want dat is de gekwadrateerde som van
de afwijkingen binnen een klasse. Waar-
schijnlijk zal het toch makkelijker zijn
om een gvf waarde te begrijpen, als men
ziet dat er een samenhang is tussen de
grootte van de gerepresenteerde classifi
catiefout en de gvf. Als het oppervlak
van de classificatiefout kleiner wordt - en
de classificatiefout dus afneemt - komt
de gvf dichter bij 1 te liggen. Waar-
schijnlijk is het 00k makkelijker om te
begrijpen welke klasse de grootste bijdra
ge levert aan de classificatiefout, aange-
zien de oppervlakte van de afwijking van
deze klasse het grootste is.
Het is niet ongewoon om commerciele
pakketten te vinden waarbij de klassen
grenzen gemakkelijk interactief door de
gebruiker zijn aan te passen. In het pak-
ket Descartes [Andrienko Andrienko,
1998] worden de klassengrenzen aange-
ven in een 'number line plot' ofwel een
spreidingsdiagram. Klassengrenzen zijn
er te veranderen met bewegingen van de
muis. Als men hetzelfde zou kunnen
doen in een gesorteerde staafdiagram
zou de gebruiker zelf kunnen ervaren dat
verandering van de klassengrenzen de
juistheid van de klassenindeling be'fn-
vloedt, omdat de oppervlakte van de
classificatiefout verändert.
Conclusie
Voor geclassificeerde kaarten geldt dat
de waarschijnlijkheid dat er geografische
patronen verborgen blijven in kaarten
met een läge gvf groter is dan in kaarten
met een hoge gvf. Als men een gebrui
ker van pakketten waarmee thematische
kaarten worden gemaakt een gvf geeft
en bovendien de gevisualiseerde bijdrage
van elke klasse aan de classificatiefout,
zal dit leiden tot een beter inzicht in de
nauwkeurigheid van de klassenindeling.
Tevens zou de gvf in Software kunnen
worden gebruikt om die classificatieme
thode die de hoogste waarde oplevert als
standaard optie aan te bieden. Uiteinde-
lijk zal dit ten goede kunnen komen aan
het overbrengen van reeds bekende gege
vens aan derden of de exploratie van nog
onbekende gegevens.
Figuur - Curves van
drie kwantitatieve
reeksen: a. lineair,
b. normaal, c. meet-
kundig (progressief
convex).