r a) b) 50 KARTOGRAFISCH TIJDSCHRIFT 2OOO-XXVI-4 -I |x| r 5^0« n>" CVF value JTööd Quantiles Standard deviation Nested Means Arithmetic Progression Geometrie progression Natural Breaks U the graph to the right 1$ similar to the one in the 'Sorted diagram' window. the selected method might be appropnate Show sorted diagiam!I Class limits are determmed by givmg dasses equal ränge verdeling (figuur 4a) en de vorm die de verdeling idealiter zou moeten hebben om geschikt te zijn voor een bepaalde klassen- indeling (de theoretische curve, zie figuur 4b) kan de gebruiker van kartografische pakketten helpen bij de keuze van een toe- passelijke classificatiemethode. Wanneer de curve van de waar- nemingen in een grafiek bijvoorbeeld gelijk is aan een lineaire funetie is een indeling met gelijke klassenbreedten de juiste keuze [Ormeling Kraak, 1987, pp 78, figuur 3-30]. Soms is de curve van de oorspronkelijke verdeling niet eendui- dig visueel te interpreteren. In figuur 5 zijn drie curves voor kwantitatieve reeksen weergegeven: (a) lineaire, (b) normale en (c) progressief convexe verdeling van de gegevens. Deze ver- delingen zijn achtereenvolgens geschikt voor: (a) gelijke klas senbreedten, (b) standaard deviatie als classificatie-eenheid, (c) meetkundige reeks. Visuele inspectie laat zien dat al deze curves min of meer vergelijkbaar zijn met de oorspronkelijke verdeling (figuur 4a). Bij dergelijke twijfel kan de gvf gebruikt worden om uit te maken welke methode het beste past bij de oorspronkelijke verdeling. De gvf's voor de drie classificatie- methoden bij een indeling in vijf klassen zijn: Gelijke klassenbreedten: 0,930 Standaard deviatie: 0,924 Meetkundige reeks (progressief convex): 0,923 Alhoewel alle indelingen een hoge gvf geven, gaat de voorkeur uit naar de methode met de beste waarde: gelijke klassenbreed ten. Visualisering van de onnauwkeurigheid van de classificatie Een losstaand cijfer tussen o en 1 zal niet noodzakelijkerwijs begrijpelijk zijn voor de gebruiker van een kartografisch pak- ket. De gvf dient daarom vergezeld te gaan van een grafische weergave die zijn betekenis duidelijk maakt. Dat kan bijvoor beeld door middel van een gesorteerd staafdiagram dat de ver deling van de variabele laat zien met de klassengrenzen en de klassengemiddelden, en waarin met een bepaalde kleur wordt getoond hoe de verschillende eenheden van deze gemiddelden afwijken, zoals in de figuren 2c en 3c. In deze figuren is per klasse de afwijking van het klassengemiddelde in rood weerge geven. De oppervlakken van de afwijkingen per klasse vormen bij elkaar de som van de afwijkingen over alle klassen, ofwel de classificatiefout. De relatieve bijdrage van elke klasse aan de classificatiefout is dus eveneens gevisualiseerd. Dit is overigens niet hetzelfde is als de SDCMC-waarde (zie figuren 2b en 3b), Figuur 4 - Een visu eel hulpmiddel om een geschikte classifi catiemethode te kie- zen. Links Staat de oorspronkelijke verde ling van de dataset, rechts een dialoogven- ster dat de ideale cur ve voor een klassenin- met gelijke klassenbreedten weer- want dat is de gekwadrateerde som van de afwijkingen binnen een klasse. Waar- schijnlijk zal het toch makkelijker zijn om een gvf waarde te begrijpen, als men ziet dat er een samenhang is tussen de grootte van de gerepresenteerde classifi catiefout en de gvf. Als het oppervlak van de classificatiefout kleiner wordt - en de classificatiefout dus afneemt - komt de gvf dichter bij 1 te liggen. Waar- schijnlijk is het 00k makkelijker om te begrijpen welke klasse de grootste bijdra ge levert aan de classificatiefout, aange- zien de oppervlakte van de afwijking van deze klasse het grootste is. Het is niet ongewoon om commerciele pakketten te vinden waarbij de klassen grenzen gemakkelijk interactief door de gebruiker zijn aan te passen. In het pak- ket Descartes [Andrienko Andrienko, 1998] worden de klassengrenzen aange- ven in een 'number line plot' ofwel een spreidingsdiagram. Klassengrenzen zijn er te veranderen met bewegingen van de muis. Als men hetzelfde zou kunnen doen in een gesorteerde staafdiagram zou de gebruiker zelf kunnen ervaren dat verandering van de klassengrenzen de juistheid van de klassenindeling be'fn- vloedt, omdat de oppervlakte van de classificatiefout verändert. Conclusie Voor geclassificeerde kaarten geldt dat de waarschijnlijkheid dat er geografische patronen verborgen blijven in kaarten met een läge gvf groter is dan in kaarten met een hoge gvf. Als men een gebrui ker van pakketten waarmee thematische kaarten worden gemaakt een gvf geeft en bovendien de gevisualiseerde bijdrage van elke klasse aan de classificatiefout, zal dit leiden tot een beter inzicht in de nauwkeurigheid van de klassenindeling. Tevens zou de gvf in Software kunnen worden gebruikt om die classificatieme thode die de hoogste waarde oplevert als standaard optie aan te bieden. Uiteinde- lijk zal dit ten goede kunnen komen aan het overbrengen van reeds bekende gege vens aan derden of de exploratie van nog onbekende gegevens. Figuur - Curves van drie kwantitatieve reeksen: a. lineair, b. normaal, c. meet- kundig (progressief convex).

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Kartografisch Tijdschrift | 2000 | | pagina 56