J
J
49
KARTOGRAFISCH TIJDSCHRIFT
5) en anderzijds de gemeente längs de
Trondheimsfjord (klasse 1) wordt ge-
toond. Verder wordt met deze classifica-
tiemethode gesuggereerd dat een aantal
gemeenten aan de buitenkant van de
provincie een hoog aandeel oude bevol-
king heeft doordat er tien gemeenten (in
plaats van twee zoals in figuur 3) in de
laagste klasse vallen.
Het gebruik van de GVF
De theoretisch maximum waarde van de
GVF is 1,0 en derhalve zullen classificaties
beter zijn naarmate ze een waarde heb-
ben die dichter bij 1,0 ligt. De gvf kan
worden gebruikt om een classihcatie te
optimaliseren [Jenks Caspall, 1971], en
er bestaan algoritmen die er gebruik van
maken [Jenks, 1977; Lindberg, 1990]. De
zoektocht naar de optimale kaart illu-
streert datgene waar kartografen zieh mee
bezig hebben gehouden na ongeveer
1970. Deze periode wordt wel die van het
communicatie-paradigma in de kartogra-
fie genoemd [MacEachren, 1995]. Binnen
dit paradigma werd de kaart gezien als
een medium voor communicatie over
een bepaalde, en bekende, boodschap.
Vanaf ongeveer 1990 is de interesse van
de kartografen verschoven naar het visu-
aliseringperspectief. Volgens dit perspec-
tief houdt men zieh niet meer bezig met
het vinden van de optimale kaart:
"For cartographic visualization the
message is unknown and, therefore,
tbere is no optimal map! The goal is to
assist an analyst in discovering pattems
and relationships in the data.
[MacEachren Ganter, 1990, p. 65/
Naar mijn mening is de zoektocht naar
het optimaliseren van een geclassificeer-
de kaart op basis van de gvf echter nog
steeds actueel. Met een betere gvf zal de
kans afnemen dat verschillen of gelijke-
nissen die in de dataset aanwezig zijn in
de kaart verborgen blijven, of dat juist
de verschillen of gelijkenissen die niet in
de dataset aanwezig zijn in de kaart naar
voren komen. De gvf is derhalve rele
vant, ongeacht of men deze beschouwt
vanuit een communicatie-paradigma of
vanuit een visualiseringperspectief.
Wanneer de kaart wordt gebruikt als een
medium voor communicatie geldt: hoe
beter de gvf, hoe kleiner de kans is dat
de kaart een leugen over zal brengen.
Wanneer de kaart wordt gebruikt als een
gereedschap voor visualisering geldt: hoe
beter de gvf, hoe groter de kans dat een
patroon dat een analist eventueel in de
kaart ontdekt daadwerkelijk bestaat. In
dien de kaart een basis voor besluitvor-
ming vormt, wordt het eens te meer dui-
Figuur 3 - Aandeel
van de leeftijdsgroep
boven 67 jaar op de
totale bevolking per
gemeente in Sor- en
Nord- Trondelag
(1999). Indeling in
vijfklassen met gelij-
ke klassenbreedten.
2000-XXV1-4
delijk hoe belangrijk de juiste representatie is. De berekening
van de gvf om een indeling in klassen te optimaliseren, of het
gebruik van de gvf als hulpmiddel bij het kiezen tussen ver-
schillende klassenindelingen [Declercq, 1995] is daarom nog
steeds relevant.
Een op de tweehonderdduizend
De kaart in hguur 2a is slechts een van de 194.580 mogelijkhe-
den om deze variabele met 49 eenheden in te delen in 5 klas
sen. Het is echter lastig om te bepalen of de klassenindeling
die gebruikt is voor de kaart in figuur 2a goed is of siecht zon-
der de maximale bereikbare gvf voor deze dataset te kennen.
Daarom zijn met behulp van een Visual Basic algoritme voor
alle 194.580 mogelijke klassenindelingen de GVF-waarden bere-
kend. Daaruit blijkt dat er een maximale waarde van 0,937 be-
reikt kan worden. Declercq [1995, pp. 922] heeft een onder-
zoek gedaan naar de invloed van het aantal klassen op de gvf
bij verschillende classificatiemethoden, waaruit naar voren
kwam dat de gvf nivelleert bij waarden boven de 0,95 - 00k al
neemt het aantal klassen nog toe. Hieruit concludeerde hij dat
een gvf van 0,95 kan worden beschouwd als de norm voor een
goede classificatie. Zo bleek dat voor de classificatie van een
variabele met 308 eenheden zes klassen nodig waren om deze
gvf te bereiken. Als we deze conclusie volgen is er voor onze
dataset geen normatief goede indeling mogelijk wanneer vijf
klassen worden gebruikt. Indien het aantal klassen wordt ver-
hoogd tot zes krijgen we een gvf van 0,954 bij indeling van de
waarnemingen in gelijke klassenbreedte, en slechts 0,907 bij
een indeling volgens de kwantielenmethode.
Voor karteringsdoeleinden dient dus een klassenindeling te
worden gekozen met een gvf die de optimale waarde zo dicht
mogelijk benadert. In de praktijk van de commerciele pakket
ten betekent dit dat de classificatiemethode wordt gekozen die
de hoogste gvf geeft. Voor onze dataset blijkt - bij vijfklassen
- een indeling met gelijke klassenbreedten de beste oplossing te
zijn (zie figuur 3).
Een visuele vergelijking van de curve van de oorspronkelijke
Gelijke klassenbreedten
I 5* Edit c
11 evaluate Classification
HEI
Klasse
Symbol [Min
Max>[ tt
\*X |Aveiag<|SDCMd
]J
7.40
10.68
2 4.08 8.55 2.64
2
1 10.68'
13,96
9 18.37 12.87 3.3d
3
1 i 3,96 j
17.24
13 26.53 15.63 14.19
17
20,52
18 36.73 18.63 13.IM
23,80
7 14,29 22.13 8.67|
a)
Het
Trondheims
Ijord
Classification Equal Intetvak
method
3VF 0.930
Etwi cotoof fr Show ctesses
fr ;Show class meari