binnenhalen
I I
59
KARTOGRAFISCH TIJDSCHRIFT
2002-XXVIII-4
matische kaarten en 00k hiervoor is een
programma geschreven om tijd te Win
nen.
In totaal zijn er vijf stappen die geza-
menlijk zorgdragen voor een semi-auto-
matische invoer en aanpassing van gege-
vens (stap 1-4) en tevens voor de produc-
tie van de aan deze gegevens gekoppelde
kaarten (stap 5).
Stap IVoorbereiding van de
data
Statistische gegevens afkomstig van bij-
voorbeeld de World Bank, het US Bureau
of Census of de fao zijn tegenwoordig
00k beschikbaar op cd-rom of kunnen
via internet binnengehaald worden.
Na het vinden van het gewenste thema,
in dit voorbeeld: Bruto Nationaal
Product per hoofd van de bevolking in
2000 [World Development Indicators
2002 on cd-rom], worden de gegevens
vervolgens in een tabel gepresenteerd
(tabel 1). Per land (kolom D) wordt het
aantal mensen, de dichtheid, penetratie-
graad enz. (kolom E en volgende) weer-
gegeven. Elke rij bevat dus minimaal:
landnaam (kolom D Country Name)
en waarde (kolom E de waarde in het
jaar 2000). De gegevens in kolommen
A, B en C zijn voor onze statistische be-
werking niet nodig.
Dit resultaat kan bewaard worden in een
spreadsheet (in diverse formats) of kan
via een knip-en-plak-methode overge
bracht worden naar een Excelbestand
Microsoft Excel - BNP.xls
A
B
C
1
Landnaam
Waarde
2
World
5631,241211
3
Afghanistan
4
Albania
899,4260254
13
Australia
23837,70898
14
Austria
32762,95898
20
Belarus
2760,44873
21
Belgium
30830,08789
49
Cote d'Ivoire
742,5230713
50
Croatia
5145,63916
115
Macao, China
15243,52246
116
Macedonia, FYR
2529.779785
117
Madagascar
245,796051
175
Sri Lanka
860,461853
T76~
St. Kitts and Nevis
6830,26123
177
St. Lucia
3968,278564
178
St. Vincent and the Grenadines
2770,624023
179
Sudan
319,0819702
209
Zimbabwe
620,7015381
Tabel 1. De oorspron-
kelijke datarecht-
streeks uit de database
(hier: cd-rom).
Microsoft Excel
WDl_GDP_cap_2000.xls
A
B
C
D
E
1
Series Code
Series Name
Country Code
Country Name
2000
2
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
WLD
World
5631,241211
3
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
AFG
Afghanistan
4
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
ALB
Albania
899,4260254
13
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
AUS
Australia
23837,70898
14
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
AUT
Austria
32762,95898
20
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
BLR
Belarus
2760,44873
21
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
BEL
Belgium
30830,08789
49
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
CIV
Cote d'Ivoire
742,5230713
50
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
HRV
Croatia
5145,63916
115
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
MAC
Macao, China
15243,52246
116
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
MKD
Macedonia, FYR
2529.779785
117
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
MDG
Madagascar
245,796051
175
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
LKA
Sri Lanka
860,461853
176
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
KNA
St. Kitts and Nevi:
6830,26123
177
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
LCA
St. Lucia
3968,278564
178
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
VCT
St. Vincent and ti
2770,624023
179
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
SDN
Sudan
319,0819702
209
NY.GDP.PCAP.KD
GDP per capita (constant 1995 US$)
ZWE
Zimbabwe
620,7015381
(stel het bestand heet: BNP.xls). Het Excelbestand BNP.xls
kan het beste de volgende lay-out hebben: Kolom A (leeg) -
Kolom B (landnaam) Kolom C (waarde) (tabel 2).
Een noodzakelijke en omvangrijke klus vormt het controleren
van de spelling van de namen van de landen. In de praktijk
blijkt vrijwel elke organisatie de naam van een land te Spellen
zoals het zelf wil. Voor de meeste landen levert dit geen pro-
bleem op, maar van sommige landen zijn een veelvoud aan Va
rianten aanwezig. Zo wordt Macedonie bijvoorbeeld aangetrof-
fen als: Macedonia Macedonia, The Former Yugoslav
Republic of- Macedonia, fyr - Macedonia tfyr - The former
Yugoslavian Republic of Macedonia - fyr of Macedonia enz.
Daarnaast speelt nog het probleem van de diakritische tekens
(zie het artikel van Tjeerd Tichelaar eiders in dit nummer).
Voor dit artikel volstaat een voorbeeld: in het Nederlands
komt 'e' (e met trema) als diakritisch teken in landnamen veel
voor. Niet alle dataleveranciers gaan op dezelfde wijze met
deze tekens om. Dit kan een aantal Varianten in de naam van
een land opleveren, zoals: Cote d'Ivoire naast Cote d'Ivoire.
Een derde mogelijkheid is dat sommige dataleveranciers wer
ken met vaste kolommen waarbij de niet-ingevulde posities
opgevuld worden met spaties. Dit levert voor het vergelijken
van namen problemen op.
Naast de variatie die mogelijk is in de spelling van de land
naam, moet het probleem van het tegelijkertijd voorkomen
van punten en komma's in de waarde vooraf opgelost worden.
In Engelstalige tabellen is het gebruikelijk om met een komma
een scheidingsteken voor duizendtallen aan te geven. Als een
bestand echter gebruikt wordt of gaat worden op een Neder-
landstalige Computer, dan wordt de waarde foutief gei'nterpre-
teerd. Bijvoorbeeld: 1,000,000 (miljoen in eng) wordt
1,000000 (een in nl) of 1.0 (een in eng) wordt 10 (in nl) of
0.001 (eng) wordt 1 (nl).
Het resultaat van deze voorbereiding zou moeten zijn dat de
landnamen zo eenvoudig mogelijk en zonder diakritische tekens
Tabel 2. Basistabel weergegeven worden. En bovendien mögen de waarden alleen
BNP; data uit de komma's of alleen punten bevatten (of een zodanige eenheid,
kolommen D en E dat geen van beide scheidingstekens in de waarden voorkomen).
van tabel 1 wordt Na deze controle van de spelling van de landnamen en de aan-
overgehaald/geko- passing van de data, is het resultaat een schoon bestand dat ge-
pieerd. schikt is voor de volgende stap.