binnenhalen I I 59 KARTOGRAFISCH TIJDSCHRIFT 2002-XXVIII-4 matische kaarten en 00k hiervoor is een programma geschreven om tijd te Win nen. In totaal zijn er vijf stappen die geza- menlijk zorgdragen voor een semi-auto- matische invoer en aanpassing van gege- vens (stap 1-4) en tevens voor de produc- tie van de aan deze gegevens gekoppelde kaarten (stap 5). Stap IVoorbereiding van de data Statistische gegevens afkomstig van bij- voorbeeld de World Bank, het US Bureau of Census of de fao zijn tegenwoordig 00k beschikbaar op cd-rom of kunnen via internet binnengehaald worden. Na het vinden van het gewenste thema, in dit voorbeeld: Bruto Nationaal Product per hoofd van de bevolking in 2000 [World Development Indicators 2002 on cd-rom], worden de gegevens vervolgens in een tabel gepresenteerd (tabel 1). Per land (kolom D) wordt het aantal mensen, de dichtheid, penetratie- graad enz. (kolom E en volgende) weer- gegeven. Elke rij bevat dus minimaal: landnaam (kolom D Country Name) en waarde (kolom E de waarde in het jaar 2000). De gegevens in kolommen A, B en C zijn voor onze statistische be- werking niet nodig. Dit resultaat kan bewaard worden in een spreadsheet (in diverse formats) of kan via een knip-en-plak-methode overge bracht worden naar een Excelbestand Microsoft Excel - BNP.xls A B C 1 Landnaam Waarde 2 World 5631,241211 3 Afghanistan 4 Albania 899,4260254 13 Australia 23837,70898 14 Austria 32762,95898 20 Belarus 2760,44873 21 Belgium 30830,08789 49 Cote d'Ivoire 742,5230713 50 Croatia 5145,63916 115 Macao, China 15243,52246 116 Macedonia, FYR 2529.779785 117 Madagascar 245,796051 175 Sri Lanka 860,461853 T76~ St. Kitts and Nevis 6830,26123 177 St. Lucia 3968,278564 178 St. Vincent and the Grenadines 2770,624023 179 Sudan 319,0819702 209 Zimbabwe 620,7015381 Tabel 1. De oorspron- kelijke datarecht- streeks uit de database (hier: cd-rom). Microsoft Excel WDl_GDP_cap_2000.xls A B C D E 1 Series Code Series Name Country Code Country Name 2000 2 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) WLD World 5631,241211 3 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) AFG Afghanistan 4 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) ALB Albania 899,4260254 13 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) AUS Australia 23837,70898 14 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) AUT Austria 32762,95898 20 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) BLR Belarus 2760,44873 21 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) BEL Belgium 30830,08789 49 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) CIV Cote d'Ivoire 742,5230713 50 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) HRV Croatia 5145,63916 115 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) MAC Macao, China 15243,52246 116 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) MKD Macedonia, FYR 2529.779785 117 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) MDG Madagascar 245,796051 175 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) LKA Sri Lanka 860,461853 176 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) KNA St. Kitts and Nevi: 6830,26123 177 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) LCA St. Lucia 3968,278564 178 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) VCT St. Vincent and ti 2770,624023 179 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) SDN Sudan 319,0819702 209 NY.GDP.PCAP.KD GDP per capita (constant 1995 US$) ZWE Zimbabwe 620,7015381 (stel het bestand heet: BNP.xls). Het Excelbestand BNP.xls kan het beste de volgende lay-out hebben: Kolom A (leeg) - Kolom B (landnaam) Kolom C (waarde) (tabel 2). Een noodzakelijke en omvangrijke klus vormt het controleren van de spelling van de namen van de landen. In de praktijk blijkt vrijwel elke organisatie de naam van een land te Spellen zoals het zelf wil. Voor de meeste landen levert dit geen pro- bleem op, maar van sommige landen zijn een veelvoud aan Va rianten aanwezig. Zo wordt Macedonie bijvoorbeeld aangetrof- fen als: Macedonia Macedonia, The Former Yugoslav Republic of- Macedonia, fyr - Macedonia tfyr - The former Yugoslavian Republic of Macedonia - fyr of Macedonia enz. Daarnaast speelt nog het probleem van de diakritische tekens (zie het artikel van Tjeerd Tichelaar eiders in dit nummer). Voor dit artikel volstaat een voorbeeld: in het Nederlands komt 'e' (e met trema) als diakritisch teken in landnamen veel voor. Niet alle dataleveranciers gaan op dezelfde wijze met deze tekens om. Dit kan een aantal Varianten in de naam van een land opleveren, zoals: Cote d'Ivoire naast Cote d'Ivoire. Een derde mogelijkheid is dat sommige dataleveranciers wer ken met vaste kolommen waarbij de niet-ingevulde posities opgevuld worden met spaties. Dit levert voor het vergelijken van namen problemen op. Naast de variatie die mogelijk is in de spelling van de land naam, moet het probleem van het tegelijkertijd voorkomen van punten en komma's in de waarde vooraf opgelost worden. In Engelstalige tabellen is het gebruikelijk om met een komma een scheidingsteken voor duizendtallen aan te geven. Als een bestand echter gebruikt wordt of gaat worden op een Neder- landstalige Computer, dan wordt de waarde foutief gei'nterpre- teerd. Bijvoorbeeld: 1,000,000 (miljoen in eng) wordt 1,000000 (een in nl) of 1.0 (een in eng) wordt 10 (in nl) of 0.001 (eng) wordt 1 (nl). Het resultaat van deze voorbereiding zou moeten zijn dat de landnamen zo eenvoudig mogelijk en zonder diakritische tekens Tabel 2. Basistabel weergegeven worden. En bovendien mögen de waarden alleen BNP; data uit de komma's of alleen punten bevatten (of een zodanige eenheid, kolommen D en E dat geen van beide scheidingstekens in de waarden voorkomen). van tabel 1 wordt Na deze controle van de spelling van de landnamen en de aan- overgehaald/geko- passing van de data, is het resultaat een schoon bestand dat ge- pieerd. schikt is voor de volgende stap.

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Kartografisch Tijdschrift | 2002 | | pagina 61