invoer (toelichting resultaat KARTOGRAFISCH TIJDSCHRIFT 2002-XXVIII-4 Stap 2: Alfabetiseren Het doel van dit programma is het vinden en toekennen van het juiste nummer aan de juiste landnaam. Dit nummer wordt 00k wel de sorteercode genoemd. Vervolgens wordt de lijst met landennamen via deze code gesorteerd. Deze stap is nodig omdat de alfabetische volgorde in het Engels anders is dan in het Nederlands; Austria Staat bijvoorbeeld op een andere piek in een alfabetische lijst dan Oostenrijk. Ook het probleem van hoe om te gaan met afkortingen wordt steeds anders opgelost, bv.: Saint Lucia, Sint Lucia of St. Lucia. De lijst met landnamen uit ons voorbeeld - bestand BNP.xls, kolom B, landnaam - wordt gekopieerd naar een Excel bestand genaamd 2_Alfabetiseren.xls. Dit bestand bestaat uit een viertal kolommen: Nummer (de eerdergenoemde sorteer code), Country-iD (dit is een identificatienummer dat gebruikt wordt voor de verschillende landen in andere programma's), Landnaam (de Nederlandstalige naam van het land), Name (lijst met de meest voorkomende spellingvariaties van de land naam) en tenslotte een lege kolom. De gekopieerde lijst uit ko lom B van het bestand BNP.xls wordt in deze lege kolom ge- plakt (hier: kolom F). Het programma vergelijkt dan de spel- ling van de namen uit ons bestand BNP.xls met de reeds in het bestand 2_Alfabetiseren.xls vermelde spellingsvarianten (tabel 3). Via een formule wordt de naam in kolom F vergeleken met de naam in kolom Name. Als de namen exact overeenkomen wordt de waarde in de kolom Landnummer gezet (hier: kolom BC). Zijn de namen niet gelijk dan wordt de naam in kolom F vergeleken met de volgende naam in de kolom Name. Het programma zorgt ervoor dat elke naam uit kolom F automa tisch voorzien wordt van een nummer in kolom BC (de sor teercode, die bij de gekopieerde naam uit kolom B van be stand BNP.xls hoort). Het kan gebeuren dat een landnaam niet in de kolom 'Name' voorkomt. Dan kent het programma het nummer 0 toe. Dit geldt niet alleen voor namen met een afwijkende spelling, maar ook voor nieuwe landen (zoals Oost-Timor) of voor niet-onafhankelijke gebieden die wel in de statistiek een aparte vermel- ding kunnen hebben (bijvoorbeeld Groenland, Macau of Tibet). Vervolgens worden de gegevens uit ko lom BC (de sorteercode) gekopieerd en toegevoegd aan het bestand BNP.xls. Door het commando 'plakken speciaaT wordt alleen de waarde uit kolom BC van het bestand 2_Alfabetiseren.xls overgeno- men en niet de onderliggende formule. De waarden worden geplakt in kolom A van het bestand BNP.xls (tabel 4). Dit be stand wordt gesorteerd op de waarde in ko lom A in oplopende volgorde (zie tabel 5). Door deze sortering verschijnen alle lan den in de volgorde van de Nederlandse spelling. Landen met de waarde o staan bovenaan, dat zijn landen die een nadere controle moeten ondergaan. Is het land een niet- onafhankelijk gebied, dan kan het land gegevens) verwijderd worden. Een der- gelijk gebied wordt toch niet in de Basis- statistiek opgenomen. Is het land wel een onafhankelijk land, dan is er een fout op- getreden bij het vergelijken in het bestand 2_Alfabetiseren.xls. De meest voor Microsoft Excel - 2_Alfabetiseren.xls A B C D E F BC 1 Landnummer CountryJD Landnaam NAME Invoegkolom Landnummer 2 BNP kolom B: landnaam formules* =ALS(F3=D$3;4 157 0 4421 Macau Macao =ALS(F3=D$3;/ 158 102 3430 Macedonie Macedonia Macao, China =ALS(F3=D$3;/ 0 159 102 3430 Macedonie Macedonia, The Former Yugoslav Republic of Macedonia, FYR =ALS(F3=D$3; 102 160 102 3430 Macedonie Macedonia, FYR Madagascar =ALS(F3=D$3;/ 103 161 102 3430 Macedonie Macedonia TFYR Malawi =ALS(F3=D$3;> 162 102 3430 Macedonie The former Yugoslavian Republic of Macedonia Malaysia =ALS(F3=D$3;/ 163 102 3430 Macedonie FYR of Macedonia =ALS(F3=D$3;/ 164 103 5427 Madagaskar Madagascar =ALS(F3=D$3;/ =ALS(F3=D$3;4 De formule is als volgt samengesteld: =ALS(F3=D$3;A$3; ALS(F3=D$4;A$4; ALS(F158=D$157;A$157 ALS(F158=D$158;A$158 ALS(F158=D$159; A$159 ALS(F158=D$160;A$160 ALS(F158=D$161A$161 ALS(F327=D$330;A$330;0)))))))) De basis voor deze formule is: ALS (argument;waar;onwaar). Door de formule in serie toe te passen, wordt de ALS-vergelijking steeds herhaald totdat de uitkomst WAAR is. Is geen enkele vergelijking WAAR, dan wordt in de laatste vergelijking de waarde 0 toegekend en stopt de formule. Tabel3. Alfabetiseren: door vergelijking van de namen wordt het bij de landnaam behorende landnummer verkregen. 60

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Kartografisch Tijdschrift | 2002 | | pagina 62