De nauwkeurigheid van gedassificeerde kaarten KARTOGRAFISCH TIJDSCHRIFT ARTIKEL J. K. Red thematische kartografie, classificatie van kwantitatieve gegevens, visualisatie TREFWOORDEN thematic cartography, Classification of quantative data, visualisation KEYWORDS cartographie thematique, Classification des donnees quantitatives, visualisation MOTS-CLES Kwantitatieve ruimtelijke gegevens kunnen worden geclassi- ficeerd om reeds bekende patronen aan anderen over te bren- gen, of om nog onbekende patronen te ontdekken. Om te voorkomen dat onjuiste ruimtelijke patronen worden overge bracht of ontdekt, zou een foutgevoelige gis uitkomst kun nen bieden. Dit artikel laat zien hoe een gis of kartografisch pakket door middel van een eenvoudige visualisatie en een index informatie over de nauwkeurigheid van de gedassifi ceerde kaart naar de gebruiker kan terugkoppelen. De ge- bruiker kan daardoor beoordelen in hoeverre een classificatie overeenkomt met de oorspronkelijke gegevens. En hoe beter de classificatie is, hoe geringer de kans is op onjuiste ruimte lijke patronen. Inleiding Dit artikel behandelt de nauwkeurigheid van een klassenindeling die wordt toege- past op een variabele voor afbeelding in een thematische kaart. Volgens Bertin kan er onderscheid worden gemaakt tus- sen thematische en topografische nauw keurigheid, waarbij hij steh dat themati sche nauwkeurigheid belangrijker is. Een onnauwkeurige thematische kaart zal, wanneer deze wordt gebruikt als basis voor besluiten, kunnen leiden tot siechte besluiten, niet door een fout in de geo- grafische positie, maar in de geografische patronen [Bertin, 1983, p. 70]. Om een betere basis voor besluitvorming te cree- ren, heeft Bertin een serie 'regels' ont- worpen om de grafische presentatie te ta ten corresponderen met de karakteristie- ken van de data [Bertin, 1981, 1983b]. Zo dienen geordende of kwantitatieve gege vens te worden uitgebeeld door corres- ponderende visuele variabelen. Tegen- woordig kan men er bijna altijd vanuit gaan dat commerciele gis- en kartografi- sche pakketten een functie hebben die automatisch een bij het karakter van de Jan Ketil Rad is AIO bij het Geografisch Instituut, Universiteit Trondheim, Noorwegen (NTNU), [t] 47 73 59 17 23, [e] jan.ketil.rod@ gegevens passende visuele variabele toekent aan gedassificeerde data (bijvoorbeeld: klassen met hogere waarden krijgen een donkerder signatuur of grotere Symbolen). Volgens Baudouin [1987] kan de indeling in klassen voor the matische kaarten in drie componenten worden gesplitst: de keuze van het aantal klassen, de keuze voor de klassengrenzen en de keuze voor een wijze van grafische weergave. Mede dankzij de erfenis van Bertin is de keuze voor een bepaalde weergave al vrij ver in de grafische pakketten doorgevoerd. De eerste twee keuzes daarentegen behoeven nog enige aandacht, met name met betrekkmg tot de nauwkeurigheid van de classi ficatie. Deze nauwkeurigheid zal het belangrijkste aandachts- punt van dit artikel vormen. De relatie tussen nauwkeurigheid en de twee bovengenoemde componenten van de klassenindeling voor thematische kaarten komt in de kartografische literatuur veelvuldig terug [Jenks, 1963,1977; Jenks Caspall, 1971; Evans, 1977]. In commercie le pakketten is echter slechts een klein gedeelte hiervan gei'm- plementeerd. Een van de methoden om de nauwkeurigheid van een klassenindeling aan te geven, is een index waarin af te lezen is in welke mate de gedassificeerde verdeling overeen komt met de oorspronkelijke verdeling. De meest voorkomen- de maat voor deze overeenkomst is de 'Goodness of Variance Fit' (gvf). Dit artikel behandelt de berekening van de gvf in het kort en zal vervolgens ingaan op de betekenis van deze maat met een voorbeeld van de twee provincies Sor- en Nord- Trondelag in Noorwegen (figuur 1). De 'Goodness of Variance Fit' De gvf is een maat voor de statistische overeenkomst tussen de klassenindeling en de oorspronkelijke data. Hoe groter de homogeniteit binnen de klassen (kleine spreiding) en tevens hoe groter de heterogeniteit tussen de klassen (grote sprei ding), hoe beter de classificatie is. De gvf wordt op de volgen- de manier berekend [Dent, 1996, pp 136]: Bereken het rekenkundig gemiddelde voor de variabele en tel de gekwadrateerde afwijkingen tussen de observatiewaarden en het gemiddelde bij elkaar op. Het resultaat wordt de sdam 47

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Kartografisch Tijdschrift | 2000 | | pagina 53