Kartografisch Tijdschrift | 1 april 2003 | pagina 7 - Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

'Self-Organizing Maps' voor de representatie en visualisatie van complexe ruimtelijke gegevens 5 KARTOGRAFISCH TIJDSCHRIFT ARTIKEL EL Koua visualisatie, ruimtelijke data exploratie, exploratieve analyse, Self-Organizing Maps visualisation, spatial data exploration, exploratory analysis, Self-Organising Maps visualisation, exploration de donnees spatiales, Self-Organising Maps TREFWOORDEN KEYWORDS MOTS-CLES Door nieuwe inwinningstechnieken komen er steeds meer ruimtelijke data ter beschikking. Het analyseren en aan el kaar relateren van dergelijke datasets is een complexe taak. Conventionele methoden, zoals statistische analyse en twee- dimensionale grafische weergave, voldoen vaak niet. Een mo- gelijk alternatief is het gebruik van een bepaald kunstmatig neuraal networkmodel, de 'Self-Organizing Map'. Op basis van een verzameling kenmerken van data worden Clusters in de data gevormd. Deze Clusters kunnen worden gevisuali- seerd om nadere bestudering mogelijk te maken. Introductie Het basisidee bij het analyseren van ruimtelijke gegevens is het vinden van patronen en relaties in de data die kun nen helpen om een specifiek geo-gerela- teerd probleem op te lossen. Problemen worden vaak geassocieerd met het moni- toren of managen van een ruimtelijk fenomeen, met planning en het nemen van beslissingen. De beperkingen in de menselijke visuele en cognitieve verwer- king als gevolg van grote aantallen getal- len en objecten in een tweedimensionele kaart vormen problemen als het volume van de gegevens toeneemt. De behoefte aan meer accurate en flexibele gereed- schappen voor data analyse is dan ook cruciaal omdat patronen verborgen kun nen zijn en de analyse van trends moei- lijk kan zijn onder deze omstandighe- den. De geowetenschapper lijkt tegen- woordig meer en meer te werken met onbekende data of gegevens waarvan hij of zij niet genoeg kennis heeft van de onderliggende relaties [Openshaw Openshaw, 1997]. Dit komt omdat het toenemende volume en de verschillende aard van digitale geografische data de ge- bruikelijke ruimtelijke-analyse technie- ken, die gericht zijn op het extraheren Etien L. Koua is Ph.D. Student bij de afdeling Geolnformation Processing (GIP) van het ITC, Postbus 6, 7500 AA Enschede, [e] koua@itc.nl, [t] 053-4874256. van informatie uit kleine en homogene datasets, gemakkelijk te boven gaan [Miller Han, 2001]. Traditionele analytische methoden die toegepast worden op ruimtelijke data, zoals sta tistische methoden, vergen veel rekenkracht en zijn vooral technieken waarmee van tevoren opgestelde hypotheses ge- toetst kunnen worden. Classificatie- en patroonherkenningme- thoden zijn bedoeld om een onbekend patroon te vergelijken met alle bekende referentiepatronen op basis van enkele crite- ria voor de mate van overeenkomst, om zo te beslissen tot wel ke klasse het patroon behoort. Bij onbekende data is echter niet duidelijk wat de mechanismen of regels zijn achter de ei- genlijke data of welke klassen gevormd zouden kunnen wor den. Dit maakt het moeilijk om met behulp van bekende tech nieken nieuwe kennis en onverwachte patronen, trends en re laties te ontdekken die verborgen kunnen zijn binnen zeer grote ruimtelijke datasets. De 'Self-Organizing Map' (som) [Kohonen, 1989] is een neu raal netwerk dat bedoeld is om patronen te extraheren en ab- stracties te genereren waar conventionele methoden beperkt zijn omdat de onderliggende relaties niet duidelijk zijn en de mechanismen of regels achter de data niet eenvoudig te achter- halen zijn. Dit potentieel van de som is bekeken voor com plexe ruimtelijke data. Combinatie met visualisatietechnieken zou het begrijpen van de complexiteit en de efifectiviteit van exploratieve analyse moeten verbeteren. Het 'self-organizing map' algoritme De som [Kohonen, 1989] is een van de bekendste kunstmatige neurale netwerkenvoorbeelden van een ongecontroleerd leer- model. In tegenstelling tot gecontroleerd lerende neurale net- werkmodellen, die leren om bepaalde ingevoerde dementen te associeren met een set uitgevoerde dementen met behulp van data waarvoor zowel de in- als de uitvoer bekend zijn, worden de eenheden (de neuraal verwerkende dementen) van het on- gecontroleerde neurale netwerk georganiseerd binnen een ze- ker gebied tijdens de training, dat wordt bepaald door gegeven invoerwaarden. Het doel is om gelijksoortige eenheden dicht bij elkaar te groeperen binnen een bepaald waardebereik. Tij dens het leerproces zullen de knooppunten die in topologisch opzicht binnen een bepaalde afstand bij elkaar in de buurt lig-

Vorige Volgende