'Self-Organizing Maps' voor de
representatie en visualisatie van
complexe ruimtelijke gegevens
5
KARTOGRAFISCH TIJDSCHRIFT
ARTIKEL
EL Koua
visualisatie, ruimtelijke data exploratie, exploratieve analyse, Self-Organizing Maps
visualisation, spatial data exploration, exploratory analysis, Self-Organising Maps
visualisation, exploration de donnees spatiales, Self-Organising Maps
TREFWOORDEN
KEYWORDS
MOTS-CLES
Door nieuwe inwinningstechnieken komen er steeds meer
ruimtelijke data ter beschikking. Het analyseren en aan el
kaar relateren van dergelijke datasets is een complexe taak.
Conventionele methoden, zoals statistische analyse en twee-
dimensionale grafische weergave, voldoen vaak niet. Een mo-
gelijk alternatief is het gebruik van een bepaald kunstmatig
neuraal networkmodel, de 'Self-Organizing Map'. Op basis
van een verzameling kenmerken van data worden Clusters in
de data gevormd. Deze Clusters kunnen worden gevisuali-
seerd om nadere bestudering mogelijk te maken.
Introductie
Het basisidee bij het analyseren van
ruimtelijke gegevens is het vinden van
patronen en relaties in de data die kun
nen helpen om een specifiek geo-gerela-
teerd probleem op te lossen. Problemen
worden vaak geassocieerd met het moni-
toren of managen van een ruimtelijk
fenomeen, met planning en het nemen
van beslissingen. De beperkingen in de
menselijke visuele en cognitieve verwer-
king als gevolg van grote aantallen getal-
len en objecten in een tweedimensionele
kaart vormen problemen als het volume
van de gegevens toeneemt. De behoefte
aan meer accurate en flexibele gereed-
schappen voor data analyse is dan ook
cruciaal omdat patronen verborgen kun
nen zijn en de analyse van trends moei-
lijk kan zijn onder deze omstandighe-
den. De geowetenschapper lijkt tegen-
woordig meer en meer te werken met
onbekende data of gegevens waarvan hij
of zij niet genoeg kennis heeft van de
onderliggende relaties [Openshaw
Openshaw, 1997]. Dit komt omdat het
toenemende volume en de verschillende
aard van digitale geografische data de ge-
bruikelijke ruimtelijke-analyse technie-
ken, die gericht zijn op het extraheren
Etien L. Koua is Ph.D.
Student bij de afdeling
Geolnformation Processing
(GIP) van het ITC,
Postbus 6, 7500 AA
Enschede,
[e] koua@itc.nl,
[t] 053-4874256.
van informatie uit kleine en homogene datasets, gemakkelijk
te boven gaan [Miller Han, 2001]. Traditionele analytische
methoden die toegepast worden op ruimtelijke data, zoals sta
tistische methoden, vergen veel rekenkracht en zijn vooral
technieken waarmee van tevoren opgestelde hypotheses ge-
toetst kunnen worden. Classificatie- en patroonherkenningme-
thoden zijn bedoeld om een onbekend patroon te vergelijken
met alle bekende referentiepatronen op basis van enkele crite-
ria voor de mate van overeenkomst, om zo te beslissen tot wel
ke klasse het patroon behoort. Bij onbekende data is echter
niet duidelijk wat de mechanismen of regels zijn achter de ei-
genlijke data of welke klassen gevormd zouden kunnen wor
den. Dit maakt het moeilijk om met behulp van bekende tech
nieken nieuwe kennis en onverwachte patronen, trends en re
laties te ontdekken die verborgen kunnen zijn binnen zeer
grote ruimtelijke datasets.
De 'Self-Organizing Map' (som) [Kohonen, 1989] is een neu
raal netwerk dat bedoeld is om patronen te extraheren en ab-
stracties te genereren waar conventionele methoden beperkt
zijn omdat de onderliggende relaties niet duidelijk zijn en de
mechanismen of regels achter de data niet eenvoudig te achter-
halen zijn. Dit potentieel van de som is bekeken voor com
plexe ruimtelijke data. Combinatie met visualisatietechnieken
zou het begrijpen van de complexiteit en de efifectiviteit van
exploratieve analyse moeten verbeteren.
Het 'self-organizing map' algoritme
De som [Kohonen, 1989] is een van de bekendste kunstmatige
neurale netwerkenvoorbeelden van een ongecontroleerd leer-
model. In tegenstelling tot gecontroleerd lerende neurale net-
werkmodellen, die leren om bepaalde ingevoerde dementen te
associeren met een set uitgevoerde dementen met behulp van
data waarvoor zowel de in- als de uitvoer bekend zijn, worden
de eenheden (de neuraal verwerkende dementen) van het on-
gecontroleerde neurale netwerk georganiseerd binnen een ze-
ker gebied tijdens de training, dat wordt bepaald door gegeven
invoerwaarden. Het doel is om gelijksoortige eenheden dicht
bij elkaar te groeperen binnen een bepaald waardebereik. Tij
dens het leerproces zullen de knooppunten die in topologisch
opzicht binnen een bepaalde afstand bij elkaar in de buurt lig-