sM®
7
KARTOGRAFISCH TIJDSCHRIFT
2003-XXIX-2
het ontwikkelen van oplossingen en het
opbouwen van kennis [Kraak, 2000]
SOM visualisatietechnieken
Het gebruik van de som is bedoeld als
aanvulling op exploratieve data-analyse-
technieken door een gereedschap aan te
bieden waarmee ruimtelijke patronen
kunnen worden geexploreerd. Het
brengt verschillende fases in de transfor-
matie van data naar informatie met el-
kaar in verband, en bevat kennis uit di
verse gegevensverwerkende disciplines.
Een aantal visualisatietechnieken kan
worden afgeleid uit de som:
visualisatie van Clusters met de
'Unified Distance Matrix',
projecties,
visualisatie van componentvlakken in
aparte, met elkaar verbonden vensters,
2D en 3D oppervlakteplots.
Deze technieken gebruiken visuele attri-
buten en eigenschappen van positie om
de visualisatie te verduidelijken. Er zijn
00k een aantal gebruikersinteracties mo-
gelijk die een zekere mate van controle
over de visuele attributen geven. Ruim
telijke metaforen die inherent zijn aan
alledaagse concepten van menselijke
orientatie en navigatie worden gebruikt
om te helpen bij de verkenning en inter-
pretatie van de representatie [Fabrikant,
2001]De ruimtelijke metaforen worden
gecombineerd met bepaalde representa-
tievormen en het gebruik van visuele va-
riabelen zoals kleur, vorm, belichting,
positie, grootte en richting om explora-
tie en interpretatie via interactie (zoals
verschaling, verandering van perspec-
tief/rotatie, selectie/bevraging, doorbla-
deren, coördinaatcontrole) in de infor-
matieruimte te ondersteunen.
Visualisatie van Clusters
Een methode om de som te visualiseren
is de 'Unified Distance Matrix' of 'U-
matrix' methode [Ultsch, 1993]. Daar-
mee kan de structuur van de invoer-
ruimte van een 'self-organizing' map
worden gevisualiseerd en kan een indruk
worden verkregen van anders onzichtba-
re structuren in een multidimensionele
dataruimte. De gemiddelde afstand tus-
sen naburige vectoren wordt voorgesteld
door grijswaarden. Een clusterlandschap
gevormd over de som visualiseert dan de
classificatie. De U-matrix toont afstan-
den tussen naburige eenheden en visuali
seert zo de clusterstructuren van de
kaart. Höge waarden binnen de U-ma
trix betekenen een grote afstand tussen
naburige kaarteenheden, en duiden op
Figuur 3. Projecties in
twee- en driedimen-
sionale ruimten.
Ootrparsum
peÄneim
-2
Hotten
Marino
Gaor
Oldeazaal
Öopfie
:äPhplÄ»ftwijk
tfangelo
-je^t
^..Jertfooin*' Kar*en
We«Pselq.R^|e*
Haspelt
Genarnuiden
Staphorst
Ewolle
Aflrwelü
Enfotoede
10
12
Eichede
Diepenheim
Hi?ü3n
Markelo
fleriberg
lalfsefrSoergen
Qp^iHam
Vnezenveen
em9 'v^eserselo
12
10
ArristDelcJen
HSsselt a
Äisafelmuiden
*6 i jfph orst
Gerjemuiden
Rijssen
clustergrenzen. Clusters zijn uniforme gebieden met läge waar
den. Figuur 2 toont een voorbeeld.
Projecties
Een dataset kan 00k verkend worden met behulp van projec-
detechnieken met de som. In de visualisatie in figuur 3 is elke
kaarteenheid weergegeven door een punt (dat met zijn buren
verbonden kan worden door lijnen) in een projectie die de af-
standen tussen data-eenheden zo goed mogelijk bewaard. Deze
techniek gebruikt het sOM-grid en laat groepen van objecten
zien, elk met een unieke positie, kleur en vorm. De som kan
worden gevisualiseerd met vrij gekozen coördinaten, in een
2D- of 3D-ruimte. De gebruiker heeft een aantal visuele moge-
lijkheden ter beschikking: controle over de coördinaten van
elke eenheid (in 2D of 3D), type, kleur en grootte van het
symbool waarmee elke kaarteenheid wordt voorgesteld, en
type, kleur en dikte van de lijnen om de kaarteenheden te ver
binden.
Visualisatie van componentvlakken
Visualisatie van componentvlakken laat de waarden zien van
de prototype-vectoren van de kaarteenheden voor elke compo-
nent. Elk componentvlak toont de waarden van een variabele
met behulp van een kleurcodering. Dit geeft de mogelijkheid
om visueel elke cel (die overeenkomt met elke kaarteenheid of
data-eenheid) te onderzoeken. Elke cel in figuur 4c correspon-