■4*
Classificatie
Invoeren
van trainingsdata
KARTOGRAFISCH TIJDSCHRIFT
I995-XXI-4
Vervolgens heeft elke groep gedurende
een avond de gelegenheid om ii.wis-
beeldverwerkingssoftware te gebruiken
om de verzamelde trainingspixels in te
voeren. Dit blijkt een tijdrovend pro-
ces te zijn, met vrij veel kans op fou-
ten. Een van de factoren die dit ver-
oorzaakt is het aanzienlijke kleurver-
schil tussen het gedrukte satellietbeeld
en het beeld op het computerscherm.
Hierdoor is het terugvinden van op
het papieren exemplaar aangetekende
pixels op de monitor een heuse speur-
tocht.
Een veelbelovende manier om het hele
proces van verzamelen en invoeren van
trainingsgegevens te vergemakkelijken,
is het inzetten van een 'Global Positio-
ning System' (gps). Door gebruik te
maken van eenvoudige code-ontvan-
gers en een vast basisstation is het mo-
gelijk de locatie van elk trainingsge-
bied voldoende nauwkeurig op te
nemen en tegelijkertijd attribuutgege-
vens toe te voegen, zoals landbedek-
kingsklasse, perceelsgrootte en kwali-
teitsinformatie. Gedurende het veld-
werk in 1995 is hiermee geexperimen-
teerd en de resultaten zijn veelbelo-
vend (figuur 5).
Figuur 4.
Verzamelen van
trainingsdata.
Figuur 6.
Resultaat van een
maximum likeli-
hood classificatie.
Na het invoeren van de trainingsgebieden wordt ilwis ge-
bruikt om landbedekkingsclassificaties te maken. Deze clas-
sihcaties worden toegepast op het hele gebied, zoals in fi
guur 2b te zien is. Er worden twee verschillende methoden
gebruikt om de Studenten te confronteren met de aanzien
lijke verschillen tussen de resulterende landbedekkingsclas
sificaties (waarover meer in de volgende paragraaf). Dit
toont hen het belang en de consequenties van het bewust
kiezen van classificatiemethoden en de parameters daarvan.
Er is gekozen voor twee van de meest gebruikte methoden:
'K-Nearest Neighbour' en 'Maximum Likelihood' classifica
tie. Het zou het beste zijn als de Studenten konden experi-
menteren met de parameters van de classificaties, om zo de
resultaten te vergelijken en de meest geschikte uit te kiezen.
Maar dat zou vergelijking van de resultaten van verschillen
de groepen onmogelijk maken en bovendien te veel tijd
kosten; tijd die er, gezien de körte duur van het veldwerk
(tien dagen feitelijke werktijd) niet is. Vandaar dat er een
vaste set parameters, die door de staf is vastgesteld, door alle
groepen gebruikt wordt. Omdat elke groep wel andere trai
ningsdata gebruikt heeft, verschillen de resulterende land
bedekkingsclassificaties toch aanzienlijk.
In deze fase merken de Studenten het volgende op:
Het gebied waar de trainingsdata verzameld zijn, is van
grote invloed op het resultaat. De meeste groepen hebben
wel een paar klassen waarvoor ze geen enkel trainingsge-
bied gevonden hebben. Daardoor zullen er in de gebieden
waar zo'n klasse wel voorkomt relatief veel pixels ongeclas-
sificeerd blijven. Een goed voorbeeld hiervan wordt ge-
vormd door de groepen die in de centrale vallei, dicht bij
de rivier, gewerkt hebben en daar vrijwel geen garrigue
konden vinden. Hun classificatie zal op de heuvels van de
Luberon, die vrijwel geheel met deze garrigue begroeid
zijn, veel 'witte plekken' bevatten.
De k—Nearest Neighbour classificatiemethode geeft vaak
veel meer ongeclassißceerde pixels dan de Maximum Li
kelihood methode. De meeste Studenten concluderen
daaruit in dit Stadium van de oefening dat de laatste me
thode daarom 'beter' is. Dat dit een voorbarige conclusie
is, wordt in de volgende fase - die van de analyse - duide-
lijk (ßguur 6).
Figuur j.
Invoeren van de
trainingsgebieden.
II