■4* Classificatie Invoeren van trainingsdata KARTOGRAFISCH TIJDSCHRIFT I995-XXI-4 Vervolgens heeft elke groep gedurende een avond de gelegenheid om ii.wis- beeldverwerkingssoftware te gebruiken om de verzamelde trainingspixels in te voeren. Dit blijkt een tijdrovend pro- ces te zijn, met vrij veel kans op fou- ten. Een van de factoren die dit ver- oorzaakt is het aanzienlijke kleurver- schil tussen het gedrukte satellietbeeld en het beeld op het computerscherm. Hierdoor is het terugvinden van op het papieren exemplaar aangetekende pixels op de monitor een heuse speur- tocht. Een veelbelovende manier om het hele proces van verzamelen en invoeren van trainingsgegevens te vergemakkelijken, is het inzetten van een 'Global Positio- ning System' (gps). Door gebruik te maken van eenvoudige code-ontvan- gers en een vast basisstation is het mo- gelijk de locatie van elk trainingsge- bied voldoende nauwkeurig op te nemen en tegelijkertijd attribuutgege- vens toe te voegen, zoals landbedek- kingsklasse, perceelsgrootte en kwali- teitsinformatie. Gedurende het veld- werk in 1995 is hiermee geexperimen- teerd en de resultaten zijn veelbelo- vend (figuur 5). Figuur 4. Verzamelen van trainingsdata. Figuur 6. Resultaat van een maximum likeli- hood classificatie. Na het invoeren van de trainingsgebieden wordt ilwis ge- bruikt om landbedekkingsclassificaties te maken. Deze clas- sihcaties worden toegepast op het hele gebied, zoals in fi guur 2b te zien is. Er worden twee verschillende methoden gebruikt om de Studenten te confronteren met de aanzien lijke verschillen tussen de resulterende landbedekkingsclas sificaties (waarover meer in de volgende paragraaf). Dit toont hen het belang en de consequenties van het bewust kiezen van classificatiemethoden en de parameters daarvan. Er is gekozen voor twee van de meest gebruikte methoden: 'K-Nearest Neighbour' en 'Maximum Likelihood' classifica tie. Het zou het beste zijn als de Studenten konden experi- menteren met de parameters van de classificaties, om zo de resultaten te vergelijken en de meest geschikte uit te kiezen. Maar dat zou vergelijking van de resultaten van verschillen de groepen onmogelijk maken en bovendien te veel tijd kosten; tijd die er, gezien de körte duur van het veldwerk (tien dagen feitelijke werktijd) niet is. Vandaar dat er een vaste set parameters, die door de staf is vastgesteld, door alle groepen gebruikt wordt. Omdat elke groep wel andere trai ningsdata gebruikt heeft, verschillen de resulterende land bedekkingsclassificaties toch aanzienlijk. In deze fase merken de Studenten het volgende op: Het gebied waar de trainingsdata verzameld zijn, is van grote invloed op het resultaat. De meeste groepen hebben wel een paar klassen waarvoor ze geen enkel trainingsge- bied gevonden hebben. Daardoor zullen er in de gebieden waar zo'n klasse wel voorkomt relatief veel pixels ongeclas- sificeerd blijven. Een goed voorbeeld hiervan wordt ge- vormd door de groepen die in de centrale vallei, dicht bij de rivier, gewerkt hebben en daar vrijwel geen garrigue konden vinden. Hun classificatie zal op de heuvels van de Luberon, die vrijwel geheel met deze garrigue begroeid zijn, veel 'witte plekken' bevatten. De k—Nearest Neighbour classificatiemethode geeft vaak veel meer ongeclassißceerde pixels dan de Maximum Li kelihood methode. De meeste Studenten concluderen daaruit in dit Stadium van de oefening dat de laatste me thode daarom 'beter' is. Dat dit een voorbarige conclusie is, wordt in de volgende fase - die van de analyse - duide- lijk (ßguur 6). Figuur j. Invoeren van de trainingsgebieden. II

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Kartografisch Tijdschrift | 1995 | | pagina 17