Een autorit met het systeem kan een puntenwolk opleveren van miljoenen tot miljarden punten 1 6 I Geo-Info I 2020-4 heid en snelheid. Het SSD-model werkt met zogenaamde bounding boxes (zie figuur 3). De bounding box bevat de locatie en klasse van het gevonden of te vinden object in een afbeelding. Bounding boxes worden gebruikt om het model te trainen, door het model te laten zien welke klasse en daarbij behorend object binnen de box bevindt. Het model gebruikt de bounding box ook om de output te genereren. De positie en klasse van het gevonden object worden door middel van een bounding box en daarbij behorend label als output gegenereerd. Om het SSD-model te kunnen trainen is data nodig, veel data. Deze data moet worden gesplitst in trainingsdata, om het model te kunnen laten leren en validatiedata, om te kunnen testen hoe goed het model is. Bij het trainen van het model wordt de validatiedata niet gebruikt. Datasets van oude en lopende inwinningsprojecten zijn gebruikt om het model te trainen en werden aangevuld waar nodig. Eén dataset is gebruikt als validatieset. Deze dataset was gekozen, omdat de set zeer divers was (alle klassen die we op dat moment wilden detecteren kwamen daarin voor) en bovendien vrij fors. Vervolgens is in meerdere iteraties het model ontwikkeld. Het model wordt op een eerste dataset getraind, en gevalideerd met de validatieset. Het beoordelen van het model wordt gedaan met Recall en Precision, door deze per klasse na elke iteratie te plotten kan worden vergeleken of het model beter gaat presteren (zie figuur 4 als voorbeeld). Precision is de verhouding van True Positives (de gevon den pijl is daadwerkelijk een pijl en is correct geclassificeerd) ten opzichte van het totaal aantal gevonden pijlen in een klasse. Recall is de verhouding van True Positives ten opzichte van het totaal aantal aanwezige pijlen in een klasse in de dataset. De rechtdoorpijl bleek het best gevonden te worden (met een Recall van 0.5). De grootste uitdaging bleek de onbalans in de dataset. In de dataset komt de rechtsafpijl vele malen vaker voor dan de linksafpijl. Daarmee wordt het model geleerd om vaker te kiezen voor de rechtsafpijl en heeft het model bij het herken nen van de linksafpijl sneller een hogere confidence threshold (mate van zekerheid voor het systeem) voor de rechtsafpijl. 1.0 0.9' C 0B- g U 0 7 0.6- 0.5 l 0.0 0.2 0.4 0.0 0.9 1.0 Recall De volgende stap was meer data toevoegen en het model weer valideren op de valida tieset. Uit de validatie bleek dat het model beter ging presteren. Dit was goed nieuws! Volgende stappen waren: steeds meer data toevoegen en het model verder optimalise ren. Bijvoorbeeld door de bounding boxes nog strakker om de pijlen heen te krijgen, zodat er bij het trainen minder ruis binnen de bounding box valt. Andere optimalisatie werd gerealiseerd door klassen (5 en 7,5 meter pijlen) zoveel mogelijk samen te voegen en na detectie afhankelijk van lengte uit elkaar te halen. Het model bleek voornamelijk halve pijlen lastig te kunnen classificeren. Uiteindelijk bleek het model succesvol de pij len te kunnen vinden. Voor ons is het nu zaak om dit model waar mogelijk uit te breiden en nog meer data toe te voegen om met het model uiteindelijk de pijlen optimaal te kun nen vinden. De kennis die we hierbij hebben opgedaan, gebruiken wij om detectiesoftware te ontwikkelen welke ook 3D-objecten uit de puntenwolk kan extraheren. Hier komt de derde dimensie om de hoek kijken waardoor dit een complexer vraagstuk is. Waar naar toe? Het gebruik van Data Science AI technieken binnen de geo-informatie is volop in ontwik keling. Er is gepoogd om je mee te nemen in de ontwikkeling van het herkennen van relatief eenvoudige objecten in een punten wolk. Om de razendsnelle ontwikkelingen van zelflerende algoritmes bij te kunnen houden en te kunnen gebruiken, is kennis nodig. Kennis binnen organisaties neemt toe en daarmee zullen nieuwe manieren worden ontwikkeld om de puntenwolken te kunnen gebruiken. Denk hierbij aan mutatiesigna lering, snellere en nauwkeurigere manieren om features uit de puntenwolken te halen/ identificeren. De toepassingen van hoogwaar dige puntenwolken nemen toe. Innovatie in andere sectoren kunnen ook innovaties in de geo-informatiesector vooruitduwen. Het is dus belangrijk om een brede blik te houden en waar mogelijk het blikveld ook buiten de eigen sector te richten. Uiteindelijk gaan ont wikkelingen niet zonder slag of stoot, hiervoor is veel doorzettingsvermogen, investering (in kennis en data) en/of samenwerking nodig. Figuur 4 - Precision vs Recall. Jelle Pot (Msc) is specialist bij Geomaat Groningen. Jelle is bereikbaar via jelle.pot@geomaat.nl.

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2020 | | pagina 8