Een autorit met het
systeem kan een
puntenwolk opleveren
van miljoenen tot
miljarden punten
1
6 I
Geo-Info I 2020-4
heid en snelheid. Het SSD-model werkt met
zogenaamde bounding boxes (zie figuur 3).
De bounding box bevat de locatie en klasse
van het gevonden of te vinden object in een
afbeelding. Bounding boxes worden gebruikt
om het model te trainen, door het model te
laten zien welke klasse en daarbij behorend
object binnen de box bevindt. Het model
gebruikt de bounding box ook om de output
te genereren. De positie en klasse van het
gevonden object worden door middel van
een bounding box en daarbij behorend label
als output gegenereerd.
Om het SSD-model te kunnen trainen is data
nodig, veel data. Deze data moet worden
gesplitst in trainingsdata, om het model te
kunnen laten leren en validatiedata, om te
kunnen testen hoe goed het model is. Bij het
trainen van het model wordt de validatiedata
niet gebruikt. Datasets van oude en lopende
inwinningsprojecten zijn gebruikt om het
model te trainen en werden aangevuld waar
nodig. Eén dataset is gebruikt als validatieset.
Deze dataset was gekozen, omdat de set zeer
divers was (alle klassen die we op dat moment
wilden detecteren kwamen daarin voor) en
bovendien vrij fors.
Vervolgens is in meerdere iteraties het model
ontwikkeld. Het model wordt op een eerste
dataset getraind, en gevalideerd met de
validatieset. Het beoordelen van het model
wordt gedaan met Recall en Precision, door
deze per klasse na elke iteratie te plotten kan
worden vergeleken of het model beter gaat
presteren (zie figuur 4 als voorbeeld). Precision
is de verhouding van True Positives (de gevon
den pijl is daadwerkelijk een pijl en is correct
geclassificeerd) ten opzichte van het totaal
aantal gevonden pijlen in een klasse. Recall is
de verhouding van True Positives ten opzichte
van het totaal aantal aanwezige pijlen in een
klasse in de dataset.
De rechtdoorpijl bleek het best gevonden te
worden (met een Recall van 0.5). De grootste
uitdaging bleek de onbalans in de dataset.
In de dataset komt de rechtsafpijl vele malen
vaker voor dan de linksafpijl. Daarmee wordt
het model geleerd om vaker te kiezen voor de
rechtsafpijl en heeft het model bij het herken
nen van de linksafpijl sneller een hogere
confidence threshold (mate van zekerheid
voor het systeem) voor de rechtsafpijl.
1.0
0.9'
C 0B-
g
U
0 7
0.6-
0.5
l
0.0 0.2 0.4 0.0 0.9
1.0
Recall
De volgende stap was meer data toevoegen
en het model weer valideren op de valida
tieset. Uit de validatie bleek dat het model
beter ging presteren. Dit was goed nieuws!
Volgende stappen waren: steeds meer data
toevoegen en het model verder optimalise
ren. Bijvoorbeeld door de bounding boxes
nog strakker om de pijlen heen te krijgen,
zodat er bij het trainen minder ruis binnen
de bounding box valt. Andere optimalisatie
werd gerealiseerd door klassen (5 en 7,5 meter
pijlen) zoveel mogelijk samen te voegen en
na detectie afhankelijk van lengte uit elkaar
te halen. Het model bleek voornamelijk halve
pijlen lastig te kunnen classificeren.
Uiteindelijk bleek het model succesvol de pij
len te kunnen vinden. Voor ons is het nu zaak
om dit model waar mogelijk uit te breiden
en nog meer data toe te voegen om met het
model uiteindelijk de pijlen optimaal te kun
nen vinden. De kennis die we hierbij hebben
opgedaan, gebruiken wij om detectiesoftware
te ontwikkelen welke ook 3D-objecten uit
de puntenwolk kan extraheren. Hier komt de
derde dimensie om de hoek kijken waardoor
dit een complexer vraagstuk is.
Waar naar toe?
Het gebruik van Data Science AI technieken
binnen de geo-informatie is volop in ontwik
keling. Er is gepoogd om je mee te nemen
in de ontwikkeling van het herkennen van
relatief eenvoudige objecten in een punten
wolk. Om de razendsnelle ontwikkelingen
van zelflerende algoritmes bij te kunnen
houden en te kunnen gebruiken, is kennis
nodig. Kennis binnen organisaties neemt toe
en daarmee zullen nieuwe manieren worden
ontwikkeld om de puntenwolken te kunnen
gebruiken. Denk hierbij aan mutatiesigna
lering, snellere en nauwkeurigere manieren
om features uit de puntenwolken te halen/
identificeren. De toepassingen van hoogwaar
dige puntenwolken nemen toe. Innovatie in
andere sectoren kunnen ook innovaties in de
geo-informatiesector vooruitduwen. Het is
dus belangrijk om een brede blik te houden
en waar mogelijk het blikveld ook buiten de
eigen sector te richten. Uiteindelijk gaan ont
wikkelingen niet zonder slag of stoot, hiervoor
is veel doorzettingsvermogen, investering (in
kennis en data) en/of samenwerking nodig.
Figuur 4 - Precision vs Recall.
Jelle Pot (Msc) is specialist bij
Geomaat Groningen.
Jelle is bereikbaar via
jelle.pot@geomaat.nl.