Toekomst
2019-5 I Geo-Info
51
Rechts: U-net voorspellingen. De heatmap toont de voorspelde waarschijnlijkheid om onderdeel te zijn van een
onderscheid tussen individuele gebouwen.
Dit U-net model voorspelt voor elke pixel
van het beeldmateriaal wat de waarschijn
lijkheid is dat de pixel onderdeel is van een
gebouw. Het model is getraind op data
van Readar. De dataset bestaat uit 374 km2
10 cm resolutie luchtfoto van verschillende
gebieden in Nederland gecombineerd met
de bijbehorende geometrieën uit de BAG
en BGT. De ruwe voorspellingen van het
U-net model zijn rasterdata terwijl voor veel
toepassingen en registraties vectordata
gewenst is. Bij het omzetten van de ruwe
voorspellingen (zie figuur 4) naar vectordata
is het Douglas-Peucker algoritme toege
past. Het Douglas-Peucker algoritme is een
veelgebruikt algoritme om vectordata te
versimpelen en zo het aantal punten die de
gebouwcontouren beschrijven behapbaar te
houden voor visualisatie en gebruik van de
vectordata.
Op de luchtfoto van een apart testge
bied van 88 kirk werden in 40 minuten
84.700 gebouwen voorspeld door een eerste
prototype van het U-net model. Hiermee-
werd 95,1% van de 82.700 geometrieën uit
de BAG en BGT gedetecteerd. Ook hier is
duidelijk een correlatie waarneembaar tus
sen de kans op detectie en het horizontale
dakoppervlak van een gebouw. Waar het
model slechts 82,1% van de gebouwen met
een dakoppervlakte kleiner dan 15 mZ weet
te detecteren, loopt dat percentage op tot
boven de 99% voor gebouwen met een dak
oppervlakte groter dan 50 mZ. Handmatige
controle over het deel van de detecties die
niet met de BAG of BGT overlappen, schetst
een beeld dat ongeveer een derde van de
nieuw gedetecteerde objecten daadwer
kelijk een gebouw betreft. Deze gebouwen
zijn dus wél zichtbaar op de luchtfoto, maar
staan niet in de BAG of BGT geregistreerd.
Opvallend was dat de daadwerkelijk foute
voorspellingen voornamelijk gemaakt
werden in ruraal en industrieel gebied, en
de nieuw gedetecteerde gebouwen vooral
schuurtjes en andere bijbouw in woonwijken
betroffen. Een verklaring hiervoor is dat
woonwijken vaak meer gebouwen bevatten
dan een ruraal of industrieel gebied van ver
gelijkbare grootte, en woonwijken hierdoor
meer voorbeelden aanleveren tijdens het
trainingsproces van het model.
Ten opzichte van handmatig (bij)karteren,
bieden mijn Machine Learning modellen
uit 2018 voornamelijk significante schaal
vergroting en snelheidswinst. Kwalitatief
leveren deze modellen werk dat "slechts"
vergelijkbaar is met dat van een onervaren,
ongetrainde mapper. Ik durf echter te stellen
dat het Machine Learning domein in de
komende tijd nog grote stappen zal maken.
Machine Learning wint vooral snel terrein
bij diensten waar schaalgrootte, snelheid
en kosten net zo belangrijk zijn als kwaliteit.
Daarnaast levert Machine Learning ook
steeds vaker een kwalitatief beter resultaat
dan bestaande technieken voor geautoma
tiseerde processen. Zelfs voor diensten waar
kwaliteit voorop staat, kan Machine Learning
ingezet worden om delen van het proces
te automatiseren. Zo kan de inzet van dure
mankracht worden gefocust op de moeilijke
delen van het proces, een werkwijze die in
de praktijk vaak een hogere kwaliteit ople
vert dan een volledig handmatig proces.
Al met al zal de manier waarop ruwe
Remote Sensing data verwerkt wordt tot
bruikbare geo-data de komende jaren
drastisch veranderen. Niet alleen voor het
(bij)karteringsproces heeft Machine Learning
alweer ontwikkelingen doorgemaakt sinds
ik mijn stage afgerond heb, maar ook voor
andere diensten die in de procesketen tussen
Remote Sensing en bruikbare geografische
datasets in zitten. Zo worden diensten als
objectinventarisatie, mutatiedetectie en het
genereren van puntenwolken uit luchtfoto's
bij Readar al grotendeels met Machine
Learning methoden uitgevoerd.
Ondanks deze lofzang aan het adres van
Machine Learning is mij tijdens mijn stage
ook duidelijk geworden dat Machine Lear
ning de rol van de menselijke expert niet vol
ledig zal overnemen. Net als mensen kunnen
machines onzeker zijn van hun oordeel en is
een second opinion noodzakelijk voor een
kwalitatief hoogwaardig resultaat. Hierdoor
is de keuze tussen mens en machine in veel
gevallen een vals dilemma. Ik denk dat het
meest realistische scenario voor de nabije
toekomst er een is waarin we steeds vaker
hybride processen zullen zien waar mens en
machine moeten samenwerken.
Bernard Bron mans MSc.
is Mas ter s tuden t Analytics aan
de Vrije Universiteit Amsterdam
en bereikbaar via
4 L. bbronmans@gmail.com.
Begeleiders/reviewers:
Sven Briels is Founder CTO van Readar en
bereikbaar via svenbriels@readar.com.
Arjen Crince is Senior IM GIS Consultant 510 en
bereikbaar via acrince@rodekruis.nl.