Toekomst 2019-5 I Geo-Info 51 Rechts: U-net voorspellingen. De heatmap toont de voorspelde waarschijnlijkheid om onderdeel te zijn van een onderscheid tussen individuele gebouwen. Dit U-net model voorspelt voor elke pixel van het beeldmateriaal wat de waarschijn lijkheid is dat de pixel onderdeel is van een gebouw. Het model is getraind op data van Readar. De dataset bestaat uit 374 km2 10 cm resolutie luchtfoto van verschillende gebieden in Nederland gecombineerd met de bijbehorende geometrieën uit de BAG en BGT. De ruwe voorspellingen van het U-net model zijn rasterdata terwijl voor veel toepassingen en registraties vectordata gewenst is. Bij het omzetten van de ruwe voorspellingen (zie figuur 4) naar vectordata is het Douglas-Peucker algoritme toege past. Het Douglas-Peucker algoritme is een veelgebruikt algoritme om vectordata te versimpelen en zo het aantal punten die de gebouwcontouren beschrijven behapbaar te houden voor visualisatie en gebruik van de vectordata. Op de luchtfoto van een apart testge bied van 88 kirk werden in 40 minuten 84.700 gebouwen voorspeld door een eerste prototype van het U-net model. Hiermee- werd 95,1% van de 82.700 geometrieën uit de BAG en BGT gedetecteerd. Ook hier is duidelijk een correlatie waarneembaar tus sen de kans op detectie en het horizontale dakoppervlak van een gebouw. Waar het model slechts 82,1% van de gebouwen met een dakoppervlakte kleiner dan 15 mZ weet te detecteren, loopt dat percentage op tot boven de 99% voor gebouwen met een dak oppervlakte groter dan 50 mZ. Handmatige controle over het deel van de detecties die niet met de BAG of BGT overlappen, schetst een beeld dat ongeveer een derde van de nieuw gedetecteerde objecten daadwer kelijk een gebouw betreft. Deze gebouwen zijn dus wél zichtbaar op de luchtfoto, maar staan niet in de BAG of BGT geregistreerd. Opvallend was dat de daadwerkelijk foute voorspellingen voornamelijk gemaakt werden in ruraal en industrieel gebied, en de nieuw gedetecteerde gebouwen vooral schuurtjes en andere bijbouw in woonwijken betroffen. Een verklaring hiervoor is dat woonwijken vaak meer gebouwen bevatten dan een ruraal of industrieel gebied van ver gelijkbare grootte, en woonwijken hierdoor meer voorbeelden aanleveren tijdens het trainingsproces van het model. Ten opzichte van handmatig (bij)karteren, bieden mijn Machine Learning modellen uit 2018 voornamelijk significante schaal vergroting en snelheidswinst. Kwalitatief leveren deze modellen werk dat "slechts" vergelijkbaar is met dat van een onervaren, ongetrainde mapper. Ik durf echter te stellen dat het Machine Learning domein in de komende tijd nog grote stappen zal maken. Machine Learning wint vooral snel terrein bij diensten waar schaalgrootte, snelheid en kosten net zo belangrijk zijn als kwaliteit. Daarnaast levert Machine Learning ook steeds vaker een kwalitatief beter resultaat dan bestaande technieken voor geautoma tiseerde processen. Zelfs voor diensten waar kwaliteit voorop staat, kan Machine Learning ingezet worden om delen van het proces te automatiseren. Zo kan de inzet van dure mankracht worden gefocust op de moeilijke delen van het proces, een werkwijze die in de praktijk vaak een hogere kwaliteit ople vert dan een volledig handmatig proces. Al met al zal de manier waarop ruwe Remote Sensing data verwerkt wordt tot bruikbare geo-data de komende jaren drastisch veranderen. Niet alleen voor het (bij)karteringsproces heeft Machine Learning alweer ontwikkelingen doorgemaakt sinds ik mijn stage afgerond heb, maar ook voor andere diensten die in de procesketen tussen Remote Sensing en bruikbare geografische datasets in zitten. Zo worden diensten als objectinventarisatie, mutatiedetectie en het genereren van puntenwolken uit luchtfoto's bij Readar al grotendeels met Machine Learning methoden uitgevoerd. Ondanks deze lofzang aan het adres van Machine Learning is mij tijdens mijn stage ook duidelijk geworden dat Machine Lear ning de rol van de menselijke expert niet vol ledig zal overnemen. Net als mensen kunnen machines onzeker zijn van hun oordeel en is een second opinion noodzakelijk voor een kwalitatief hoogwaardig resultaat. Hierdoor is de keuze tussen mens en machine in veel gevallen een vals dilemma. Ik denk dat het meest realistische scenario voor de nabije toekomst er een is waarin we steeds vaker hybride processen zullen zien waar mens en machine moeten samenwerken. Bernard Bron mans MSc. is Mas ter s tuden t Analytics aan de Vrije Universiteit Amsterdam en bereikbaar via 4 L. bbronmans@gmail.com. Begeleiders/reviewers: Sven Briels is Founder CTO van Readar en bereikbaar via svenbriels@readar.com. Arjen Crince is Senior IM GIS Consultant 510 en bereikbaar via acrince@rodekruis.nl.

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2019 | | pagina 53