Uitvoeren van de tests Nadat de specificaties voor automatische generalisatie waren vastgesteld, zijn de tests uitgevoerd. Voor elk systeem is de commerciële versie beschikbaar in juni 2007 door drie to vier verschillende testers getest op alle vier testcases, waarbij de tester heeft geprobeerd alle gedefinieerde condities van een testcase te vertalen in de verschil lende systemen. Hierbij mocht de tester alleen gebruik maken van functionaliteit die in het systeem aanwezig was. De tests zijn uitgevoerd door generalisatie-experts die zowel bekend als nieuw waren met de systemen. De gemiddelde tijdsinspan ning van een test was ongeveer 1 week. Naast het testen van de juni-2007 versies, konden de softwareleveranciers parallelle tests uitvoeren tot zomer 2008 waarbij zij gebruik mochten maken van zowel zeifont- wikkelde extensies als ontwikkelingen ten opzichte van juni 2007. In totaal resulteerde de tests in 35 outputs (27 gegeneraliseerd door leden van het projectteam en 8 door de softwareleveranciers) en in meer dan 700 thematische lagen. b. Evalueren van gegeneraliseerde output Kartografische generalisatie bevat een bepaalde mate van subjectiviteit Distribution of building area size 1:50k deze dataset meer thematische lagen bevat (zie tabel i). Er zijn bijvoorbeeld meerdere soortgelijke condities gede finieerd voor verschillende wegtypen gerepresenteerd in meerdere lagen. In de tweede plaats valt op dat in alle testcases de meeste condities gedefinieerd zijn voor geïsoleerde objecten en de minste voor groepen van objecten. Zeer waarschijnlijk omdat het definiëren van condities voor twee en voor groepen objecten veel complexer is. Een derde opvallend aspect is dat condities voor minimale dimensies van objecten domineren in alle vier testcases, evenals condities voor gebouwen, wegen en landgebruik. De redenen hiervoor zouden kunnen zijn dat er al veel bekend is over het automatisch generaliseren van dit soort condities en dat deze objecten het meest voorkomen op kaarten en ook het meest significant zijn voor kaartgebruikers waardoor (interactieve) generalisatie het meest op dergelijke objecten plaatsvindt. Na het testen, was de volgende uitdaging het evalueren van de gegeneraliseerde output (zie figuur 1 voor enkele voorbeel den van output). Idealiter zou de evaluatie volledig automatisch moeten gebeuren om zoveel mogelijk subjectiviteit uit te sluiten. Er waren echter drie redenen waarom we ons in dit project niet beperkt hebben tot automatische evaluatie. Ten eerste, kartografische generalisatie bevat een bepaalde mate van subjecti viteit. Vaak zijn er meerdere oplossingen mogelijk die moeilijk kwantitatief met elkaar te vergelijken zijn. Ten tweede, niet alle condities waren voldoende formeel te beschrijven, bijvoorbeeld de conditie dat'gebouwen hun kenmerkende vorm moeten behouden'is moeilijk automatisch te evalueren. Tenslotte is automatische evaluatie (nog) niet geschikt om condities ten opzichte van andere condities te evalueren, soms is het bijvoorbeeld gewenst om een kleine afwijking van de minimale grootte van een gebouw toe te staan om de minimale afstand tussen twee gebou wen te kunnen behouden. In dit project is daarom gekozen om de output vanuit drie benaderingen te evalu eren, waardoor het mogelijk is de resul taten van de ene benadering te valideren c.q. te ontkrachten met de resultaten van de andere benadering. De drie benade ringen zijn: 1) automatische evaluatie van een select aantal (voldoende formele) condities, 2) een evaluatie waarbij outputs van één bepaalde testcase visueel met elkaar en met de gedefinieerde condities zijn vergeleken, en 3) expertevaluatie waarbij kartografische experts de outputs in detail hebben beoordeeld. Voor de automatische evaluatie is een prototype ontwikkeld door de Universiteit van Zürich dat berekent in hoeverre wordt voldaan aan de volgende condities: mini male omvang van gebouwen, minimale afstand tussen gebouwen en minimale afstand tussen wegen en gebouwen. Om meer inzicht te krijgen in de uitkom sten van deze evaluatie is het prototype eerst toegepast op interactief gegenerali seerde data schaal 1:50.000 van het Kadas ter. Deze test bevestigde dat veel situaties die als'slecht'worden beoordeeld door de computer, niet altijd slechte generalisatie oplossingen hoeven zijn. Ten eerste omdat de parameters uit handleidingen komen voor kartografen. Deze zijn bedoeld als richtlijn voor menselijke interpre tatie maar worden in het automatische proces gebruikt als harde waarde. Zo waren bijvoorbeeld veel gebouwen die als'te klein'werden gedetecteerd slechts minimaal kleiner dan het gedefinieerde minimum (zie figuur 3). Blijkbaar leveren deze te kleine' gebouwen nog steeds een acceptabele oplossing. Een tweede reden waarom acceptabele oplossingen soms als'slecht' worden beoordeeld door automatische evaluatie is dat de geformaliseerde con dities niet voldoende rekening houden met alle situaties die zouden kunnen voorkomen, zoals aangegeven in figuur 2. Ook kan het omgekeerde gelden: goed beoordeelde situaties hoeven niet altijd goede oplossingen te zijn. Bijvoorbeeld: alle gebouwen voldoen aan de 'minimale 6000 5000 <0 4000 S3 5 3000 CO Min area size threshold 200 400 479 600 800 1000 1200 1400 1600 Building objects ordered by area size Fig. 3. Resultaat van evaluatie van de grootte van interactief gegeneraliseerde gebouwen in Kadaster 1:50.000 dataset. Een groot aantal 'te kleine gebouwen' is net iets kleiner dan de drempelwaarde. Geo-lnfo 2010-2 21

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2010 | | pagina 23