Geodata op het web voor
Promotie-onderzoek
Geonovum is al jaren bezig
met het op orde krijgen van de
Nederlandse SDI. Bijvoorbeeld
door het maken van geo-
standaarden. Ook ik werk
bij Geonovum aan diverse
vraagstukken, altijd met breed
hergebruik van geo-informatie als
uiteindelijk doel. Door over zulke
vraagstukken, en de bijbehorende
oplossingen, zo nu en dan te
publiceren in wetenschappelijke
tijdschriften, en deze publicaties
vervolgens te bundelen, kon ik
onlangs op dit werk promoveren.
36
Geo-Info I 2019-1
Door Linda van de Brink
Het is een uitdaging om van een proefschrift,
dat gebaseerd is op losse artikelen, een samen
hangend geheel te maken. Maar uiteindelijk
gaat het natuurlijk allemaal, daar het gebaseerd
is op mijn werk bij Geonovum, over het toegan
kelijk maken van geo-informatie.
We zien vaak dat geo-informatie, eenmaal
geproduceerd, meerwaarde heeft voor anderen
dan de oorspronkelijke producent, maar dat
hergebruik verhinderd wordt door allerlei prak
tische zaken. Hoe kan een potentiële gebruiker
er bijvoorbeeld achter komen dat een dataset
bestaat? Hoe gemakkelijk kan iemand, eenmaal
een dataset gevonden te hebben, bij de data
zelf? Is die data dan ook te openen en te begrij
pen? En is er duidelijkheid over de gebruiksvoor
waarden en kwaliteit van de dataset?
Binnen het geo-domein is het algemeen
bekend dat interoperabiliteit tussen systemen
noodzakelijk is om hergebruik van data mogelijk
te maken en dat standaarden voor deze inter
operabiliteit kunnen zorgen. Hiervan uitgaande
heb ik een aantal verschillende probleemge
bieden onderzocht, waar er potentieel was om
geo-informatie te hergebruiken, maar op de een
of andere manier werd verhinderd. Het onder
zoek was exploratief van aard: de methodologie
was een combinatie van bureaustudie, analyse,
literatuurstudie en experimenten.
Een nationale 3D standaard
Eén van die probleemgebieden was 3D-data.
Hergebruik hiervan werd verhinderd door het
ontbreken van een standaard voor 3D-geodata
in Nederland. Zo'n standaard zijn we, als
onderdeel van een grote, meerjarige 3D-pilot,
gaan maken. Het uitgangspunt was het Infor
matiemodel Geografie (IMGeo), rond 2012 nog
in ontwikkeling als nationale standaard voor
2D geografische, topografische data aan de
ene kant, en een internationale 3D-standaard,
CityGML, aan de andere kant. Beide standaarden
beschrijven topografische objecten die fysieke
objecten uit de werkelijkheid representeren en
leken daarom inhoudelijk veel op elkaar.
De inhoud van IMGeo moest nog wel met
CityGML worden afgestemd, maar de grootste
uitdaging zat uiteindelijk in de informatie-modelle
ring: hoe de klassen, eigenschappen en codelijsten
uit IMGeo als een formele uitbreiding op CityGML
konden worden gedefinieerd. De CityGML-stan-
daard schrijft voor hoe de standaard moet worden
uitgebreid, maar doet dit op het niveau van XML-
schema's. Onze extensie moest echter met Unified
Modeling Language (UML) beschreven worden,
omdat IMGeo daarin was gedefinieerd. Het was
echter nog niet duidelijk hoe je dat met UML zou
moeten doen. Na een uitgebreide analyse en in
overleg met de internationale CityGML-commu-
nity heb ik hier een methode voor gedefinieerd,
die als OGC Best Practice is gepubliceerd.
Semantische harmonisatie
In het geval van IMGeo en CityGML was de
semantische harmonisatie, dat wil zeggen het
afstemmen van de inhoud van beide standaarden,
relatief eenvoudig. Beide standaarden beschrijven
dezelfde soorten dingen; daardoor zijn de meeste
klassen uit IMGeo op te vatten als hetzelfde of
als een meer specifieke variant van een klasse
in CityGML. Maar meestal is dat niet zo gemak
kelijk. Domein-specifieke informatiemodellen,
die onafhankelijk van elkaar ontwikkeld zijn,
overlappen vaak wel met elkaar, maar modelleren
de inhoud te verschillend om hergebruik van
data conform deze informatiemodellen mogelijk
te maken. Hetzelfde woord wordt bijvoorbeeld
voor verschillende betekenissen gebruikt, of juist
verschillende woorden voor hetzelfde. Die taal-
botsingen hinderen het hergebruik van data over
domeinen heen. Ingewikkelder zijn de gevallen
waarbij twee informatiemodellen wel hetzelfde
begrip modelleren, maar de mate van detail of de
afbakening verschillend is.
Ook deze problematiek heb ik onderzocht. Ver
schillende Nederlandse geo-informatiemodellen
zijn onder de loep genomen om de overlap te
vinden. Vooral die gevallen waar er potentieel
voor hergebruik was en werkprocessen efficiënter
konden worden als de informatiemodellen gehar
moniseerd werden. De oplossing combineerde
menselijke interactie met computerondersteunde
analyse. Domeinexperts konden, met behulp van
tooling, de overlap tussen de vele concepten in
informatiemodellen opsporen. Het onderzoek
bevestigde dat semantische harmonisatie
verbetert als informatiemodellen in samenwerking
tussen domeinen ontwikkeld worden. Dit gebeurt
gelukkig tegenwoordig meer en meer, maar in de
praktijk ten tijde van het onderzoek werd het door
gaans niet gedaan. Voor een groot deel lag dit aan
de slechte vindbaarheid en toegankelijkheid van
bestaande domeinmodellen. Het Geoconcepten-
register [1] van Geonovum, ontwikkeld in het kader
van dit onderzoek, kan deze situatie verbeteren.
Linked geodata
Breder hergebruik betekent ook: buiten de
geo-sector. Gebruikers van buiten het geo-