Wat kan Linked Data bete
Nu de eerste Basisregistratie
Grootschalige Topografie (BGT)-
data beschikbaar is, wordt er al
nagedacht over de volgende
stappen. Bijvoorbeeld over het
beschikbaar stellen van BGT data
op zo'n manier dat zo veel mogelijk
soorten gebruikers er gebruik van
kunnen maken. Door het Platform
Linked Data Nederland was de
stuurgroep IMGeo al eens ingelicht
over de beloften van Linked Data.
Daardoor geprikkeld vroeg het
ministerie van Infrastructuur en
Milieu aan Geonovum om dit
eens proefondervindelijk te gaan
ervaren. Één van de conclusies was
dat er in Leiden bedrijven zijn die
gevestigd zijn op in de BAG niet
voorkomende adressen.
f BGTPand\
BAG Pand
V 84324 J
sameAs
V 0934 J
subject
predicate
object
10 I Geo-Info I 2015-3
Door Linda van den Brink
Linked Data is een webtechnologie die al
lang bestaat, maar de laatste jaren een grote
vlucht heeft genomen. De basisgedachte
van Linked Data is dat niet alleen documen
ten, maar ook data-objecten op het web
gepubliceerd worden. Dit gebeurt op een
semantisch rijke manier: de betekenis van
de objecten en hun gegevens worden op
een gestandaardiseerde manier uitgedrukt,
zodat zowel mensen als machines kunnen
begrijpen waar de data over gaat. Deze
data-objecten krijgen bovendien ieder een
URL, een vast adres op het internet. Dit zorgt
ervoor dat we niet langer datasets aan elkaar
hoeven te knopen met ingewikkelde kop-
pelvlakken.
In plaats daarvan worden de data-objecten
individueel aan elkaar gekoppeld door sim
pelweg naar de URL van een object te linken.
Via deze links kom je weer op het spoor van
andere data en links, net zoals de oneindige
reeks aan informatie die beschikbaar komt
bij het klikken op URL's in webpagina's. Het
gaat hierbij niet alleen om het klikken op
links door mensen, maar om het automatisch
linken via URL's op het Internet door mens én
machines. De objecten in de basisregistraties:
Adressen, Panden, Bedrijven, etc. blijken
essentiële en zeer gewilde bouwstenen in
het Semantisch Web dat zo ontstaat.
Linked Data heeft in beginsel een heel
eenvoudige structuur, die is vastgelegd in de
internationale standaard Resource Descrip
tion Framework (RDF). De informatie wordt
vastgelegd in kleine brokjes of statements.
Elk statement bevat een subject (onderwerp),
een predicaat, en een object. Het geheel van
deze drie onderdelen noemt men een triple.
Het predicaat legt de relatie tussen subject
en object. Het object kan een numerieke of
tekstuele waarde bevatten, en het object kan
zelf ook een subject zijn in andere triples.
Figuur 1 geeft eenvoudig voorbeeld, waarin
het statement uitdrukt dat een bepaald BGT-
pand hetzelfde object is als een BAG-pand
met een bepaald nummer.
Inmiddels ontstaan op het internet steeds
meer verzamelingen met gegevens die op
deze manier met elkaar verweven zijn. Er zijn
encyclopedische verzamelingen met data
over van alles en nog wat, zoals DBpedia,
maar ook veel domeinspecifieke verzamelin
gen zoals data over biologie of statistische
data en overheidsdata zoals die van de Britse
overheid. Ook is er geografische data zoals
die van de Britse Ordnance Survey of de
Linked Data versie van OpenStreetMap.
Community
Rondom Linked Data is er een actieve en
brede community: het Platform Linked Data
Nederland. Daar wordt kennis en ervaring
gedeeld rond het maken, beheren en
toepassen van Linked (Open) Data. Door de
(technisch) inhoudelijke kennis in te zetten
.-■■■V'-ïBS.:
Figuur 1 - Voorbeeld van een 'triple'.