ih
x i=ipi: n j"1
'X* -
C 'M? -
n v - v
'W lb 9-
Vyr
r?:«
w..t n lm
12
Geo-Info I 2015-3
<F WQZ< Wciarde van C 5QD.DM - en C 1,000.000
If '"l
£v
*7
J»
1
CMftMr-
r P PL LI -1
h{ T*wb n«f cgnd nr#jV.N
T-MHÖH Jfillffi HWl! Ifljll hs-J.Pt igcticJHy fv QiulKhi
Tutafccn» JuG'ft vvifiul moSil# UfKfnvfliCitifi^l tubü«Swi«
eutmk cj?i*ni iav. B-i s«-dl n fenn, Cwifir, hi ivOfuni-i
m»i«je HK, UHTS Pit lTt<baft«l ëriutü n«hiwl>a In
Edr«*. tfli lift*«4 Mil. ftiirtd itffr, Pd US. W&fi
lilWiifau T*i« LWtipjnT halt Ppdfel ItfeKfel in niuiA
optttion In be(h f«nv*l fend (Htim Europt. TTvt tampm»
Kas flnar-ori rijk.« «n i^iAtte upetaturt in both OadiaJ an J
EMim Ei,™ ïfct T-*tafafl# ÈrPd a prwmt In 13
Eurcptjn coianbta - MJririi, Croatia. Ciech tepufc&L
deiTnar f.. Hun any, fctpufci: d Hidaöan4ar Hdtilriragro, llli
NetfieiUrcb, J^andL Pon- aria, ikrvatii, and the United
Mlnpdora, m nfl ai the United SMtet, R,«tn F ten. ind til*
U.S. tirgfci Irian dr. GkCudy, T Hobflr Ir-Trrr alien ji
uibtkLnin htwi a asm bén ad fatal d ipprarim Italy 330
raifen sLbscribco-, and wl h-aw a total of ISO rraUon tr« th
and d 2014. T-HafcJ# JrvtMiuNkxiaJ It tha woriifi flhwnth
Urtwsï rn-si phcr s kt.ki pravWtr by sutocrtun and t+ia
ftHj.'tl: 'laiytiS mufeinafkrnjd jfl.tr Uif Uk'i VHSifupa. Cndb'j
AlitiJ. and SeuJn1! TtMrieka.
iHriom.ann/
Ondtr Iddlng Viin:
Ren ntinrm.inii
Clifrf CjttK.Lil.lve (J I fleer
over de grenzen van registraties heen
te verbinden, zodat je overkoepelende
vragen kunt stellen?
Waar liggen de grenzen van performance
en opslag bij grote hoeveelheden Linked
Data?
Is Linked Data geschikt voor verrijking?
In het project is data uit verschillende
basisregistraties, zoals de BGT, BAG, WOZ
en NHR, aan elkaar gekoppeld. Ook is de
data verrijkt met informatie over het beheer
van de openbare ruimte (BOR-data) en
met informatie uit op internet beschikbare
niet-overheidsbronnen. Op basis van deze
data is een website gebouwd die voor het
proefgebied, de gemeente Leiden, laat zien
hoe de data uit verschillende bronnen in
samenhang te raadplegen is.
Brondata
De BGT is nog niet als dataset voor heel
Nederland beschikbaar. Er is dus een keuze
voor een specifiek gebied gemaakt: Leiden.
Deze gemeente heeft namelijk haar BGT-data
al gepubliceerd. Voor dit gebied is ook data
verzameld van de BAG, WOZ, NHR, en BOR.
De brondata voor het geselecteerde gebied
moest veelal nog moeten worden omgezet
naar RDF, het dataformaat voor Linked Data.
Alleen de BAG was al als Linked Data te
benaderen. De BAG als Linked Data is in het
kader van een experiment in het Platform
Linked Data Nederland beschikbaar, en
bevat geen actuele data. Voor onze proof-of-
concept was dit echter ook niet nodig.
Het verkrijgen van alle brondata kostte aar
dig wat doorlooptijd: het duurde ongeveer
twee maanden voordat elke organisatie
zover was dat de data daadwerkelijk aan ons
Figuur3 - Bedrijfsinformatie uit Freebase.
werd opgestuurd. We hebben meer data
ontvangen dan we uiteindelijk in de proof of
concept hebben gebruikt: wel beschikbaar
maar niet gebruikt wegens gebrek aan tijd
waren percelen en erfdienstbaarheden van
het Kadaster, en parkeergegevens van de
RDW. Uit de BGT hebben we, ook wegens
de beperkte tijd, slechts twee objecttypen
gebruikt: panden (een verplicht BGT object
type) en bomen (een optioneel objecttype).
Omzetting
Al deze data, behalve zoals eerder gezegd
de BAG, is omgezet naar RDF. Dit kostte de
nodige inspanning. De data werd aangeleverd
in allerlei vormen: als Oracle-databasedump,
als Excel-sheet, als XML of als GML. De laatste
vormen waren, omdat dit gestandaardiseerde,
open formaten zijn, zonder veel moeite te
converteren. Ook Excel-data vormde geen pro
bleem, terwijl de Oracle-dump ons door het
gesloten karakter van deze data voor veel pro
blemen stelde. De overweldigende hoeveel
heid proefdata die we kregen aangeboden,
kon onmogelijk in de beschikbare tijd allemaal
tot Linked Data worden verwerkt. Daarom
hebben we een selectie gemaakt: BGT-panden
omdat die een directe relatie hebben met de
BAG, waaraan weer WOZ en NHR gekoppeld
kunnen worden, en bomen omdat daarvoor
veel extra gegevens aanwezig waren in de
BOR. De naamgeving van de toegekende
URL's is gebaseerd op de concept Nederlandse
URI-strategie.
Het prototype
Nadat alle data geconverteerd was, is alles
opgeslagen in een Linked Data database
(triple store) waar door machines vragen aan
gesteld kunnen worden via een zogenoemd
SPARQL-endpoint (SPARQL is een soort SQL
voor Linked Data). Dit alles is ingericht op
de voor het Platform Linked Data Nederland
beschikbare server van het Almere Big Data
Value Center. Krachtige hardware was daar
voorhanden.
Een uitdaging bij het opslaan van de gecre-
eerde Linked Data waren de in de BGT aan
wezige geometrieën. De ondersteuning voor
Jj 1 J KI»—,'rrt'ia
.-JQ 1 in*w .ijwuyi
v d—tt
X jf ri wr*
Q i G m*™.
f-J li ipj» s*m
H igOpaAi Malafraa :T -*■*'"*"1
ÉfHipHlWiMlWIHMili
jj V**" 'f1,1 'Ftn' «SjL .J1
'i.1- 1 ^fe r f J rjnirs ji n1.. n Jh" Qéih rviii Hntr
T l ^11
Figuur 4 - BGT-pand met bijbehorende BAG-, WOZ- en NHR-gegevens én informatie over nabije bomen.