ih x i=ipi: n j"1 'X* - C 'M? - n v - v 'W lb 9- Vyr r?:« w..t n lm 12 Geo-Info I 2015-3 <F WQZ< Wciarde van C 5QD.DM - en C 1,000.000 If '"l £v *7 J» 1 CMftMr- r P PL LI -1 h{ T*wb n«f cgnd nr#jV.N T-MHÖH Jfillffi HWl! Ifljll hs-J.Pt igcticJHy fv QiulKhi Tutafccn» JuG'ft vvifiul moSil# UfKfnvfliCitifi^l tubü«Swi« eutmk cj?i*ni iav. B-i s«-dl n fenn, Cwifir, hi ivOfuni-i m»i«je HK, UHTS Pit lTt<baft«l ëriutü n«hiwl>a In Edr«*. tfli lift*«4 Mil. ftiirtd itffr, Pd US. W&fi lilWiifau T*i« LWtipjnT halt Ppdfel ItfeKfel in niuiA optttion In be(h f«nv*l fend (Htim Europt. TTvt tampm» Kas flnar-ori rijk.« «n i^iAtte upetaturt in both OadiaJ an J EMim Ei,™ ïfct T-*tafafl# ÈrPd a prwmt In 13 Eurcptjn coianbta - MJririi, Croatia. Ciech tepufc&L deiTnar f.. Hun any, fctpufci: d Hidaöan4ar Hdtilriragro, llli NetfieiUrcb, J^andL Pon- aria, ikrvatii, and the United Mlnpdora, m nfl ai the United SMtet, R,«tn F ten. ind til* U.S. tirgfci Irian dr. GkCudy, T Hobflr Ir-Trrr alien ji uibtkLnin htwi a asm bén ad fatal d ipprarim Italy 330 raifen sLbscribco-, and wl h-aw a total of ISO rraUon tr« th and d 2014. T-HafcJ# JrvtMiuNkxiaJ It tha woriifi flhwnth Urtwsï rn-si phcr s kt.ki pravWtr by sutocrtun and t+ia ftHj.'tl: 'laiytiS mufeinafkrnjd jfl.tr Uif Uk'i VHSifupa. Cndb'j AlitiJ. and SeuJn1! TtMrieka. iHriom.ann/ Ondtr Iddlng Viin: Ren ntinrm.inii Clifrf CjttK.Lil.lve (J I fleer over de grenzen van registraties heen te verbinden, zodat je overkoepelende vragen kunt stellen? Waar liggen de grenzen van performance en opslag bij grote hoeveelheden Linked Data? Is Linked Data geschikt voor verrijking? In het project is data uit verschillende basisregistraties, zoals de BGT, BAG, WOZ en NHR, aan elkaar gekoppeld. Ook is de data verrijkt met informatie over het beheer van de openbare ruimte (BOR-data) en met informatie uit op internet beschikbare niet-overheidsbronnen. Op basis van deze data is een website gebouwd die voor het proefgebied, de gemeente Leiden, laat zien hoe de data uit verschillende bronnen in samenhang te raadplegen is. Brondata De BGT is nog niet als dataset voor heel Nederland beschikbaar. Er is dus een keuze voor een specifiek gebied gemaakt: Leiden. Deze gemeente heeft namelijk haar BGT-data al gepubliceerd. Voor dit gebied is ook data verzameld van de BAG, WOZ, NHR, en BOR. De brondata voor het geselecteerde gebied moest veelal nog moeten worden omgezet naar RDF, het dataformaat voor Linked Data. Alleen de BAG was al als Linked Data te benaderen. De BAG als Linked Data is in het kader van een experiment in het Platform Linked Data Nederland beschikbaar, en bevat geen actuele data. Voor onze proof-of- concept was dit echter ook niet nodig. Het verkrijgen van alle brondata kostte aar dig wat doorlooptijd: het duurde ongeveer twee maanden voordat elke organisatie zover was dat de data daadwerkelijk aan ons Figuur3 - Bedrijfsinformatie uit Freebase. werd opgestuurd. We hebben meer data ontvangen dan we uiteindelijk in de proof of concept hebben gebruikt: wel beschikbaar maar niet gebruikt wegens gebrek aan tijd waren percelen en erfdienstbaarheden van het Kadaster, en parkeergegevens van de RDW. Uit de BGT hebben we, ook wegens de beperkte tijd, slechts twee objecttypen gebruikt: panden (een verplicht BGT object type) en bomen (een optioneel objecttype). Omzetting Al deze data, behalve zoals eerder gezegd de BAG, is omgezet naar RDF. Dit kostte de nodige inspanning. De data werd aangeleverd in allerlei vormen: als Oracle-databasedump, als Excel-sheet, als XML of als GML. De laatste vormen waren, omdat dit gestandaardiseerde, open formaten zijn, zonder veel moeite te converteren. Ook Excel-data vormde geen pro bleem, terwijl de Oracle-dump ons door het gesloten karakter van deze data voor veel pro blemen stelde. De overweldigende hoeveel heid proefdata die we kregen aangeboden, kon onmogelijk in de beschikbare tijd allemaal tot Linked Data worden verwerkt. Daarom hebben we een selectie gemaakt: BGT-panden omdat die een directe relatie hebben met de BAG, waaraan weer WOZ en NHR gekoppeld kunnen worden, en bomen omdat daarvoor veel extra gegevens aanwezig waren in de BOR. De naamgeving van de toegekende URL's is gebaseerd op de concept Nederlandse URI-strategie. Het prototype Nadat alle data geconverteerd was, is alles opgeslagen in een Linked Data database (triple store) waar door machines vragen aan gesteld kunnen worden via een zogenoemd SPARQL-endpoint (SPARQL is een soort SQL voor Linked Data). Dit alles is ingericht op de voor het Platform Linked Data Nederland beschikbare server van het Almere Big Data Value Center. Krachtige hardware was daar voorhanden. Een uitdaging bij het opslaan van de gecre- eerde Linked Data waren de in de BGT aan wezige geometrieën. De ondersteuning voor Jj 1 J KI»—,'rrt'ia .-JQ 1 in*w .ijwuyi v d—tt X jf ri wr* Q i G m*™. f-J li ipj» s*m H igOpaAi Malafraa :T -*■*'"*"1 ÉfHipHlWiMlWIHMili jj V**" 'f1,1 'Ftn' «SjL .J1 'i.1- 1 ^fe r f J rjnirs ji n1.. n Jh" Qéih rviii Hntr T l ^11 Figuur 4 - BGT-pand met bijbehorende BAG-, WOZ- en NHR-gegevens én informatie over nabije bomen.

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2015 | | pagina 14