AgroDataCube Techniek: data Al heet het een kubus, er kunnen (veel) meer dan 3 dimensies in Een open source analyse tool voor precisielandbouw Uit de kruisbestuiving van landbouwkundig onderzoek, informatica en geodata is de eerste versie van de AgroDataCube ontstaan. Dat is een multidimensionale database met data die relevant zijn voor de landbouw in Nederland en benaderd kunnen worden via het web. De cube is bedoeld als een opstap in de richting van Big Data en Machine Learning. Ontwikkelaar Rob Knapen beschrijft het wat en hoe ervan. 22 Geo-Info I 2018-4 Door Rob Knapen Iedereen die dit blad leest, heeft ongetwijfeld affiniteit met geo-informatie. Ik ben geen uitzon dering wat dat betreft. By my is het ingegeven door myn werk by de (toenmalige) Topografische Dienst Nederland. Ook al was er toen nog niet zo heel veel digitale geo-informatie. Zeker niet in vergelyking met wat er momenteel allemaal, veelal gratis, is te bekyken, te downloaden en te gebruiken in uitstekende open source software, zoals QGIS. Als ik tegenwoordig geo-data nodig heb, is het een automatisme om eerst op websites zoals pdok.nl en nationaalgeoregister. nl te gaan zoeken. Voor satellietbeelden zoek ik op satellietbeeld.nl, sentinel-hub.com, of wellicht direct op earthengine.google.com, waar ook direct data-analyse mogelyk is. Data ophalen van de diverse web services als plaatje of als vectoren is geen probleem. En daar zyn dan weer leuke dingen mee te doen in zelf te schryven software, byvoorbeeld voor mobiele apps. Software biblio theken, zoals Leaflet, Google en Apple Maps, hebben dit alleen maar makkelyker gemaakt. Daarbij komt kennis over de geo-standaarden van onder andere het Open Geospatial Consor tium (OGC) nog steeds goed van pas. Hackathons Een paar jaar geleden belandde ik bij een zogenaamde hackathon, georganiseerd door FarmHack.NL. Het ging over het ontsluiten van data voor (onder andere) de landbouw, zodat probleemhouders (agrariërs, veetelers et cetera), ontwerpers en ontwikkelaars (later zijn data scientists aan het lystje toegevoegd) innovatieve toepassingen kunnen bedenken, bouwen (in extreem korte tyd, vaak ongeveer 32 uur), en presenteren. Een jury beslist dan wat het beste concept is. Landbouw en precisielandbouw, dat zal wel barsten van Een hackathon (Foto: AgroDataCube). de handige geo-data toepassingen, dacht ik. Maar dat bleek nauwelyks zo te zyn. En de gemiddeld aanwezige softwareontwikkelaar wist weinig tot niets van geo-informatie af. Uiteraard waren ze super handig in het gebruik van hun tools en programmeertalen, maar ze waren gewend aan web-standaarden en JSON (json.org) voor het uitwisselen van data. Bij een latere hackathon zaten data scientists die heel goed waren met de programmeertaal R en de RStudio werkomgeving. Maar ze hadden geen idee van relationele databases en hoe geo- informatie erin kan worden opgeslagen en eruit kan worden opgehaald. Wel waren ze gewend aan hele grote data tabellen, byvoorbeeld de uitvoer van een oogstmachine als precisie- landbouw data, maar de Lat/Long kolommen daarin waren nauwelyks interessant voor hen. Zeker tydens zo'n hackathon, maar eigenlyk in elk project, kost het altyd (te)veel tyd om bruikbare data te vinden en te verzamelen uit diverse bronnen. Je hoopt altyd dat de data makkelyk te downloaden zijn (tegenwoordig) en goed gedo cumenteerd, zodat je weet wat je eraan hebt. Anders mag je ook nog eens op zoek naar de expert die de data in zyn/haar bezit heeft en als enige weet wat elke kolom betekent, welke een heden zyn gebruikt, hoe de data zijn ingewonnen

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2018 | | pagina 24