AgroDataCube
Techniek: data
Al heet het een kubus,
er kunnen (veel) meer
dan 3 dimensies in
Een open source analyse tool voor precisielandbouw
Uit de kruisbestuiving van
landbouwkundig onderzoek,
informatica en geodata
is de eerste versie van de
AgroDataCube ontstaan. Dat is
een multidimensionale database
met data die relevant zijn voor
de landbouw in Nederland en
benaderd kunnen worden via het
web. De cube is bedoeld als een
opstap in de richting van Big Data
en Machine Learning. Ontwikkelaar
Rob Knapen beschrijft het wat en
hoe ervan.
22
Geo-Info I 2018-4
Door Rob Knapen
Iedereen die dit blad leest, heeft ongetwijfeld
affiniteit met geo-informatie. Ik ben geen uitzon
dering wat dat betreft. By my is het ingegeven
door myn werk by de (toenmalige) Topografische
Dienst Nederland. Ook al was er toen nog niet
zo heel veel digitale geo-informatie. Zeker niet
in vergelyking met wat er momenteel allemaal,
veelal gratis, is te bekyken, te downloaden en te
gebruiken in uitstekende open source software,
zoals QGIS. Als ik tegenwoordig geo-data
nodig heb, is het een automatisme om eerst op
websites zoals pdok.nl en nationaalgeoregister.
nl te gaan zoeken. Voor satellietbeelden zoek ik
op satellietbeeld.nl, sentinel-hub.com, of wellicht
direct op earthengine.google.com, waar ook
direct data-analyse mogelyk is. Data ophalen van
de diverse web services als plaatje of als vectoren
is geen probleem. En daar zyn dan weer leuke
dingen mee te doen in zelf te schryven software,
byvoorbeeld voor mobiele apps. Software biblio
theken, zoals Leaflet, Google en Apple Maps,
hebben dit alleen maar makkelyker gemaakt.
Daarbij komt kennis over de geo-standaarden
van onder andere het Open Geospatial Consor
tium (OGC) nog steeds goed van pas.
Hackathons
Een paar jaar geleden belandde ik bij een
zogenaamde hackathon, georganiseerd door
FarmHack.NL. Het ging over het ontsluiten
van data voor (onder andere) de landbouw,
zodat probleemhouders (agrariërs, veetelers
et cetera), ontwerpers en ontwikkelaars (later
zijn data scientists aan het lystje toegevoegd)
innovatieve toepassingen kunnen bedenken,
bouwen (in extreem korte tyd, vaak ongeveer
32 uur), en presenteren. Een jury beslist dan
wat het beste concept is. Landbouw en
precisielandbouw, dat zal wel barsten van
Een hackathon (Foto: AgroDataCube).
de handige geo-data toepassingen, dacht
ik. Maar dat bleek nauwelyks zo te zyn. En de
gemiddeld aanwezige softwareontwikkelaar
wist weinig tot niets van geo-informatie af.
Uiteraard waren ze super handig in het gebruik
van hun tools en programmeertalen, maar ze
waren gewend aan web-standaarden en JSON
(json.org) voor het uitwisselen van data. Bij een
latere hackathon zaten data scientists die heel
goed waren met de programmeertaal R en de
RStudio werkomgeving. Maar ze hadden geen
idee van relationele databases en hoe geo-
informatie erin kan worden opgeslagen en eruit
kan worden opgehaald. Wel waren ze gewend
aan hele grote data tabellen, byvoorbeeld de
uitvoer van een oogstmachine als precisie-
landbouw data, maar de Lat/Long kolommen
daarin waren nauwelyks interessant voor hen.
Zeker tydens zo'n hackathon, maar eigenlyk in elk
project, kost het altyd (te)veel tyd om bruikbare
data te vinden en te verzamelen uit diverse
bronnen. Je hoopt altyd dat de data makkelyk te
downloaden zijn (tegenwoordig) en goed gedo
cumenteerd, zodat je weet wat je eraan hebt.
Anders mag je ook nog eens op zoek naar de
expert die de data in zyn/haar bezit heeft en als
enige weet wat elke kolom betekent, welke een
heden zyn gebruikt, hoe de data zijn ingewonnen