een week:
2015-5 I Geo-Info
57
te zijn... Gedurende de week zijn er diverse
gesprekken gevoerd via Skype en Chro-
meCast. Zo heeft Santiago Giraldo, 'Civic
technologist' van de tool CartoDB, ons twee
keer vanuit New York bijgestaan met tips,
tricks en antwoorden. Vanuit Amsterdam
hebben Edward en Hans, van Webmapper,
'college' gegeven over de samenhang van
allerlei tools en standaarden en hebben we via
Skype nog meegedacht met Maarten, die een
(interne) Missing Maps party organiseerde. We
hebben geïnventariseerd wat we voor hem
nog konden doen, maar verder dan linkjes
naar voor/na situaties kwamen we ook niet.
Wel leuk om even contact te hebben met een
andere Missing Maps organisator in Nederland.
Hoe meer hoe beter!
Ik moet zeggen dat Skype toch wel een heel
handige uitvinding is hoor.
Datascraping en visualisatie
voor De Correspondent:
woordgebruik bij de VN
De tweede dag stond in het teken van de
concrete toepassing. Vanuit De Correspondent
was een oproep gedaan om met hen te kijken
hoe het woordgebruik van de Verenigde
Naties verandert. Een mailtje aan Sanne Blauw
met de vraag of we dat ook geografisch
konden duiden en zo in kaart konden brengen
(wordt er in Europese toespraken meer over
gender gesproken dan in Afrika? Is veiligheid
Santiago Giraldo vanuit New York.
Sanne legt het project uit.
voor Zuid-Amerika belangrijker dan voor
Azië?) was genoeg aanleiding om haar een
dagje over de vloer te krijgen.
Moderne communicatie?
om er patronen in te vinden en te visualiseren.
Misschien dat de VN wel een extract van de
database geeft als je het netjes vraagt...
CartoDB.
Met Sanne als coach is iedereen in de
beginselen van de VN-dataverzameling
ingewijd, maar allemachtig, dat is niet niks!
Om zulke hoeveelheden data van het web
te genereren is het echt nodig om te kunnen
datascrapen: een script programmeren dat
systematisch informatie ophaalt, omzet en
wegschrijft. De data kan natuurlijk handmatig
van een website worden gekopieerd om in
Excel te plakken, maar als je meerdere jaren
en alle landen wilt vergelijken, dan wordt het
echt monnikenwerk. De database die de VN
beschikbaar stelt, zou soelaas kunnen bieden,
ware het niet dat zoeken op meerdere termen
haast niet gaat, en er maar een beperkt aantal
resultaten kan worden binnengehaald.
Toch maar echt sera pen dan... Willy en Jonna
laten zien wat samenwerking op kan leveren:
met Willy's kennis van de programmeertaal R, en
de handigheidjes van Jonna om de website uit
te pluizen op de juiste bronnen hebben zij de
eerste data van de website weten te grabbelen
en omgezet naar een in Excel in te lezen CSV-be-
stand (zie blog menwhostareatmaps.com).
Het begin is dus gemaakt, maar onze kracht
ligt meer in de visualisatie dan in het data
scrapen. Dus als het je lukt (handiger dan wij)
data te vinden, gaan we er graag mee verder
Op vrijdag is met Sanne geskypet, om de
werkwijze en resultaten te bespreken. In de
loop van de week is een kaart gemaakt van de
steun voor de VN-resoluties die door Neder
land zijn ingediend. Deze kaart is op zeer
moderne wijze van computer-tot-computer
geskypet, zoals in de foto is te zien. Het geheel
gaf aanleiding tot een vervolg.
Overigens is de werking van de VN-organen
wel een echte eye-opener geweest. Wie
steunt wie bij wat voor soort resoluties leent
zich geweldig voor een geografische spider, of
misschien een mooie timelapse kaart.
Mapillary
Dag drie heeft Philippe ons meegenomen in
de wereld van Mapillary. In gesloten formatie
liepen we door de loopgraaf rond het doolhof,
met camera's alle kanten uit. Het idee achter
Mapillary is een beeld van de wereld in aan
eensluitende foto's te maken. Crowdsourced,
net als Wikipedia en OpenStreetMap, dus niet
per sé met auto's die door grote firma's inge
zet worden (hoewel die vast geplaatst worden
als ze als open data beschikbaar gemaakt
zouden worden, dat gebeurt in OpenStreet
Map natuurlijk ook). Het resultaat staat op