Het onderzoek
De gegevens
Figuur 1 - Foursquarelocaties in en rond Amsterdam.
Het onderzoek richt zich op een rechthoek
rond Amsterdam. Vanwege de beperkin
gen die Foursquare oplegt bij het opvragen
van gegevens, konden niet alle gegevens
uit deze rechthoek in één keer worden
opgevraagd. Maar met een paar slimmig
heidjes bleek het mogelijk om de basisge
gevens van alle locaties stukje bij beetje
op te vragen. Figuur i laat het onderzoeks
gebied zien en de circa 57.000 locaties die
zijn opgehaald. De afbeelding illustreert
meteen een vervelende eigenschap van
data van sociale media: de geografische
nauwkeurigheid is variabel en soms erg
slecht: hoewel een boot ook een Four-
squarelocatie kan zijn, hebben veel locaties
onterecht een positie in het water.
Naast de geografische positie kwamen
andere gegevens van Foursquarelocaties
beschikbaar: de naam van de locatie,
het adres, de datum dat de locatie werd
geregistreerd en de categorie waartoe de
locatie behoort. Een categorie is bijvoor
beeld'museum','boekwinkel','woning'of
'park'. Die categorie is interessant vanuit
het geomarketingperspectief. Binnen
de rechthoek blijken tussen de drie- en
vierhonderd categorieën te zijn. Voor het
onderzoek zijn de categorieën in twee
klassen ingedeeld: commercieel en niet-
commercieel. Een commerciële locatie
is een locatie waar men geld uitgeeft en
waarvan we kunnen aannemen dat de
exploitant graag wil dat men nog meer
geld uitgeeft. Het onderscheid tussen
commerciële en niet-commerciële locaties
is uiteraard van belang uit oogpunt van
geomarketing. Maar het onderscheid is
tevens om een praktische reden gemaakt,
namelijk om een selectie van locaties
te kunnen maken die gevolgd worden.
Van een groep locaties is het mogelijk de
check-ins op te vragen, maar die groep
kan niet te groot zijn, vanwege door
Foursquare ingesteld beperkingen in de
API. Het bleek nét mogelijk te zijn om de
groep commerciële locaties in de twee
meest centrale vierpositiepostcodegebie-
den (1012 en non) te volgen.
Figuur 2 geeft binnen het onderzoeks
gebied per vierpositiepostcodegebied
de verdeling weer tussen commerciële
en niet-commerciële locaties. Ook is te
zien wanneer de locaties bij Foursquare
zijn aangemeld. Zo te zien waren er in
de centrale gebieden relatief veel early
adopters. Een groot aantal locaties met
een commercieel belang in die gebieden
zou dat patroon kunnen verklaren.
Van circa 2400 geselecteerde locaties
zijn gedurende een halfjaar alle check-
ins opgehaald. Van een check-in is het
tijdstip bekend, en de identificatie van
een gebruiker. Van een gebruiker zijn de
opgegeven naam, het geslacht en de her
komst (land en plaats) bekend. Met deze
gegevens wordt het mogelijk om patro
nen in de data te zoeken.
Figuur 2- Gemiddelde ouderdom van Foursquarelocaties per PC4-gebied. Floe donkerder, hoe ouder.
Taartdiagram: verhouding tussen commerciële (oranje) en niet-commerciële locaties (groen).
Geo-lnfo 2013-5 5