Het onderzoek De gegevens Figuur 1 - Foursquarelocaties in en rond Amsterdam. Het onderzoek richt zich op een rechthoek rond Amsterdam. Vanwege de beperkin gen die Foursquare oplegt bij het opvragen van gegevens, konden niet alle gegevens uit deze rechthoek in één keer worden opgevraagd. Maar met een paar slimmig heidjes bleek het mogelijk om de basisge gevens van alle locaties stukje bij beetje op te vragen. Figuur i laat het onderzoeks gebied zien en de circa 57.000 locaties die zijn opgehaald. De afbeelding illustreert meteen een vervelende eigenschap van data van sociale media: de geografische nauwkeurigheid is variabel en soms erg slecht: hoewel een boot ook een Four- squarelocatie kan zijn, hebben veel locaties onterecht een positie in het water. Naast de geografische positie kwamen andere gegevens van Foursquarelocaties beschikbaar: de naam van de locatie, het adres, de datum dat de locatie werd geregistreerd en de categorie waartoe de locatie behoort. Een categorie is bijvoor beeld'museum','boekwinkel','woning'of 'park'. Die categorie is interessant vanuit het geomarketingperspectief. Binnen de rechthoek blijken tussen de drie- en vierhonderd categorieën te zijn. Voor het onderzoek zijn de categorieën in twee klassen ingedeeld: commercieel en niet- commercieel. Een commerciële locatie is een locatie waar men geld uitgeeft en waarvan we kunnen aannemen dat de exploitant graag wil dat men nog meer geld uitgeeft. Het onderscheid tussen commerciële en niet-commerciële locaties is uiteraard van belang uit oogpunt van geomarketing. Maar het onderscheid is tevens om een praktische reden gemaakt, namelijk om een selectie van locaties te kunnen maken die gevolgd worden. Van een groep locaties is het mogelijk de check-ins op te vragen, maar die groep kan niet te groot zijn, vanwege door Foursquare ingesteld beperkingen in de API. Het bleek nét mogelijk te zijn om de groep commerciële locaties in de twee meest centrale vierpositiepostcodegebie- den (1012 en non) te volgen. Figuur 2 geeft binnen het onderzoeks gebied per vierpositiepostcodegebied de verdeling weer tussen commerciële en niet-commerciële locaties. Ook is te zien wanneer de locaties bij Foursquare zijn aangemeld. Zo te zien waren er in de centrale gebieden relatief veel early adopters. Een groot aantal locaties met een commercieel belang in die gebieden zou dat patroon kunnen verklaren. Van circa 2400 geselecteerde locaties zijn gedurende een halfjaar alle check- ins opgehaald. Van een check-in is het tijdstip bekend, en de identificatie van een gebruiker. Van een gebruiker zijn de opgegeven naam, het geslacht en de her komst (land en plaats) bekend. Met deze gegevens wordt het mogelijk om patro nen in de data te zoeken. Figuur 2- Gemiddelde ouderdom van Foursquarelocaties per PC4-gebied. Floe donkerder, hoe ouder. Taartdiagram: verhouding tussen commerciële (oranje) en niet-commerciële locaties (groen). Geo-lnfo 2013-5 5

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2013 | | pagina 7