De SteekproefModulator: H FP u n rm n z i i M Een ArcGIS-model voor het samenvoegen van kleine populaties De vraag naar informatie over locale gebieden wordt steeds groter. Onderzoekers willen graag uitspraken kunnen doen over bijvoorbeeld 6 positie postcodegebieden. Het formaat van deze gebieden ligt tussen dat van een straat en een buurt. Het probleem hierbij is dat de populatie van zo'n 6 positie postcodegebied vaak te klein is voor het doen van betrouwbare uitspraken. Een oplossing hiervoor is het samenvoegen van meerdere 6 positie postcodegebieden. Dit artikel beschrijft een ArcGIS-model dat kleine populaties samenvoegt: de SteekproefModulator. 34 Geo-Info I 2014-6 Door Koen Koggel De SteekproefModulator is tot stand gekomen gedurende een stage bij de gemeente Zwolle in het kader van de Nationale Geo Informatie Minor in de periode van december 2013 tot en met juni 2014. Een enquête in de gemeente Zwolle in het kader van het Buurt voor Buurt onderzoek levert resultaten op 6 positie postcodegebiedsniveau op. De respons, populatie in de statistiek, in veel van deze gebieden is te klein voor het doen van betrouwbare uitspraken. Vandaar is mij als student van de GI Minor gevraagd een rekenkundig model te maken met de ArcGIS 10.0 ModelBuilder, dat responsaantallen uit naastgelegen 6 positie postcodegebieden samenvoegt. Omdat het model kleine populaties samenvoegt voor een voldoende grote steekproef, heb ik het de Steek proefModulator genoemd. Het proces dat uiteindelijk heeft geleid tot de SteekproefModulator verliep voornamelijk volgens trial and error. In eerste instantie was het idee om in een vector omgeving te proberen 6 positie postcodegebieden binnen een buurt samen te voegen. Met een vector omgeving wordt een kaart met lijnstructuren(polygonen), zoals een wandkaart bedoeld. Dit bleek echter al snel een te ingewikkeld probleem voor een stage van drie maanden. Bovendien richtte deze aanpak zich teveel op het toekennen van 6 positie postcodegebieden aan een bepaalde buurt en te weinig op het eigenlijke probleem: het samenvoegen van respons. Dit leidde tot de suggestie de responsaantallen weer te geven in een raster. De locaties van de cellen geven hierin de onderlinge ligging van de responsaantallen, de celwaarden, weer. In deze omgeving is het resultaat van trial and error approaches sneller zichtbaar en makkelijker te voorspellen. De volgende stap was het samenstellen van het te gebruiken raster. Na het succesvol optellen van naastgelegen celwaarden in een 4-bij-4 raster is uiteindelijk een 8-bij-8 raster gekozen als uitgangs materiaal. Als fictieve responsaantallen zijn gehele waarden van 2 tot en met 12 gekozen. Omdat deze waarden overeen komen met de mogelijke com binaties bij het werpen van twee dobbelstenen, kon het voorkomen van de verschillende waarden enigszins worden voorspeld. Bij herhaald werpen is de meest voorkomende waarde '7'. Ervan uitgaande dat het merendeel van de respons uit één 6 positie postcodegebied te klein is, is als grenswaarde voor voldoende respons '8' gekozen. Om het samenvoegen van celwaarden beter te kunnen voorspellen, zijn de onvoldoende en voldoende celwaarden in eerste instantie niet wil lekeurig, maar in clusters over het raster verdeeld. Figuur 1 geeft dit 'uitgangsraster' weer. i Legenda n Grens gebieden met al voldoende respons Grens gebieden met te weinig respons Respons voor samenvoegen Figuur 1 - Uitgangsraster. Vervolgens zijn de voorwaarden nodig waaronder het model responsaantallen kan samenvoegen. De eerste is al gegeven; (1)een responsaantal tussen de '2' en Voor de betrouwbaarheid van de resultaten van het onderzoek, is het wenselijk de samen te voegen gebieden zo weinig mogelijk te veranderen ten opzichte van de oorspronkelijke gebieden. Dit leidt tot de voorwaarden een onvol doende responsaantal samen te voegen met: (2) het naastgelegen, (3)dichtstbijzijnde, en (4)een bij voorkeur eveneens onvoldoende responsaantal. In een toekomstige, meer complexe, weergave van de werkelijke situatie, zullen de 6 positie postcodegebieden worden weergegeven door meerdere naastgelegen rastercellen. Ook in deze situatie moet het model kunnen functioneren. Daarom is (5) een laatste voorwaarde dat naast gelegen, gelijke, responsaantallen niet worden samengevoegd. Drie naastgelegen cellen met elk celwaarde '4' bijvoorbeeld, stellen één 6 positie postcodegebied voor met het responsaantal '4'. Figuur 2 geeft voorwaarden nogmaals weer. Rekenkundige weergave van naastgelegen responsaantallen in een 8 bij 8 raster. Willekeurige, gehele, waarden tussen 2 en 12 voor het aantal respondenten. Voorwaarden voor samenvoegen: Het minimum aantal respondenten voor een steekproef is gesteld op 8. Voeg naastgelegen responsaantallen samen met de laagste naastgelegen waarde. Bij voorkeur een waarde die ook niet voldoet. Figuur 2 - Voorwaarden voor het model.

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2014 | | pagina 36