De SteekproefModulator:
H
FP
u
n
rm
n
z
i i
M
Een ArcGIS-model voor het samenvoegen van kleine populaties
De vraag naar informatie over
locale gebieden wordt steeds
groter. Onderzoekers willen
graag uitspraken kunnen doen
over bijvoorbeeld 6 positie
postcodegebieden. Het formaat
van deze gebieden ligt tussen
dat van een straat en een buurt.
Het probleem hierbij is dat de
populatie van zo'n 6 positie
postcodegebied vaak te klein is
voor het doen van betrouwbare
uitspraken. Een oplossing
hiervoor is het samenvoegen
van meerdere 6 positie
postcodegebieden. Dit artikel
beschrijft een ArcGIS-model dat
kleine populaties samenvoegt: de
SteekproefModulator.
34
Geo-Info I 2014-6
Door Koen Koggel
De SteekproefModulator is tot stand gekomen
gedurende een stage bij de gemeente Zwolle in
het kader van de Nationale Geo Informatie Minor
in de periode van december 2013 tot en met juni
2014. Een enquête in de gemeente Zwolle in het
kader van het Buurt voor Buurt onderzoek levert
resultaten op 6 positie postcodegebiedsniveau
op. De respons, populatie in de statistiek, in veel
van deze gebieden is te klein voor het doen van
betrouwbare uitspraken. Vandaar is mij als student
van de GI Minor gevraagd een rekenkundig
model te maken met de ArcGIS 10.0 ModelBuilder,
dat responsaantallen uit naastgelegen 6 positie
postcodegebieden samenvoegt. Omdat het
model kleine populaties samenvoegt voor een
voldoende grote steekproef, heb ik het de Steek
proefModulator genoemd.
Het proces dat uiteindelijk heeft geleid tot de
SteekproefModulator verliep voornamelijk
volgens trial and error. In eerste instantie was het
idee om in een vector omgeving te proberen
6 positie postcodegebieden binnen een buurt
samen te voegen. Met een vector omgeving
wordt een kaart met lijnstructuren(polygonen),
zoals een wandkaart bedoeld. Dit bleek echter
al snel een te ingewikkeld probleem voor een
stage van drie maanden. Bovendien richtte
deze aanpak zich teveel op het toekennen van
6 positie postcodegebieden aan een bepaalde
buurt en te weinig op het eigenlijke probleem:
het samenvoegen van respons. Dit leidde tot de
suggestie de responsaantallen weer te geven in
een raster. De locaties van de cellen geven hierin
de onderlinge ligging van de responsaantallen,
de celwaarden, weer. In deze omgeving is het
resultaat van trial and error approaches sneller
zichtbaar en makkelijker te voorspellen.
De volgende stap was het samenstellen van het
te gebruiken raster. Na het succesvol optellen van
naastgelegen celwaarden in een 4-bij-4 raster is
uiteindelijk een 8-bij-8 raster gekozen als uitgangs
materiaal. Als fictieve responsaantallen zijn gehele
waarden van 2 tot en met 12 gekozen. Omdat deze
waarden overeen komen met de mogelijke com
binaties bij het werpen van twee dobbelstenen,
kon het voorkomen van de verschillende waarden
enigszins worden voorspeld. Bij herhaald werpen
is de meest voorkomende waarde '7'. Ervan
uitgaande dat het merendeel van de respons uit
één 6 positie postcodegebied te klein is, is als
grenswaarde voor voldoende respons '8' gekozen.
Om het samenvoegen van celwaarden beter
te kunnen voorspellen, zijn de onvoldoende en
voldoende celwaarden in eerste instantie niet wil
lekeurig, maar in clusters over het raster verdeeld.
Figuur 1 geeft dit 'uitgangsraster' weer.
i
Legenda
n Grens gebieden
met al voldoende respons
Grens gebieden
met te weinig respons
Respons voor samenvoegen
Figuur 1 - Uitgangsraster.
Vervolgens zijn de voorwaarden nodig waaronder
het model responsaantallen kan samenvoegen.
De eerste is al gegeven; (1)een responsaantal
tussen de '2' en Voor de betrouwbaarheid van
de resultaten van het onderzoek, is het wenselijk
de samen te voegen gebieden zo weinig mogelijk
te veranderen ten opzichte van de oorspronkelijke
gebieden. Dit leidt tot de voorwaarden een onvol
doende responsaantal samen te voegen met: (2)
het naastgelegen, (3)dichtstbijzijnde, en (4)een bij
voorkeur eveneens onvoldoende responsaantal.
In een toekomstige, meer complexe, weergave
van de werkelijke situatie, zullen de 6 positie
postcodegebieden worden weergegeven door
meerdere naastgelegen rastercellen. Ook in deze
situatie moet het model kunnen functioneren.
Daarom is (5) een laatste voorwaarde dat naast
gelegen, gelijke, responsaantallen niet worden
samengevoegd. Drie naastgelegen cellen met elk
celwaarde '4' bijvoorbeeld, stellen één 6 positie
postcodegebied voor met het responsaantal '4'.
Figuur 2 geeft voorwaarden nogmaals weer.
Rekenkundige weergave van naastgelegen responsaantallen
in een 8 bij 8 raster.
Willekeurige, gehele, waarden tussen 2 en 12 voor het aantal respondenten.
Voorwaarden voor samenvoegen:
Het minimum aantal respondenten voor een steekproef
is gesteld op 8.
Voeg naastgelegen responsaantallen samen met de laagste
naastgelegen waarde. Bij voorkeur een waarde die ook niet voldoet.
Figuur 2 - Voorwaarden voor het model.