Continue coëfficiënten
Aangezien er veel meer mogelijkheden tot clustervor
ming zijn bij gebruikmaking van continue coëfficiënten,
is vervolgens getracht te komen tot effectieve continue
coëfficiënten. Daarbij is uitgegaan van de veronderstel
ling, dat in de coëfficiënt de nadruk moet liggen op de
aanwezigheid van inbreng van rechthebbenden in beide
blokdelen en dat dit gegeven gerelateerd moet zijn aan
het aantal rechthebbenden in de betreffende blokdelen
of aan de grootte van de blokdelen.
Deze veronderstelling sluit niet alleen aan bij de bevin
dingen met de clusteranalyses met binaire coëfficiënten,
maar ligt ook voor de hand. Immers naarmate een groter
gedeelte van blokdelen bestaat uit grond die is inge
bracht door dezelfde rechthebbenden, is de similariteit in
deze groter. De grootte van blokdelen kan daarbij wor
den aangegeven met de blokdeelwaarde of de waarde
van het gedeelte van het blokdeel dat relevant is voor de
clustering.
Uitgaande van genoemde veronderstelling zijn verschei
dene coëfficiënten mogelijk. Zie voor een aantal daarvan
het kader.
1. sim (k,l)
2. sim (k,ll
3. sim (k,l)
4. sim (k,l)
Si
(WAKAik WAKA,,)
BDWCk
f x (WAKA,k
BDWC,
- WAKAJ
f x Ei (WAKAlk WAKA,,)
Ei l(WAKAik WAKA//KA,)
BDWCk BDWC,
Ej (min !WAKAik, WAKA,,) x (WAKAik WAKA„) KA,)
BDWC, BDWC,
m x Ei ((WAKAlk WAKA//KA,)
BDWCk BDWC,
m x E, (min (WAKA,k, WAKA,,) x (WAKAlk WAKA,,) I KA,)
BDWCk BDWC,
Bij alle sommaties over i geldt, dat alleen wordt ge
sommeerd over rechthebbenden i die in blokdeel k en
blokdeel I voorkomen.
waarde van de kavels van rechthebben
den i in blokdeel k.
totale waarde van rechthebbenden i in
het blok.
waarde van het deel van blokdeel k dat
meedoet in de clustering,
aantal rechthebbenden i dat zowel in
blokdeel k als blokdeel I voorkomt,
factor.
5. sim (k,l)
6. sim (k,l)
WAKAik
KA,
BDWCk
m
Een zeer eenvoudige coëfficiënt die aan de veronderstel
ling voldoet, maar ook niet meer dan dat, is coëfficiënt
1. Coëfficiënt 2 ligt in het verlengde van de binaire
Czekanowski-Dice coëfficiënt. In de serie clusteranaly
ses is gewerkt met f respectievelijk 1, 4, 10, 100. De
coëfficiënten 3, 4, 5 en 6 zijn verdergaande pogingen om
datgene wat je in deze onder similariteit zou kunnen ver
staan, weer te geven. Enige toelichting is daarbij op zijn
plaats.
In alle vier de coëfficiënten zit het quotiënt (WAKAik
WAKAi,)/KAj. Hiermee wordt bereikt, dat de simiiari-
teitsmaat afhankelijk wordt van de grootte van dat deel
van de totale waarde van rechthebbenden i dat in beide
blokdelen voorkomt. Wanneer een groter deel van die
totale waarde in de betreffende blokdelen voorkomt,
wordt de similariteitsmaat groter. Bij de coëfficiënten 3
en 5 wordt dit quotiënt vervolgens vermenigvuldigd met
(WAKAik WAKA,,), terwijl dit bij de coëfficiënten 4
en 6 met min (WAKAik, WAKA,,) gebeurt. Dit betekent,
dat bij de coëfficiënten 3 en 5 de verdeling over de be
treffende blokdelen geen rol speelt, maar bij 4 en 6 wel.
De laatste nemen maximale waarden aan bij een 50% -
50% verdeling. Hierdoor ligt het waardenbereik van
coëfficiënt 3 van 0 tot 1 en van coëfficiënt 4 van 0 tot
Het onderscheid tussen respectievelijk de coëfficiënten 3
en 4, en 5 en 6 zit in de factor m, die het aantal recht
hebbenden weergeeft dat in beide blokdelen voorkomt.
Een analyse van de resultaten van de vele continue coëf
ficiënten is gedaan aan de hand van de clusterindelingen
bestaande uit acht tot en met twee clusters. Door de
verschillende clusterindelingen en het daarbij behorend
over en weer gebruik met elkaar te vergelijken, kunnen
uitspraken worden gedaan ten aanzien van de effecten
van de verschillende gekozen coëfficiënten. Uit deze
analyse blijkt o.a. dat:
- dezelfde coëfficiënt bij een bepaald aantal clusters
een evenwichtige verdeling*) kan geven en bij een
ander aantal een onevenwichtige;
- naarmate een coëfficiënt een evenwichtiger verdeling
geeft, het aantal rechthebbenden met inbreng in
meerdere clusters toeneemt.
Als gevolg van de twee bovenstaande constateringen is
het niet mogelijk een coëfficiënt aan te wijzen, die voor
alle clusteraantallen het beste resultaat geeft. Wel blijkt,
dat de coëfficiënten 5 en 6 samen alle beste clusterinde
lingen afdekken. Zo leidt coëfficiënt 5 tot een clusterin
deling van twee clusters die evenwichtig is 184 mil
joen om 269 miljoen met 16 rechthebbenden met ge
bruik in beide clusters. Coëfficiënt 6 leidt tot een oneven
wichtige verdeling 74 miljoen om 379 miljoen maar
met slechts 3 rechthebbenden met gebruik in beide
clusters. Hieronder is aangegeven hoe de vorming van
de laatste clusterindelingen in zijn werk gaat.
coefficient no 5
coefficient no 6
Evenwichtige verdeling wil zeggen, dat de clusters eenzelfde
orde van grootte hebben.
280
NGT GEODESIA