worden gecombineerd, zijn single linkage, complete
linkage en average linkage [1, par. 2.3]. Een aantal van
die combinaties is in het kader van een case study door
Tofield [5] onderzocht. Dit onderzoek naar het clusteren
van blokdelen in het kavelruilproject Halle-Wolfersveen
is uitgevoerd met behulp van het softwarepakket Clus-
tan [9]. Tofield zag zich daarbij beperkt door standaard
(dis)similariteitscoëfficiënten en de daarmee samenhan
gende beperking in het aantal variabelen. Desalniettemin
waren de resultaten aanvaardbaar.
Nadere bestudering van het Clustanpakket leerde ech
ter, dat deze beperkingen te omzeilen waren door invoe
ring in Clustan van buiten Clustan berekende similari-
teitsmaten. Hierdoor is geen beperking meer gesteld aan
het aantal variabelen en wordt tevens de mogelijkheid
geboden zelf een similariteitscoëfficiënt op te stellen.
Gebruikmakend van deze vrijheid is een serie clusterana
lyses uitgevoerd op basis van een bestand „oude toe
stand" van de ruilverkaveling Lopikerwaard.
Lopikerwaard
De in uitvoering zijnde ruilverkaveling Lopikerwaard om
vat ongeveer 13 000 ha grond en 1 020 rechthebbenden.
In dit gebied met een ruilwaarde van circa 455 miljoen
gulden zijn 98 blokdelen gevormd. In het bestand oude
toestand is van alle rechthebbenden aangegeven in
welke blokdelen hun inbreng is gelegen en welke ruil
waarde (kavelaanspraak) deze vertegenwoordigt.
Door bij de clustering van blokdelen de inbreng van de
rechthebbenden als variabelen te beschouwen, is deze
clustering gericht op beperking van het over en weer ge
bruik. Immers op deze wijze ontstaan clusters van blok
delen, waarin zoveel mogelijk dezelfde rechthebbenden
inbreng hebben.
Wanneer in een zogenaamde datamatrix per rechtheb
bende de inbreng uitgesplitst per blokdeel wordt weer
gegeven, heeft deze matrix de afmetingen 98 x 1 020
(produkt van blokdelen en rechthebbenden). Deze kan
echter aanzienlijk worden verkleind.
Allereerst betreft dit het aantal rechthebbenden. Van
deze 1 020 rechthebbenden hebben 348 inbreng in meer
dere blokdelen. Alleen deze rechthebbenden zijn rele
vant voor de clustering. Onder deze 348 is ook het
Bureau Beheer Landbouwgronden (BBL). Aangezien
het BBL geen gebruiker is en door de grote inbreng in
vele blokdelen wat verstorend werkt en in het herverka
velingsproces een bijzondere behandeling krijgt, wordt
deze weggelaten.
Naast het aantal rechthebbenden kan ook het aantal
relevante blokdelen worden verminderd. Voor twee
blokdelen geldt namelijk, dat daarin alleen rechthebben
den inbreng hebben, die niet in andere blokdelen grond
inbrengen.
Door dit alles resteert een datamatrix van 96 x 347. In
geval van binaire variabelen is deze gevuld met enen en
nullen en ingeval van continue variabelen met de waarde
van de inbreng van rechthebbenden. De totale waarde
van deze inbreng bedraagt circa 221 miljoen, ongeveer
de helft van het gebied.
Standaard binaire coëfficiënten
Allereerst is op basis van de binaire datamatrix een serie
clusteranalyses uitgevoerd met combinaties van stan
daard coëfficiënten en de drie methoden van samen
voegen. Overeenkomstig de resultaten van het onder
zoek van Tofield blijkt ook hier, dat slechts met behulp
van bepaalde combinaties clusters zijn te onderschei-
NGT GEODESIA 86
den. Deze werkende combinaties bestaan allemaal uit de
average link-methode en similariteitscoëfficiënten dus
geen dissimilariteitscoëfficiënten waarbij de nadruk
ligt op de aanwezigheid van dezelfde rechthebbenden in
de betreffende twee blokdelen. Dit laatste is overigens
eenvoudig verklaarbaar. Per blokdeel komen namelijk
gemiddeld niet meer dan tien relevante rechthebbenden
rechthebbenden met inbreng in meerdere blokdelen
voor. In elk blokdeel komt dus het overgrote deel van
de rechthebbenden niet voor.
Alleen door de nadruk op de aanwezigheid van inbreng
van rechthebbenden te leggen, ontstaan substantiële
verschillen in de similariteitsmaten en kunnen clusters
worden onderscheiden. Op basis van deze similariteits
maten worden bij de average link-methode tijdens elke
stap die twee clusters samengevoegd, waarvoor geldt
dat het gemiddelde van de similariteitsmaten van alle
paren blokdelen, gevormd door uit elk van beide clusters
één blokdeel te nemen, het grootste is.
In onderstaand dendrogram is de clustervorming in de
Lopikerwaard met de Czekanowski-Dice coëfficiënt
weergegeven. Deze coëfficiënt, die van de onderzochte
binaire serie de beste resultaten geeft, is als volgt opge
bouwd:
2A
sim (k,l)
2A B C
met
A het aantal rechthebbenden dat inbreng heeft in
blokdeel k en blokdeel I.
B het aantal rechthebbenden dat wel inbreng heeft
in blokdeel k en geen inbreng heeft in blokdeel I.
C het aantal rechthebbenden dat geen inbreng heeft
in blokdeel k en wel inbreng in blokdeel I.
In de dendrogram is te zien welke blokdelen worden
samengevoegd. De blokdelen zijn daarvoor horizontaal
uitgezet en de waarden van het samenvoegingscriterium
verticaal. Uiteindelijk leidt deze clustervorming tot twee
clusters van 81 en 15 blokdelen. Het aantal rechthebben
den met over en weer gebruik tussen die twee clusters
is slechts drie.
L0PIKERHfiflRD (MINBBL) BINflIR:2fl/2fl*B*CAVERAGE LINKAGE 00000210
279