(NGT) Geodesia | 1 september 1986 | pagina 5 - Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

worden gecombineerd, zijn single linkage, complete linkage en average linkage [1, par. 2.3]. Een aantal van die combinaties is in het kader van een case study door Tofield [5] onderzocht. Dit onderzoek naar het clusteren van blokdelen in het kavelruilproject Halle-Wolfersveen is uitgevoerd met behulp van het softwarepakket Clus- tan [9]. Tofield zag zich daarbij beperkt door standaard (dis)similariteitscoëfficiënten en de daarmee samenhan gende beperking in het aantal variabelen. Desalniettemin waren de resultaten aanvaardbaar. Nadere bestudering van het Clustanpakket leerde ech ter, dat deze beperkingen te omzeilen waren door invoe ring in Clustan van buiten Clustan berekende similari- teitsmaten. Hierdoor is geen beperking meer gesteld aan het aantal variabelen en wordt tevens de mogelijkheid geboden zelf een similariteitscoëfficiënt op te stellen. Gebruikmakend van deze vrijheid is een serie clusterana lyses uitgevoerd op basis van een bestand „oude toe stand" van de ruilverkaveling Lopikerwaard. Lopikerwaard De in uitvoering zijnde ruilverkaveling Lopikerwaard om vat ongeveer 13 000 ha grond en 1 020 rechthebbenden. In dit gebied met een ruilwaarde van circa 455 miljoen gulden zijn 98 blokdelen gevormd. In het bestand oude toestand is van alle rechthebbenden aangegeven in welke blokdelen hun inbreng is gelegen en welke ruil waarde (kavelaanspraak) deze vertegenwoordigt. Door bij de clustering van blokdelen de inbreng van de rechthebbenden als variabelen te beschouwen, is deze clustering gericht op beperking van het over en weer ge bruik. Immers op deze wijze ontstaan clusters van blok delen, waarin zoveel mogelijk dezelfde rechthebbenden inbreng hebben. Wanneer in een zogenaamde datamatrix per rechtheb bende de inbreng uitgesplitst per blokdeel wordt weer gegeven, heeft deze matrix de afmetingen 98 x 1 020 (produkt van blokdelen en rechthebbenden). Deze kan echter aanzienlijk worden verkleind. Allereerst betreft dit het aantal rechthebbenden. Van deze 1 020 rechthebbenden hebben 348 inbreng in meer dere blokdelen. Alleen deze rechthebbenden zijn rele vant voor de clustering. Onder deze 348 is ook het Bureau Beheer Landbouwgronden (BBL). Aangezien het BBL geen gebruiker is en door de grote inbreng in vele blokdelen wat verstorend werkt en in het herverka velingsproces een bijzondere behandeling krijgt, wordt deze weggelaten. Naast het aantal rechthebbenden kan ook het aantal relevante blokdelen worden verminderd. Voor twee blokdelen geldt namelijk, dat daarin alleen rechthebben den inbreng hebben, die niet in andere blokdelen grond inbrengen. Door dit alles resteert een datamatrix van 96 x 347. In geval van binaire variabelen is deze gevuld met enen en nullen en ingeval van continue variabelen met de waarde van de inbreng van rechthebbenden. De totale waarde van deze inbreng bedraagt circa 221 miljoen, ongeveer de helft van het gebied. Standaard binaire coëfficiënten Allereerst is op basis van de binaire datamatrix een serie clusteranalyses uitgevoerd met combinaties van stan daard coëfficiënten en de drie methoden van samen voegen. Overeenkomstig de resultaten van het onder zoek van Tofield blijkt ook hier, dat slechts met behulp van bepaalde combinaties clusters zijn te onderschei- NGT GEODESIA 86 den. Deze werkende combinaties bestaan allemaal uit de average link-methode en similariteitscoëfficiënten dus geen dissimilariteitscoëfficiënten waarbij de nadruk ligt op de aanwezigheid van dezelfde rechthebbenden in de betreffende twee blokdelen. Dit laatste is overigens eenvoudig verklaarbaar. Per blokdeel komen namelijk gemiddeld niet meer dan tien relevante rechthebbenden rechthebbenden met inbreng in meerdere blokdelen voor. In elk blokdeel komt dus het overgrote deel van de rechthebbenden niet voor. Alleen door de nadruk op de aanwezigheid van inbreng van rechthebbenden te leggen, ontstaan substantiële verschillen in de similariteitsmaten en kunnen clusters worden onderscheiden. Op basis van deze similariteits maten worden bij de average link-methode tijdens elke stap die twee clusters samengevoegd, waarvoor geldt dat het gemiddelde van de similariteitsmaten van alle paren blokdelen, gevormd door uit elk van beide clusters één blokdeel te nemen, het grootste is. In onderstaand dendrogram is de clustervorming in de Lopikerwaard met de Czekanowski-Dice coëfficiënt weergegeven. Deze coëfficiënt, die van de onderzochte binaire serie de beste resultaten geeft, is als volgt opge bouwd: 2A sim (k,l) 2A B C met A het aantal rechthebbenden dat inbreng heeft in blokdeel k en blokdeel I. B het aantal rechthebbenden dat wel inbreng heeft in blokdeel k en geen inbreng heeft in blokdeel I. C het aantal rechthebbenden dat geen inbreng heeft in blokdeel k en wel inbreng in blokdeel I. In de dendrogram is te zien welke blokdelen worden samengevoegd. De blokdelen zijn daarvoor horizontaal uitgezet en de waarden van het samenvoegingscriterium verticaal. Uiteindelijk leidt deze clustervorming tot twee clusters van 81 en 15 blokdelen. Het aantal rechthebben den met over en weer gebruik tussen die twee clusters is slechts drie. L0PIKERHfiflRD (MINBBL) BINflIR:2fl/2fl*B*CAVERAGE LINKAGE 00000210 279

Vorige Volgende