Opslag van ruimtelijke gegevens in het relationele model De bestaande relationele databasetechnologie heeft duide lijke tekortkomingen wat betreft de efficiënte verwerking van multidimensionale gegevens. Er is nu een nieuwe tech nologie ontwikkeld, waarmee alle gegevens voor meerdere dimensies efficiënt kunnen worden beheerd binnen het relationele gegevensmodel zonder dat externe RDBMS- indices noodzakelijk zijn. Deze nieuwe technologie, die is toegepast in het pakket Oracle MultiDimension, gaat uit van een linearisatietechniek waarmee de ordening van ruimtelijke gegevens in de structuur van de gegevens zelf ligt besloten. Dit biedt belangrijke voordelen ten opzichte van bestaande GIS- of RDBMS-methoden. Gegevenstype HHCODE De basiseenheid waarmee ruimtelijke ordening in een database wordt onderhouden, is een nieuw gegevenstype waarmee meerdere dimensies gecodeerd worden vastgelegd in één getal. Deze waarde wordt opgeslagen in één kolom van een MultiDimension-tabel. Alle continue numerieke gegevens die binnen een gedefinieerd bereik vallen, kunnen Fig. 1. worden gecodeerd. In dit gegevenstype, Helical Hyper- Opslag van twee- spatial Code (HHCODE), worden alle gewenste dimensies dimensionale gecodeerd en lineair gemaakt. De code vertegenwoordigt gegevens in een het snijpunt van de dimensies. HHCODE is een algemeen relationele data- gegevenstype dat een applicatie-ontwerper naar behoefte base. kan aanpassen, ook voor het definiëren van dimensies die verder gaan dan het traditionele ruimte/tijd-paradigma. Het bevat alle dimensionale informatie als een binaire ge gevensstroom, met substring-vergelijkingen op basis van de waarden voor coördinaten voor de dimensies. Nadat gegevens zijn gecodeerd in HHCODE, worden ze op een voorspelbare wijze gegroepeerd. Ze worden ruimte lijk ingedeeld in de database, wat wil zeggen dat gegevens achter elkaar staan (clusters vormen) op basis van de gedefi- 114 nieerde dimensies. De gegevens zijn snel te benaderen door een proces van eliminatie van alle gegevens die buiten de grenzen van de gegevensopvraag vallen. Snelle accurate toegang tot gegevens Het combineren van de waarden van alle dimensies in één waarde biedt dui delijke voordelen ten opzichte van be staande relationele opslagmethoden, met name wat betreft accuratesse en snelheid. Voor de gebruikelijke RDBMS geldt bijvoorbeeld de eis dat multidimensionale gegevens worden opgeslagen in verschillende kolom men in de database. Dit bemoeilijkt zowel de toegang tot de gegevens als de analyse daarvan. Het voorbeeld in fig. 1 met twee dimensies maakt deze beperking duidelijk. De lengte- en breedtegraad van vier grote Noord- amerikaanse steden zijn opgeslagen in een RDBMS-tabel. Met een normale sortering van de ta- belgegevens, die met de basisfunctio naliteit van SQL slechts op één kolom tegelijkertijd gesorteerd kunnen wor den, wordt de ordening van de ruim telijke gegevens verstoord. Een sorte ring op breedtegraden geeft de foute indruk dat Minneapolis dichter hij Ottawa ligt dan Montreal. Dit sys teem werkt uitstekend voor afzonder lijke coördinaten, maar voor afstanden in een tweedimensionale ruimte zijn gedefinieerde sets van coördinaten- paren nodig, aangezien beide waarden even belangrijk zijn voor de positie bepaling van een punt. Als gegevens gesorteerd moeten wor den op onderlinge afstand, moet in beide kolommen voor de lengte- en breedtegraad tegelijk worden gezocht. In een Oracle MultiDimension-data- base hoeft in slechts één kolom met HHCODE-gegevens te worden ge zocht voor het juiste resultaat. Meer complexe bevragingen, zoals het selec teren van afzonderlijke gegevens bin nen tweedimensionale polygonen of driedimensionale lichamen, zijn nau welijks uit te voeren in het relationele model en kunnen niet in een relatio nele taal worden geformuleerd; er moeten geometrische bewerkingen 1996-3 NGT GEODESIA Ottawa Philadelphia LongfftK» Montreal 45'N 76'W Minneapolis 46 N 73'W 40'N 75'W 93'W

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

(NGT) Geodesia | 1996 | | pagina 24