Opslag van ruimtelijke gegevens in het
relationele model
De bestaande relationele databasetechnologie heeft duide
lijke tekortkomingen wat betreft de efficiënte verwerking
van multidimensionale gegevens. Er is nu een nieuwe tech
nologie ontwikkeld, waarmee alle gegevens voor meerdere
dimensies efficiënt kunnen worden beheerd binnen het
relationele gegevensmodel zonder dat externe RDBMS-
indices noodzakelijk zijn. Deze nieuwe technologie, die is
toegepast in het pakket Oracle MultiDimension, gaat uit
van een linearisatietechniek waarmee de ordening van
ruimtelijke gegevens in de structuur van de gegevens zelf
ligt besloten. Dit biedt belangrijke voordelen ten opzichte
van bestaande GIS- of RDBMS-methoden.
Gegevenstype HHCODE
De basiseenheid waarmee ruimtelijke ordening in een
database wordt onderhouden, is een nieuw gegevenstype
waarmee meerdere dimensies gecodeerd worden vastgelegd
in één getal. Deze waarde wordt opgeslagen in één kolom
van een MultiDimension-tabel. Alle continue numerieke
gegevens die binnen een gedefinieerd bereik vallen, kunnen Fig. 1.
worden gecodeerd. In dit gegevenstype, Helical Hyper- Opslag van twee-
spatial Code (HHCODE), worden alle gewenste dimensies dimensionale
gecodeerd en lineair gemaakt. De code vertegenwoordigt gegevens in een
het snijpunt van de dimensies. HHCODE is een algemeen relationele data-
gegevenstype dat een applicatie-ontwerper naar behoefte base.
kan aanpassen, ook voor het definiëren van dimensies die
verder gaan dan het traditionele ruimte/tijd-paradigma.
Het bevat alle dimensionale informatie als een binaire ge
gevensstroom, met substring-vergelijkingen op basis van de
waarden voor coördinaten voor de dimensies.
Nadat gegevens zijn gecodeerd in HHCODE, worden ze
op een voorspelbare wijze gegroepeerd. Ze worden ruimte
lijk ingedeeld in de database, wat wil zeggen dat gegevens
achter elkaar staan (clusters vormen) op basis van de gedefi-
114
nieerde dimensies. De gegevens zijn
snel te benaderen door een proces van
eliminatie van alle gegevens die buiten
de grenzen van de gegevensopvraag
vallen.
Snelle accurate toegang
tot gegevens
Het combineren van de waarden van
alle dimensies in één waarde biedt dui
delijke voordelen ten opzichte van be
staande relationele opslagmethoden,
met name wat betreft accuratesse en
snelheid. Voor de gebruikelijke
RDBMS geldt bijvoorbeeld de eis dat
multidimensionale gegevens worden
opgeslagen in verschillende kolom
men in de database. Dit bemoeilijkt
zowel de toegang tot de gegevens als
de analyse daarvan. Het voorbeeld in
fig. 1 met twee dimensies maakt deze
beperking duidelijk. De lengte- en
breedtegraad van vier grote Noord-
amerikaanse steden zijn opgeslagen in
een RDBMS-tabel.
Met een normale sortering van de ta-
belgegevens, die met de basisfunctio
naliteit van SQL slechts op één kolom
tegelijkertijd gesorteerd kunnen wor
den, wordt de ordening van de ruim
telijke gegevens verstoord. Een sorte
ring op breedtegraden geeft de foute
indruk dat Minneapolis dichter hij
Ottawa ligt dan Montreal. Dit sys
teem werkt uitstekend voor afzonder
lijke coördinaten, maar voor afstanden
in een tweedimensionale ruimte zijn
gedefinieerde sets van coördinaten-
paren nodig, aangezien beide waarden
even belangrijk zijn voor de positie
bepaling van een punt.
Als gegevens gesorteerd moeten wor
den op onderlinge afstand, moet in
beide kolommen voor de lengte- en
breedtegraad tegelijk worden gezocht.
In een Oracle MultiDimension-data-
base hoeft in slechts één kolom met
HHCODE-gegevens te worden ge
zocht voor het juiste resultaat. Meer
complexe bevragingen, zoals het selec
teren van afzonderlijke gegevens bin
nen tweedimensionale polygonen of
driedimensionale lichamen, zijn nau
welijks uit te voeren in het relationele
model en kunnen niet in een relatio
nele taal worden geformuleerd; er
moeten geometrische bewerkingen
1996-3
NGT GEODESIA
Ottawa
Philadelphia
LongfftK»
Montreal
45'N
76'W
Minneapolis
46 N
73'W
40'N
75'W
93'W