Integrale gegevensregistraties
Wat op te merken is over geïntegreerde informatie, is ook
van toepassing op geïntegreerde gegevensregistraties.
Bij het ontwerpen van gegevensbanken wordt met het
toenemen van het aantal entiteiten al snel een complexi
teit bereikt, die met de huidige informatietechnologie nog
maar nauwelijks is te beheersen. Een belangrijk aspect
van de huidige informatievoorziening is het gebruik van
relationele gegevensbankbeheerssystemen. Meer nog
dan bij andere gegevensbankconcepten speelt hier nor
malisatie van het gegevensmodel een belangrijke rol. Bij
complexe verbanden tussen gegevensgroepen leidt nor
maliseren tot grote aantallen entiteiten welke onderling
op veel manieren zijn geassocieerd. Deze associaties
leiden tot de nodige referenties die op zich weer aanlei
ding kunnen zijn tot entiteiten waarmee het onderlinge
verband als een relatie wordt vastgelegd.
Het aantal entiteiten dat een rol speelt bij het opvragen
van gegevens bepaalt in hoge mate de snelheid waarmee
gegevens beschikbaar komen. Veel entiteiten met ge
compliceerde, onderlinge referenties leiden tot lange ver
werkingstijden. Om deze problemen te voorkomen, wordt
na normalisatie het ontwerp van een gegevensbank weer
op onderdelen gedenormaliseerd. Met dit denormaliseren
worden echter extra condities geïntroduceerd om de inte
griteit van de registratie te waarborgen. Deze condities
beïnvloeden in belangrijke mate de snelheid van het
registreren. Een eenvoudig voorbeeld uit de vastgoed
wereld illustreert dit.
Normalisatie
Om gegevens in een gegevensbank eenduidig op te slaan,
wordt de structuur van de registratie genormaliseerd. Een
registratie is genormaliseerd als alle attributen maar één waar
de kunnen hebben en elk gespecificeerd gegevenselement
van een entiteit uitsluitend afhankelijk is van de gezamenlijke,
identificerende gegevenselementen van de entiteit. Om dat te
bereiken, wordt wel gesproken van normalisatiestappen die via
opeenvolgende normaalvormen leiden tot volledige norma
lisatie.
Bij het normaliseren van de kadastrale aanduiding wor
den de kadastrale gemeente, het objectnummer en het
objectindexnummer gescheiden in meerdere entiteiten,
waarbij de objectindexletter vervalt. Voor de objectindex-
nummers komen aparte entiteiten voor alle betekenissen
van de vervallen indexletter. Daarbij geldt de conditie dat
elk objectnummer moet verwijzen naar een kadastrale
gemeente, dat elke entiteit met het objectindexnummer
moet refereren aan één objectnummer en dat aan één
objectnummer ten hoogste één keer mag worden gerefe
reerd. Normalisatie levert dus zes entiteiten op met een
voudige condities, die uitsluitend betrekking hebben op
referentiële integriteit (fig. 2).
Zou de kadastrale aanduiding dan weer worden gedenor
maliseerd tot de oorspronkelijke vorm van een kadastrale
gemeente met sectieletter(s), objectnummer met index-
letter en eventueel een objectindexnummer, dan gelden
de volgende condities. De objectindexletter mag uitslui
tend de waarde A, B, D, F en G hebben en als deze index-
letter de waarde G heeft, mag het objectindexnummer
geen waarde hebben. Bij de overige waarden van de in
dexletter moet het indexnummer altijd een waarde heb
ben. Deze condities zijn een stuk complexer dan de drie
integriteitsregels in de genormaliseerde situatie. Zeker bij
gegevensbankbeheerssystemen die over vaste facilitei-
KADASTRALE AANDUIDING
kadastrale
sectie
object
index-
index
gemeente
letters
nummer
letter
nummer
niet-genormaliseerde registratie
KADASTRALE
GEMEENTE
OBJECT
NUMMER
kadastrale
gemeente
sectie
letters
BEKLEMMING
FYSIEK
COMPLEX
APPARTEMENT
object
nummer
genormaliseerde registratie
Fig. 2. Entiteiten en referenties, het begrip referentiële integriteit.
ten voor referentiële integriteit beschikken, betekenen
dergelijke condities veel extra programmeerwerk. (In dit
voorbeeld worden de begrippen uit het GFO Gemeente
kadaster gebruikt, die afwijken van het GFO Basis
registratie Vastgoed.)
Een andere mogelijkheid om een complexe gegevens
structuur te vereenvoudigen, is het terugbrengen van het
aantal entiteiten door middel van generalisatie. Speci
fieke entiteiten worden dan samengenomen in één be
grip, hetgeen leidt tot verlies aan semantiek. Dit is bijvoor
beeld het geval in het GFO Basisregistratie Vastgoed van
de VNG met de entiteit „terrein". Alle mogelijke terreinen
kunnen daarmee worden geregistreerd. In het GFO
Basisregistratie Vastgoed wordt het verlies aan seman
tiek voor de entiteit „terrein" opgevangen door het attri
buut „functie". Met de verschillende waarden van dit
attribuut ontstaan daarbij feitelijk verschillende entiteiten
(soorten van terreinen), terwijl de entiteit zonder dit attri
buut eigenlijk geen betekenis heeft. Dit hoeft op zich
geen bezwaar te zijn. Zodra er echter in een registratie
associaties tussen entiteiten door generalisatie afhanke
lijk zijn geworden van attribuutwaarden, heeft dit tot ge
volg dat er zeer complexe condities ontstaan. Bij genera
lisatie gaat de semantische inhoud van de entiteit, op
geslagen in het gegevenswoordenboek, als het ware over
naar de condities die in de vorm van integriteitsregels
worden vastgelegd. In het voorbeeld uit het GFO Basisre
gistratie Vastgoed zou het kunnen zijn, dat er voor terrei
nen met bepaalde functies specifieke eisen zijn te stellen
aan referenties tussen de basisregistratie en gelieerde
registraties. Deze condities zijn dan niet meer te formule
ren als een vorm van referentiële integriteit, maar leveren
voorwaarden op die, afhankelijk van de waarde van een
attribuut, moeten worden getest. Dit testen vraagt extra
programmatuur en daarmee ook tijd.
Als generaliseren leidt tot dit soort verschijnselen, is het
raadzaam daarmee terughoudend te zijn, daar dit slechts
schijnbaar leidt tot vereenvoudiging. Dit probleem speelt
ook de RAVI parten door het overnemen van het alge
mene begrip „terrein" uit het GFO Basisregistratie Vast-
16
NGT GEODESIA 92 - 1