Integrale gegevensregistraties Wat op te merken is over geïntegreerde informatie, is ook van toepassing op geïntegreerde gegevensregistraties. Bij het ontwerpen van gegevensbanken wordt met het toenemen van het aantal entiteiten al snel een complexi teit bereikt, die met de huidige informatietechnologie nog maar nauwelijks is te beheersen. Een belangrijk aspect van de huidige informatievoorziening is het gebruik van relationele gegevensbankbeheerssystemen. Meer nog dan bij andere gegevensbankconcepten speelt hier nor malisatie van het gegevensmodel een belangrijke rol. Bij complexe verbanden tussen gegevensgroepen leidt nor maliseren tot grote aantallen entiteiten welke onderling op veel manieren zijn geassocieerd. Deze associaties leiden tot de nodige referenties die op zich weer aanlei ding kunnen zijn tot entiteiten waarmee het onderlinge verband als een relatie wordt vastgelegd. Het aantal entiteiten dat een rol speelt bij het opvragen van gegevens bepaalt in hoge mate de snelheid waarmee gegevens beschikbaar komen. Veel entiteiten met ge compliceerde, onderlinge referenties leiden tot lange ver werkingstijden. Om deze problemen te voorkomen, wordt na normalisatie het ontwerp van een gegevensbank weer op onderdelen gedenormaliseerd. Met dit denormaliseren worden echter extra condities geïntroduceerd om de inte griteit van de registratie te waarborgen. Deze condities beïnvloeden in belangrijke mate de snelheid van het registreren. Een eenvoudig voorbeeld uit de vastgoed wereld illustreert dit. Normalisatie Om gegevens in een gegevensbank eenduidig op te slaan, wordt de structuur van de registratie genormaliseerd. Een registratie is genormaliseerd als alle attributen maar één waar de kunnen hebben en elk gespecificeerd gegevenselement van een entiteit uitsluitend afhankelijk is van de gezamenlijke, identificerende gegevenselementen van de entiteit. Om dat te bereiken, wordt wel gesproken van normalisatiestappen die via opeenvolgende normaalvormen leiden tot volledige norma lisatie. Bij het normaliseren van de kadastrale aanduiding wor den de kadastrale gemeente, het objectnummer en het objectindexnummer gescheiden in meerdere entiteiten, waarbij de objectindexletter vervalt. Voor de objectindex- nummers komen aparte entiteiten voor alle betekenissen van de vervallen indexletter. Daarbij geldt de conditie dat elk objectnummer moet verwijzen naar een kadastrale gemeente, dat elke entiteit met het objectindexnummer moet refereren aan één objectnummer en dat aan één objectnummer ten hoogste één keer mag worden gerefe reerd. Normalisatie levert dus zes entiteiten op met een voudige condities, die uitsluitend betrekking hebben op referentiële integriteit (fig. 2). Zou de kadastrale aanduiding dan weer worden gedenor maliseerd tot de oorspronkelijke vorm van een kadastrale gemeente met sectieletter(s), objectnummer met index- letter en eventueel een objectindexnummer, dan gelden de volgende condities. De objectindexletter mag uitslui tend de waarde A, B, D, F en G hebben en als deze index- letter de waarde G heeft, mag het objectindexnummer geen waarde hebben. Bij de overige waarden van de in dexletter moet het indexnummer altijd een waarde heb ben. Deze condities zijn een stuk complexer dan de drie integriteitsregels in de genormaliseerde situatie. Zeker bij gegevensbankbeheerssystemen die over vaste facilitei- KADASTRALE AANDUIDING kadastrale sectie object index- index gemeente letters nummer letter nummer niet-genormaliseerde registratie KADASTRALE GEMEENTE OBJECT NUMMER kadastrale gemeente sectie letters BEKLEMMING FYSIEK COMPLEX APPARTEMENT object nummer genormaliseerde registratie Fig. 2. Entiteiten en referenties, het begrip referentiële integriteit. ten voor referentiële integriteit beschikken, betekenen dergelijke condities veel extra programmeerwerk. (In dit voorbeeld worden de begrippen uit het GFO Gemeente kadaster gebruikt, die afwijken van het GFO Basis registratie Vastgoed.) Een andere mogelijkheid om een complexe gegevens structuur te vereenvoudigen, is het terugbrengen van het aantal entiteiten door middel van generalisatie. Speci fieke entiteiten worden dan samengenomen in één be grip, hetgeen leidt tot verlies aan semantiek. Dit is bijvoor beeld het geval in het GFO Basisregistratie Vastgoed van de VNG met de entiteit „terrein". Alle mogelijke terreinen kunnen daarmee worden geregistreerd. In het GFO Basisregistratie Vastgoed wordt het verlies aan seman tiek voor de entiteit „terrein" opgevangen door het attri buut „functie". Met de verschillende waarden van dit attribuut ontstaan daarbij feitelijk verschillende entiteiten (soorten van terreinen), terwijl de entiteit zonder dit attri buut eigenlijk geen betekenis heeft. Dit hoeft op zich geen bezwaar te zijn. Zodra er echter in een registratie associaties tussen entiteiten door generalisatie afhanke lijk zijn geworden van attribuutwaarden, heeft dit tot ge volg dat er zeer complexe condities ontstaan. Bij genera lisatie gaat de semantische inhoud van de entiteit, op geslagen in het gegevenswoordenboek, als het ware over naar de condities die in de vorm van integriteitsregels worden vastgelegd. In het voorbeeld uit het GFO Basisre gistratie Vastgoed zou het kunnen zijn, dat er voor terrei nen met bepaalde functies specifieke eisen zijn te stellen aan referenties tussen de basisregistratie en gelieerde registraties. Deze condities zijn dan niet meer te formule ren als een vorm van referentiële integriteit, maar leveren voorwaarden op die, afhankelijk van de waarde van een attribuut, moeten worden getest. Dit testen vraagt extra programmatuur en daarmee ook tijd. Als generaliseren leidt tot dit soort verschijnselen, is het raadzaam daarmee terughoudend te zijn, daar dit slechts schijnbaar leidt tot vereenvoudiging. Dit probleem speelt ook de RAVI parten door het overnemen van het alge mene begrip „terrein" uit het GFO Basisregistratie Vast- 16 NGT GEODESIA 92 - 1

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

(NGT) Geodesia | 1992 | | pagina 18