b. Kwaliteitsonderzoek
De kwaliteit van vastgoedinformatiesystemen blijkt in het alge
meen niet al te hoog te zijn; in stedelijke gebieden is deze ongeveer
70 tot 80%. Verbetering van die kwaliteit kost veel geld, omdat
niet alle fouten kunnen worden opgelost op het kantoor; speciale
meetploegen moeten naar buiten om de juistheid van de gegevens
te controleren.
De eerste reactie van ambtenaren, als ze worden geconfronteerd
met een bepaalde kwaliteit, is de neiging om deze te verbeteren.
De vraag is echter of voor de uitoefening van de taken wel een
betere kwaliteit nodig is. Met andere woorden, vaak is niet bekend
met welke kwaliteit de ambtelijke taken zelf moeten worden uitge
voerd. Een belangrijk aspect hierbij is de conversie van gegevens,
dat wil zeggen, de omzetting van gegevens uit kaarten en registers
naar geautomatiseerde gegevensbestanden.
Deze conversie is verreweg het meest kostbare onderdeel van het
automatiseringsproces. Deze kan daarom maar één keer worden
uitgevoerd en als eenmaal de gegevensbank is gevuld met gege
vens van matige kwaliteit, kan deze vrijwel niet meer worden ver
beterd.
Vaak worden de geautomatiseerde gegevens voor andere doelein
den gebruikt dan waarvoor de oorspronkelijke gegevensbestanden
waren bedoeld. Met behulp van geautomatiseerde gegevens
bestanden kan bestuurlijke informatie worden verstrekt met infor
matie over een langere tijdsperiode, over grotere gebiedseenheden
e.d. Fouten in de bestanden gaan dan een heel andere rol spelen.
Het volgende voorbeeld kan dit enigszins verduidelijken.
In de kadastrale registratie komen minder belangrijke gegevens
voor over eigenaren, zoals leeftijd, beroep, enz. Aan de kwaliteit
van deze gegevens wordt nauwelijks aandacht besteed. Als straks
statistische informatie wordt geleverd op basis van deze gege-
venselementen, kunnen door de bestuurders volstrekt verkeerde
conclusies worden getrokken. Landmeters weten, dat afbeeldin
gen van punten en lijnen op een kaart kunnen afwijken van de
werkelijkheid. Hun opleiding is zelfs voor een belangrijk deel ge
oriënteerd in het omgaan met deze onnauwkeurigheden.
Dezelfde problemen die zich voordoen in topografische bestanden,
doen zich ook voor in gegevensbanken met administratieve gege
vens. Het is veel moeilijker om achter deze problematiek te komen,
omdat tegenover de buitenwereld graag de schijn wordt opgehou
den dat de beslissingen of de uitvoering van taken gebaseerd zijn
op gegevens van hoge kwaliteit.
Bij de kwaliteit spelen verschillende aspecten een rol:
Betrouwbaarheid. Dit is de kans, dat een fout in de gegevens
bank kan worden gevonden. Als voorbeeld nemen we de ka
dastrale registratie. Als in één van de registers een verkeerd
perceelnummer wordt genoteerd, wordt het zeer moeilijk om
de informatie uit verschillende registers en kaarten aan elkaar
te koppelen. Ditzelfde geldt voor het leggerartikelnummer.
Voor een foute schrijfwijze van een naam gelden verschillende
criteria. Als de eerste letter van de achternaam fout is, kan een
persoon op een verkeerde plek in een register terechtkomen.
De volgende letter is voor dit probleem minder belangrijk, de
volgende letter nog minder, enz. Of een leeftijd of een beroep
verkeerd is ingevuld, is voor de betrouwbaarheid nauwelijks in
teressant. Wij komen dan op het terrein van de precisie.
Precisie. Precisie kan worden omschreven als de stochastische
variabiliteit van de gegevens. Voor wat betreft coördinaten
weten landmeters precies wat met dit begrip wordt bedoeld;
minder bekend is dat precisie ook een rol speelt bij administra
tieve bestanden. Voorbeelden zijn verkeerde schrijfwijze van
namen, afrondingen van waarden, schrijffouten in leeftijden,
enz.
Actualiteit. Geautomatiseerde gegevensbestanden kunnen ge
makkelijk aan elkaar worden gekoppeld. Daarbij is de verleiding
groot bestanden met verschillende actualiteit te koppelen. Ac
tualiteit is een moeilijk begrip. De kadastrale gegevens van een
perceel uit 1900 kunnen zeer actueel zijn, als dit perceel nooit
meer is verkocht, gesplitst of samengevoegd. Het is duidelijk,
dat koppeling van informatiesystemen of gedeelten daarvan
met verschillende actualiteit aanleiding geeft tot zeer moeilijke
kwaliteitsbeschouwingen.
Compleetheid. Soms is het de bedoeling, dat een systeem vol
ledig compleet is in verband met het doel waarvoor het is op
gezet. ledereen verwacht, dat een informatiesysteem voor
onroerend-goedbelasting alle belastingobjecten bevat. Om de
meest wonderlijke redenen ontbreken echter vaak elementen
in informatiesystemen. Zo zag ik in stedelijke gebieden grote
gaten in de informatiesystemen, omdat de gegevens waren
gekoppeld aan het bouwjaar. Wanneer het bouwjaar is gedefi
nieerd als het tijdstip waarop het gebouw wordt opgeleverd,
dan komen veel gebouwen in een dergelijk systeem niet voor,
omdat vele officiële opleveringsdata ontbreken.
Relevantie. Voor de uitoefening van de taken zijn bepaalde
gegevens meer of minder relevant. In bovengenoemde voor
beelden werd getwijfeld aan de relevantie van de gegevens
leeftijd en beroep van de kadastrale eigenaren. Moeilijker is het
te bepalen of bijvoorbeeld op de Grootschalige Basiskaart van
Nederland wel of niet hoogtelijnen zouden moeten voorkomen.
Degeneratie van bestanden. Als één van de voordelen van
geautomatiseerde topografische bestanden wordt wel gezegd,
dat deze veel minder degenereren dan kaarten. Die kunnen
namelijk rekken en krimpen en door het aanbrengen van cor
recties snel in kwaliteit achteruitgaan. Volgens mij is hier nooit
een goed onderzoek naar gedaan. Uit de literatuur is wel be
kend, dat administratieve gegevensbanken vrij snel kunnen de
genereren door het invoeren van foute gegevens en door het
maken van fouten bij de invoer van goede gegevens. Ook in
de vastgoedinformatiesystemen zou onderzoek naar dergelijke
aspecten op haar plaats zijn.
c. Structurering van de gegevens
Tot nu toe is gesproken over de inhoud van de gegevensbank met
vastgoedinformatie met behulp van de basisregistraties. Daarnaast
kwamen het classificeren van de gegevens en de kwaliteit aan de
orde. Heel belangrijk voor een gegevensbank is de structurering
van de gegevens. Deze bepaalt welke antwoorden door het infor
matiesysteem kunnen worden gegeven, alsmede de manier waar
op en de snelheid waarmee dit gebeurt. Hoewel we met de struc
turering het gebied van de bestuurlijke informatica betreden, is dit
toch in belangrijke mate een taak voor de vakspecialisten (landme
ters, kartografen, enz.), omdat zij weten welke vragen moeten
kunnen worden beantwoord met het systeem.
Bij de structurering gaat het om twee typen gegevens: entities"
en occurences". Voor deze Engelse benamingen bestaan eigen
lijk nog geen goede Nederlandse begrippen, hoewel het woord en
titeiten meer en meer wordt gebruikt. Entities kunnen het best
worden omschreven als betekenisvolle eenheden, zoals kadastrale
percelen, rechthebbenden, zakelijke rechten, gebouwen, enz. Een
occurence is een verschijningsvorm van een entity, bijvoorbeeld
het kadastrale perceel gemeente Delft, sectie A, no. 1618. Het
structureren van de entities kan een zeer bewerkelijke activiteit
zijn, als het om een grote gegevensbank gaat. In de AKR zijn onge
veer 80 entities opgenomen. Iedere entity kan een relatie hebben
met alle andere. Dit betekent, dat de informatie-analisten ongeveer
802 relaties moeten bekijken om te zien of deze in de gegevens
bank moeten worden gerealiseerd.
Voor het structureren zijn bepaalde technieken voorhanden. De
oudste techniek, die overigens nog pas sinds 1971 bestaat, is het
hiërarchisch structureren. Omdat niet alle situaties in de werkelijk
heid hiërarchisch zijn, is een nieuwe structuur ingevoerd, de zgn.
relationele gegevensbank. Dit is niet anders dan een stelsel van
tabellen, die via een zgn. normalisatieproces tot stand zijn ge
komen. Voor het hiërarchisch structureren en het normaliseren
verwijs ik gemakshalve naar de informatica-handboeken. Omdat
aan beide manieren van structureren voor- en nadelen zitten, zien
we dat vaak een combinatie van methoden wordt toegepast.
Bij de vastgoedinformatie is de zaak in zoverre gecompliceerd, dat
wij te maken hebben met administratieve gegevensbanken en met
systemen waarin grafische gegevens zijn opgeslagen. Hoewel dit
door sommige producenten of gebruikers van gegevensbanken
wordt gesuggereerd, bestaat er nog geen integrale (relationele)
gegevensbank voor zowel administratieve als grafische gegevens.
Er zijn systemen die een zekere koppeling vertonen. Men kan dan
bijvoorbeeld vragen wie de eigenaar is van een bepaald perceel, als
men dit perceel aanwijst op een grafisch beeldscherm. Deze
vraagstelling is echter zo beperkt, dat dit niet onder de categorie
moderne gegevensbanken valt.
Ik ben zo langzamerhand tot de conclusie gekomen, dat het de
moeite niet loont om te streven naar geïntegreerde gegevensban
ken met administratieve en grafische vastgoedgegevens. Dit bete
kent, dat er nog een derde categorie gegevens bijkomt, die moet
worden gestructureerd. Dit zijn de koppelingselementen tussen de
beide soorten gegevensbanken. De bekendste koppelingselemen
ten zijn: coördinaten (plaatscoördinaten of coördinaten die de
vastgoedobjecten beschrijven), lijnsegmenten en vierkanten.
Nu enige tijd is gewerkt met deze koppelingsgegevens, blijkt dat
het aanvankelijke optimisme over lijnsegmenten iets aan het afne
men is, omdat hiermee toch zeer moeilijk de grootschalige topo
grafie kan worden gekoppeld aan administratieve bestanden. De
opbouw van gegevensbanken met grootschalige topografie komt
nu pas op gang. Tot nu toe was eigenlijk alleen sprake van digitale
kaartvervaardiging. In het volgende hoofdstuk kom ik in het kort
nog op deze problematiek terug.
Naast de structuur van de gegevens in de informatiesystemen,
hebben we nu te maken met het verschijnsel dat gegevensbanken
meer en meer centraal worden gerealiseerd. Een belangrijke taak
NGT GEODESIA 88
57