b. Kwaliteitsonderzoek De kwaliteit van vastgoedinformatiesystemen blijkt in het alge meen niet al te hoog te zijn; in stedelijke gebieden is deze ongeveer 70 tot 80%. Verbetering van die kwaliteit kost veel geld, omdat niet alle fouten kunnen worden opgelost op het kantoor; speciale meetploegen moeten naar buiten om de juistheid van de gegevens te controleren. De eerste reactie van ambtenaren, als ze worden geconfronteerd met een bepaalde kwaliteit, is de neiging om deze te verbeteren. De vraag is echter of voor de uitoefening van de taken wel een betere kwaliteit nodig is. Met andere woorden, vaak is niet bekend met welke kwaliteit de ambtelijke taken zelf moeten worden uitge voerd. Een belangrijk aspect hierbij is de conversie van gegevens, dat wil zeggen, de omzetting van gegevens uit kaarten en registers naar geautomatiseerde gegevensbestanden. Deze conversie is verreweg het meest kostbare onderdeel van het automatiseringsproces. Deze kan daarom maar één keer worden uitgevoerd en als eenmaal de gegevensbank is gevuld met gege vens van matige kwaliteit, kan deze vrijwel niet meer worden ver beterd. Vaak worden de geautomatiseerde gegevens voor andere doelein den gebruikt dan waarvoor de oorspronkelijke gegevensbestanden waren bedoeld. Met behulp van geautomatiseerde gegevens bestanden kan bestuurlijke informatie worden verstrekt met infor matie over een langere tijdsperiode, over grotere gebiedseenheden e.d. Fouten in de bestanden gaan dan een heel andere rol spelen. Het volgende voorbeeld kan dit enigszins verduidelijken. In de kadastrale registratie komen minder belangrijke gegevens voor over eigenaren, zoals leeftijd, beroep, enz. Aan de kwaliteit van deze gegevens wordt nauwelijks aandacht besteed. Als straks statistische informatie wordt geleverd op basis van deze gege- venselementen, kunnen door de bestuurders volstrekt verkeerde conclusies worden getrokken. Landmeters weten, dat afbeeldin gen van punten en lijnen op een kaart kunnen afwijken van de werkelijkheid. Hun opleiding is zelfs voor een belangrijk deel ge oriënteerd in het omgaan met deze onnauwkeurigheden. Dezelfde problemen die zich voordoen in topografische bestanden, doen zich ook voor in gegevensbanken met administratieve gege vens. Het is veel moeilijker om achter deze problematiek te komen, omdat tegenover de buitenwereld graag de schijn wordt opgehou den dat de beslissingen of de uitvoering van taken gebaseerd zijn op gegevens van hoge kwaliteit. Bij de kwaliteit spelen verschillende aspecten een rol: Betrouwbaarheid. Dit is de kans, dat een fout in de gegevens bank kan worden gevonden. Als voorbeeld nemen we de ka dastrale registratie. Als in één van de registers een verkeerd perceelnummer wordt genoteerd, wordt het zeer moeilijk om de informatie uit verschillende registers en kaarten aan elkaar te koppelen. Ditzelfde geldt voor het leggerartikelnummer. Voor een foute schrijfwijze van een naam gelden verschillende criteria. Als de eerste letter van de achternaam fout is, kan een persoon op een verkeerde plek in een register terechtkomen. De volgende letter is voor dit probleem minder belangrijk, de volgende letter nog minder, enz. Of een leeftijd of een beroep verkeerd is ingevuld, is voor de betrouwbaarheid nauwelijks in teressant. Wij komen dan op het terrein van de precisie. Precisie. Precisie kan worden omschreven als de stochastische variabiliteit van de gegevens. Voor wat betreft coördinaten weten landmeters precies wat met dit begrip wordt bedoeld; minder bekend is dat precisie ook een rol speelt bij administra tieve bestanden. Voorbeelden zijn verkeerde schrijfwijze van namen, afrondingen van waarden, schrijffouten in leeftijden, enz. Actualiteit. Geautomatiseerde gegevensbestanden kunnen ge makkelijk aan elkaar worden gekoppeld. Daarbij is de verleiding groot bestanden met verschillende actualiteit te koppelen. Ac tualiteit is een moeilijk begrip. De kadastrale gegevens van een perceel uit 1900 kunnen zeer actueel zijn, als dit perceel nooit meer is verkocht, gesplitst of samengevoegd. Het is duidelijk, dat koppeling van informatiesystemen of gedeelten daarvan met verschillende actualiteit aanleiding geeft tot zeer moeilijke kwaliteitsbeschouwingen. Compleetheid. Soms is het de bedoeling, dat een systeem vol ledig compleet is in verband met het doel waarvoor het is op gezet. ledereen verwacht, dat een informatiesysteem voor onroerend-goedbelasting alle belastingobjecten bevat. Om de meest wonderlijke redenen ontbreken echter vaak elementen in informatiesystemen. Zo zag ik in stedelijke gebieden grote gaten in de informatiesystemen, omdat de gegevens waren gekoppeld aan het bouwjaar. Wanneer het bouwjaar is gedefi nieerd als het tijdstip waarop het gebouw wordt opgeleverd, dan komen veel gebouwen in een dergelijk systeem niet voor, omdat vele officiële opleveringsdata ontbreken. Relevantie. Voor de uitoefening van de taken zijn bepaalde gegevens meer of minder relevant. In bovengenoemde voor beelden werd getwijfeld aan de relevantie van de gegevens leeftijd en beroep van de kadastrale eigenaren. Moeilijker is het te bepalen of bijvoorbeeld op de Grootschalige Basiskaart van Nederland wel of niet hoogtelijnen zouden moeten voorkomen. Degeneratie van bestanden. Als één van de voordelen van geautomatiseerde topografische bestanden wordt wel gezegd, dat deze veel minder degenereren dan kaarten. Die kunnen namelijk rekken en krimpen en door het aanbrengen van cor recties snel in kwaliteit achteruitgaan. Volgens mij is hier nooit een goed onderzoek naar gedaan. Uit de literatuur is wel be kend, dat administratieve gegevensbanken vrij snel kunnen de genereren door het invoeren van foute gegevens en door het maken van fouten bij de invoer van goede gegevens. Ook in de vastgoedinformatiesystemen zou onderzoek naar dergelijke aspecten op haar plaats zijn. c. Structurering van de gegevens Tot nu toe is gesproken over de inhoud van de gegevensbank met vastgoedinformatie met behulp van de basisregistraties. Daarnaast kwamen het classificeren van de gegevens en de kwaliteit aan de orde. Heel belangrijk voor een gegevensbank is de structurering van de gegevens. Deze bepaalt welke antwoorden door het infor matiesysteem kunnen worden gegeven, alsmede de manier waar op en de snelheid waarmee dit gebeurt. Hoewel we met de struc turering het gebied van de bestuurlijke informatica betreden, is dit toch in belangrijke mate een taak voor de vakspecialisten (landme ters, kartografen, enz.), omdat zij weten welke vragen moeten kunnen worden beantwoord met het systeem. Bij de structurering gaat het om twee typen gegevens: entities" en occurences". Voor deze Engelse benamingen bestaan eigen lijk nog geen goede Nederlandse begrippen, hoewel het woord en titeiten meer en meer wordt gebruikt. Entities kunnen het best worden omschreven als betekenisvolle eenheden, zoals kadastrale percelen, rechthebbenden, zakelijke rechten, gebouwen, enz. Een occurence is een verschijningsvorm van een entity, bijvoorbeeld het kadastrale perceel gemeente Delft, sectie A, no. 1618. Het structureren van de entities kan een zeer bewerkelijke activiteit zijn, als het om een grote gegevensbank gaat. In de AKR zijn onge veer 80 entities opgenomen. Iedere entity kan een relatie hebben met alle andere. Dit betekent, dat de informatie-analisten ongeveer 802 relaties moeten bekijken om te zien of deze in de gegevens bank moeten worden gerealiseerd. Voor het structureren zijn bepaalde technieken voorhanden. De oudste techniek, die overigens nog pas sinds 1971 bestaat, is het hiërarchisch structureren. Omdat niet alle situaties in de werkelijk heid hiërarchisch zijn, is een nieuwe structuur ingevoerd, de zgn. relationele gegevensbank. Dit is niet anders dan een stelsel van tabellen, die via een zgn. normalisatieproces tot stand zijn ge komen. Voor het hiërarchisch structureren en het normaliseren verwijs ik gemakshalve naar de informatica-handboeken. Omdat aan beide manieren van structureren voor- en nadelen zitten, zien we dat vaak een combinatie van methoden wordt toegepast. Bij de vastgoedinformatie is de zaak in zoverre gecompliceerd, dat wij te maken hebben met administratieve gegevensbanken en met systemen waarin grafische gegevens zijn opgeslagen. Hoewel dit door sommige producenten of gebruikers van gegevensbanken wordt gesuggereerd, bestaat er nog geen integrale (relationele) gegevensbank voor zowel administratieve als grafische gegevens. Er zijn systemen die een zekere koppeling vertonen. Men kan dan bijvoorbeeld vragen wie de eigenaar is van een bepaald perceel, als men dit perceel aanwijst op een grafisch beeldscherm. Deze vraagstelling is echter zo beperkt, dat dit niet onder de categorie moderne gegevensbanken valt. Ik ben zo langzamerhand tot de conclusie gekomen, dat het de moeite niet loont om te streven naar geïntegreerde gegevensban ken met administratieve en grafische vastgoedgegevens. Dit bete kent, dat er nog een derde categorie gegevens bijkomt, die moet worden gestructureerd. Dit zijn de koppelingselementen tussen de beide soorten gegevensbanken. De bekendste koppelingselemen ten zijn: coördinaten (plaatscoördinaten of coördinaten die de vastgoedobjecten beschrijven), lijnsegmenten en vierkanten. Nu enige tijd is gewerkt met deze koppelingsgegevens, blijkt dat het aanvankelijke optimisme over lijnsegmenten iets aan het afne men is, omdat hiermee toch zeer moeilijk de grootschalige topo grafie kan worden gekoppeld aan administratieve bestanden. De opbouw van gegevensbanken met grootschalige topografie komt nu pas op gang. Tot nu toe was eigenlijk alleen sprake van digitale kaartvervaardiging. In het volgende hoofdstuk kom ik in het kort nog op deze problematiek terug. Naast de structuur van de gegevens in de informatiesystemen, hebben we nu te maken met het verschijnsel dat gegevensbanken meer en meer centraal worden gerealiseerd. Een belangrijke taak NGT GEODESIA 88 57

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

(NGT) Geodesia | 1988 | | pagina 5