Gegevensbanken
Dit zijn verzamelingen van gegevens. Net zo min als bij de vorige
term zal ik hier een definitie geven van deze term. In plaats van de
ene symboolcombinatie te vervangen door een meer omvangrijke,
geef ik er de voorkeur aan het begrip gegevensbanken inductief te
verduidelijken door er een aantal op te sommen waarmee u be
kend mag worden verondersteld (fig. 3):
GEGEVENSBANKEN
veldwerkarchief
meetboekje
openbare registers
kadastrale leggers
GBKN
bevolkingsregister
Fig. 3.
Dit zijn allemaal verzamelingen van iets dat in het spraakgebruik
gegevens, informatie of data wordt genoemd. Binnen de informati
ca (zie hierna) is inmiddels de behoefte ontstaan om het woord
gebruik iets aan te scherpen door de termen „gegevens" en „in
formatie" in relatie tot elkaar preciezer te definiëren, waarbij ech
ter nauwelijks relatie is gezocht met de wiskundige definities op dit
punt. Het resultaat is een aantal uiteenlopende en onderling niet
consistente omschrijvingen, die hoofdzakelijk overeenstemmen op
het punt dat gegevens nodig zijn om informatie te verkrijgen. Er
wordt echter voorbijgegaan aan het voor de informatica belangrij
ker feit, dat er veel informatie nodig is om een gegeven te ver
krijgen.
Technologie
Met de term technologie wordt gerefereerd aan de materiële vorm,
waarin de gegevensverzamelingen zich manifesteren en de rand
voorwaarden, die deze vorm oplegt aan de mogelijkheden tot het
manipuleren van de gegevensverzamelingen. Vooral dit laatste is
belangrijk. Gegevensverzamelingen ontlenen hun bestaansrecht
aan de wens tot manipuleren. Zij dienen om beperkingen die de
werkelijkheid ons oplegt met betrekking tot tijd en plaats, te door
breken. „Gegevens" horen bij „dingen", maar zijn ervan losge
maakt. In laatste instantie zijn de „dingen" hun eigen gegevens
bank. Dezelfde voordelen die gegevensbanken hebben ten opzich
te van de werkelijkheid, hebben zij voor de communicatie: een ge
gevensbank maakt communicatie mogelijk zonder beperkingen
van tijd en ruimte. De prijs die hiervoor moet worden betaald,
bestaat uit het ontaarden van oorspronkelijke dialogen in series
monologen. Zoals ik eerder heb betoogd, houdt dit risico's in voor
het correct overkomen van de boodschap. Als voorbeelden van
verschillende soorten informatietechnologie kunnen worden ge
noemd: Stonehenge, een topografische kaart, een knoop in een
zakdoek.
Informatica
Hoewel in het kader van deze lezing dit het minst belangrijke
woord van de titel is, mag het vanwege zijn psychologische lading
niet worden gemist. Over de juiste inhoud van het begrip zal wor
den gediscussieerd, totdat het geld uit de informatica stimulerings
plan-pot op is. In het kader van deze lezing verwijst de term naar
een nieuwe (ongeveer 40 jaar oude) technologie die met betrek
king tot gegevensverzamelingen van belang is.
In het voorgaande is de technologie van de gegevensbanken ver
bijzonderd, omdat dit aspect de afgelopen decennia het meest
ingrijpend is veranderd. Voor het overige zijn de kenmerken van
gegevensbanken hetzelfde gebleven. Hieruit volgt, dat de functies
die welke technologie dan ook ten behoeve van gegevensbanken
moet ondersteunen, eveneens onveranderd zijn gebleven. Gege
vens moeten kunnen worden bewaard; een verzameling van op
geslagen gegevens moet kunnen worden uitgebreid of ingekrom
pen; de onderlinge consistentie van de gegevens moet gewaar
borgd blijven naast de juistheid van de individuele gegevens. Kort
om, de eisen die de afgelopen eeuwen aan gegevensverzamelin
gen zijn gesteld, blijven bij deze nieuwe technologie ongewijzigd
en zullen voor de rest van deze voordracht als bekend worden ver
ondersteld. De meerwaarde van de gecomputeriseerde technolo
gie moet worden gevonden in het feit dat gegevensverzamelingen
goedkoper en/of sneller kunnen worden gemanipuleerd, dat hier
door bestaande verzamelingen voor nieuwe doeleinden kunnen
worden ingezet, of dat het economisch verantwoord wordt nieu
we gegevensverzamelingen op te zetten.
Voordat ik overga tot een nadere analyse van het verschil tussen
de conventionele gegevensbanktechnologie en de informatica, wil
ik eerst nog een paar opmerkingen kwijt over de verschillende
functies die de technologie moet vervullen met betrekking tot
gegevensbanken; deze zijn opgesomd in fig. 4. De functies „toe
voegen", „wijzigen" en „verwijderen" zijn triviaal met betrekking
tot het gebruik van een gegevensbank en kunnen vanuit dit ge
zichtspunt onder één noemer worden gebracht. Vanuit de integri
teit van de gegevensverzameling zijn het allesbehalve gelijksoorti
ge functies. Is het bij een „toevoeging" redelijk eenvoudig vast te
stellen dat de inhoud van de gegevensverzameling niet gecorrum
peerd is, bij „wijziging" of „verwijdering" kan zo'n vaststelling
heel wat voeten in de aarde hebben. Bij het gebruik van gegevens
verzamelingen of de toepassing van de informatica hierop, wordt
dit verschil niet altijd voldoende onderkend. Hetzelfde geldt voor
de volgende twee functies, het „opslaan" en het „relateren", die
middels een technologie moeten worden geïmplementeerd. Op
slaan is eenvoudig. Het opslaan in relatie tot de omgeving levert
heel wat problemen op. Ook met dit onderscheid wordt bij het ont
werpen en implementeren van gegevensbanken te optimistisch
omgesprongen met als direct gevolg de verspilling van veel geld,
tijd en reputaties. Het mag dan ook geen verbazing wekken, dat
de meeste eer valt te behalen met de overgebleven functies „se
lecteren" en „presenteren". Zowel in de oude als nieuwe techno
logie moeten deze functies het hele produkt verkopen en het lukt
helaas ook nog.
FUNCTIES
toevoegen
wijzigen
verwijderen
opslaan
relateren
selecteren
presenteren
Fig. 4.
Steeds spectaculairdere presentatieprogramma's verschijnen op
de markt, waarbij impliciet wordt gesuggereerd dat de minder
zichtbare overige functies van het pakket van eenzelfde kwaliteit
zijn. Dat dit geen specifiek informaticaprobleem is, kan het best
worden geïllustreerd door een verwijzing naar de produkten van de
vroegere en de meer recente kartografie. Ik heb vaker de topogra
fische kaart van Zwitserland dan van het Hollands-Utrechtse veen-
weidegebied als behang dienst zien doen.
Om het verschil tussen de conventionele en de nieuwe gegevens
banktechnologie zo duidelijk mogelijk aan te geven in termen van
gevolgen voor de gebruiker, maak ik gebruik van het eerder aange
geven onderscheid tussen opslag en presentatie, tussen geheu
genmedium en presentatiemedium. Onder opslag versta ik het be
waren van de inhoud van gegevensverzamelingen, onder presen
tatie het zichtbaar maken van deze inhoud.
De eerste opmerking die kan worden gemaakt, is dat de wijze van
presentatie bij beide technologieën dezelfde is: kleurveranderingen
en de vorm van symbolensets op min of meer platte oppervlakken.
Deze constatering heeft weinig schokkends. De presentatievorm
is tenslotte de interface met de gebruiker van de gegevensbank en
deze is niet merkbaar veranderd met betrekking tot de hem ter be
schikking staande zintuigen.
Het verschil tussen de twee technologieën moet derhalve worden
gevonden in de opslag. Het opslagmedium van de conventionele
gegevensbanktechnologie wordt gevormd door de eerdergenoem
de platte oppervlakken. Verzamelingen van deze oppervlakken
kunnen worden gebundeld tot grotere eenheden als boeken, leg
gers, mappen, kaartenbakken en verder tot kasten, bibliotheken en
archieven. De nieuwe technologie stelt hier oppervlakken tegen
over, voorzien van elementen die in slechts twee toestanden kun
nen verkeren, meestal aangegeven door de symbolen 0 en 1, wel
ke machinaal (computer) kunnen worden aangebracht en herkend.
Binnen deze technologie kunnen weer onderverdelingen worden
aangebracht met betrekking tot de wijze van vastlegging:
magnetisch (tapes, disks, floppies)
optisch (CD-ROM, beeldplaat)
solid state (RAM, ROM, EPROM).
Voor de verdere voordracht zijn de fysieke verschillen tussen de
twee technologieën niet van belang. Wat mijns inziens wel van
groot belang is, is het verschil in relatie tussen opslag en presenta
tie bij de twee technologieën en de gevolgen die dit heeft voor het
omgaan met gegevensbanken. Dit is te zien in fig. 5.
164
NGT GEODESIA 88