taalanalyse" steeds vaker valt, is een beweging in de goede rich
ting. Ik keer nog even terug naar de drie geheugenstructuren zoals
deze in de opsomming voorkomen.
Bij de zogenaamde hiërarchische gegevensbanken is het geheugen
organisatorisch opgedeeld in bladen, regels enz. De geheugenop-
bouw simuleert een conventionele informatiedrager zoals een
boek. Deze structuur heeft zijn beperkingen voor de logische gege-
vensmanipulatie. Tot op zekere hoogte zijn deze beperkingen te
omzeilen via programmatuur. De prijs die hiervoor moet worden
betaald ligt in het fysieke vlak; lange responsietijden, veel lege
ruimte, meervoudige opslag. Verbetering werd gezocht met be
hulp van de zogenaamde netwerkgegevensbanken. Er zijn nog
steeds bladen en regels, maar de band van het boek is er afge
scheurd. Via verwijsschema's kunnen op losse vellen meerdere
boeken worden gedefinieerd en kan elk blad tot meerdere boeken
behoren.
Tot slot moet aandacht worden besteed aan de zogenaamde rela
tionele gegevensbanken. Het relationele model kan worden be
schouwd als de eerste poging om binnen de informatica een
„meetkunde" van gegevensbanken te ontwikkelen die kan wor
den gestandaardiseerd, kan worden onderwezen en de verbeel
dingskracht van de gebruiker weer kan ondersteunen bij raadple
ging van een gegevensbank. De kern van deze benadering is, dat
de organisatie van de gegevensbank wordt voorgesteld door een
hoeveelheid tabellen en alle manipulaties op de gegevensbank als
manipulaties met tabellen. Een voorbeeld ziet u in fig. 17.
TABELLEN
PUNT-ID
X
Y
Z
A
3.2
1.5
0.7
B
5.3
3.0
5.0
C
7.0
1.0
2.3
LIJN-ID
PUNT-ID
PUNT-ID
1
A
B
2
A
C
Fig. 17.
Deze benadering sprak zeer tot de verbeelding van de meeste in
formatici. Het was duidelijk, dat het model in een behoefte voor
zag. De onderwijsbaarheid van de relationele benadering had tot
gevolg, dat het onderwijs- en cursuswezen er zich met alle macht
op stortte, zonder dat zelfs de operationele haalbaarheid van de
benadering was aangetoond. De opkomst van de personal compu
ters met in hun kielzog een horde potentiële gegevensbankgebrui
kers die inmiddels bekend waren met het relationele model, leidde
ertoe dat geen enkel software-produkt het zich kon veroorloven
niet het predikaat „relationeel" te voeren.
De hieruit voortvloeiende verwarring zorgde ervoor, dat de oor
spronkelijke opsteller van het relationele model een twaalfpunt-
schaal opstelde waaraan een „echt" relationeel produkt moet vol
doen. De eerste vorm van standaardisatie op logisch niveau is er.
Inmiddels zijn er van grote leveranciers een aantal serieuze, helaas
niet gestandaardiseerde, implementaties van relationele gegevens
banksystemen op de markt, die met elkaar wedijveren om de
hoogste score op de schaal van Codd. De hamvraag is echter hoe
het de relationele systemen in de praktijk vergaat.
Om deze vraag te beantwoorden, moet onderscheid worden ge
maakt tussen het logische (relationele) model en de implementa
ties ervan. Beide maken een aan elkaar tegengestelde ontwikke
ling door. Zoals gezegd, zijn de implementaties van het model in
opmars, zij het in niet-gestandaardiseerde vorm. Eén van de groot
ste nadelen van deze implementaties ten opzichte van oudere be
naderingen, de slechte performance, wordt steeds minder groot.
Door toenemend gebruik wordt de betrouwbaarheid van de onder
liggende programmatuur beter. De commerciële druk en de grote
concurrentie leiden wel nog tot problemen voor de afnemer van
gegevensbankpakketten. Hij loopt het risico, dat hij als proefkonijn
fungeert voor onvoldoende uitgeteste programmatuur en hij moet
afwachten of het gegevensbankpakket waaraan hij zijn informatie
voorziening heeft opgehangen, tot de overwinnaars in de concur
rentieslag gaat behoren.
Als logisch model voor gegevensbankstructurering is de relationele
benadering bij de echte specialisten over het hoogtepunt heen. De
volgende oorzaken zijn hiervoor aan te wijzen:
niet alle operaties op gegevens die tot informatie kunnen lei
den, kunnen op een doorzichtige manier in operaties op tabel
len worden uitgedrukt;
NGT GEODESIA 88
een deel van de operaties die op tabellen kunnen worden uitge
voerd, kan foute of zelfs onzinnige informatie opleveren. Om
dit te voorkomen, moeten de tabellen aan eisen voldoen. Het
opstellen van de tabellen is dan niet meer triviaal, waardoor
een groot deel van de charme van het concept voor de gebrui
ker verloren gaat;
voor een bepaalde toepassing is het opstellen van de tabellen
niet uniek. De gebruiker moet weten hoe de tabellen zijn
samengesteld. Er is een grens aan het aantal tabellen dat een
gebruiker kan overzien, zonder zich weer van een gegevens
bank afgesloten te voelen wegens gebrek aan eigen geheugen
capaciteit;
er zijn al nieuwe logische benaderingen ontwikkeld, die boven
genoemde nadelen trachten op te heffen. Deze worden tegen
woordig wel aangeduid met de term semantische gegevens
banken. Voor een deel zijn het nieuwe concepten, voor een
deel oude, die vijftien jaar geleden geen draagvlak vonden,
voor een deel kan het als evolutie van het relationele model
worden beschouwd. Er zijn al twee prototypen op deze basis
bekend.
De komende jaren is het heel moeilijk om beslissingen te nemen
over investeringen in gegevensbanktechnologie. Ondanks de
ogenschijnlijke doorbraak van de relationele technologie in de
markt, zijn de onderliggende concepten nog niet stabiel en functio
neel genoeg om deze technologie een voldoende lange levensduur
te garanderen om tot rijpheid te komen in de zin waar ik het in
deze lezing over heb gehad.
Ik wil deze voordracht afsluiten met een samenvatting.
Een belangrijk principe dat in de landmeetkunde wordt gehanteerd,
is het „werken van groot naar klein". Deze wijze van werken is
het gevolg van de ervaring, dat de aansluiting van meerdere, onaf
hankelijk van elkaar opgezette metingen discrepanties oplevert.
Het beheersbaar houden van deze discrepanties en hun gevolgen
vereist een concept van hogere orde dan de individuele metings-
opzet. In de landmeetkunde wordt in dit concept voorzien door de
meetkundige grondslag.
Landmeetkundige informatie onderscheidt zich van andere infor
matie door de elementen waarop de informatie betrekking heeft.
Het is echter geen ander soort informatie voor zover het de eigen
schappen van het begrip informatie betreft. Het resultaat van een
meting, op welke wijze ook gepresenteerd, bevat relaties tussen
gegevens en is derhalve een informatiesysteem. Het zijn de rela
ties tussen de gegevens die de eerdergenoemde aansluitingspro
blemen veroorzaken.
Nu ten gevolge van de moderne informatietechnologie binnen or
ganisaties steeds meer informatiesystemen worden opgezet, wel
ke geleidelijk steeds meer raakvlakken met elkaar krijgen, wordt
het vakgebied van de informatica in volle hevigheid geconfron
teerd met het oude landmetersprobleem: systemen die niet zijn
ontworpen om samen als groter geheel te functioneren, leveren
aansluitingsproblemen op die niet of slechts met veel extra kosten
en moeite kunnen worden overkomen.
Hoewel informatiesystemen uit verschillende componenten be
staan en elke component zijn eigen aansluitingsproblematiek
heeft, blijken zich de meest fundamentele incompatibiliteiten voor
te doen in de structuur, definiëring en weergave van de compo
nent gegevensverzamelingen. Een oplossing voor dit probleem kan
worden gevonden in het concept „gegevensbank": verzamelingen
gegevens, ondergebracht in een gemeenschappelijke logische en
technische structuur, welke ten dienste staan van meerdere infor
matiesystemen en zo voor de noodzakelijke integratie kunnen
zorgen.
Zoals het concept „meetkundige grondslag" in de praktijk wordt
ondersteund door afspraken over rekenmodellen, coördinaten- en
maatstelsels en verzekeringen in het terrein, moet ook het concept
„gegevensbank" worden ondersteund door afspraken over gege
vensstructuren, definities, computerprogramma's, wijzigings- en
bevragingsprocedures, gezamenlijk aangeduid als gegevensbank
technologie.
Van een uitgewogen, uniforme gegevensbanktechnologie die als
infrastructuur kan dienen voor het opzetten en onderhouden van
samenhangende informatiesystemen is op dit ogenblik nog geen
sprake. De omgeving waarin zo'n technologie tot stand moet
komen, wordt gekenmerkt door een grote vraag naar informatie
systemen, een groot commercieel aanbod van informatietechnolo-
gieprodukten, dat via het wekken van onrealistische verwachtin
gen de vraag naar informatiesystemen weer aanwakkert; een
vraag van meestal onervaren informatietechnologie-gebruikers, die
er niet van kunnen worden weerhouden onvoldoend beproefde
produkten aan te schaffen. Al met al nog geen gunstig klimaat
voor een vakgebied-brede bezinning op de mogelijkheden en on
mogelijkheden van de beschikbare gegevensbanktechnologieën.
Eerst moet nog veel leergeld worden betaald.
169