taalanalyse" steeds vaker valt, is een beweging in de goede rich ting. Ik keer nog even terug naar de drie geheugenstructuren zoals deze in de opsomming voorkomen. Bij de zogenaamde hiërarchische gegevensbanken is het geheugen organisatorisch opgedeeld in bladen, regels enz. De geheugenop- bouw simuleert een conventionele informatiedrager zoals een boek. Deze structuur heeft zijn beperkingen voor de logische gege- vensmanipulatie. Tot op zekere hoogte zijn deze beperkingen te omzeilen via programmatuur. De prijs die hiervoor moet worden betaald ligt in het fysieke vlak; lange responsietijden, veel lege ruimte, meervoudige opslag. Verbetering werd gezocht met be hulp van de zogenaamde netwerkgegevensbanken. Er zijn nog steeds bladen en regels, maar de band van het boek is er afge scheurd. Via verwijsschema's kunnen op losse vellen meerdere boeken worden gedefinieerd en kan elk blad tot meerdere boeken behoren. Tot slot moet aandacht worden besteed aan de zogenaamde rela tionele gegevensbanken. Het relationele model kan worden be schouwd als de eerste poging om binnen de informatica een „meetkunde" van gegevensbanken te ontwikkelen die kan wor den gestandaardiseerd, kan worden onderwezen en de verbeel dingskracht van de gebruiker weer kan ondersteunen bij raadple ging van een gegevensbank. De kern van deze benadering is, dat de organisatie van de gegevensbank wordt voorgesteld door een hoeveelheid tabellen en alle manipulaties op de gegevensbank als manipulaties met tabellen. Een voorbeeld ziet u in fig. 17. TABELLEN PUNT-ID X Y Z A 3.2 1.5 0.7 B 5.3 3.0 5.0 C 7.0 1.0 2.3 LIJN-ID PUNT-ID PUNT-ID 1 A B 2 A C Fig. 17. Deze benadering sprak zeer tot de verbeelding van de meeste in formatici. Het was duidelijk, dat het model in een behoefte voor zag. De onderwijsbaarheid van de relationele benadering had tot gevolg, dat het onderwijs- en cursuswezen er zich met alle macht op stortte, zonder dat zelfs de operationele haalbaarheid van de benadering was aangetoond. De opkomst van de personal compu ters met in hun kielzog een horde potentiële gegevensbankgebrui kers die inmiddels bekend waren met het relationele model, leidde ertoe dat geen enkel software-produkt het zich kon veroorloven niet het predikaat „relationeel" te voeren. De hieruit voortvloeiende verwarring zorgde ervoor, dat de oor spronkelijke opsteller van het relationele model een twaalfpunt- schaal opstelde waaraan een „echt" relationeel produkt moet vol doen. De eerste vorm van standaardisatie op logisch niveau is er. Inmiddels zijn er van grote leveranciers een aantal serieuze, helaas niet gestandaardiseerde, implementaties van relationele gegevens banksystemen op de markt, die met elkaar wedijveren om de hoogste score op de schaal van Codd. De hamvraag is echter hoe het de relationele systemen in de praktijk vergaat. Om deze vraag te beantwoorden, moet onderscheid worden ge maakt tussen het logische (relationele) model en de implementa ties ervan. Beide maken een aan elkaar tegengestelde ontwikke ling door. Zoals gezegd, zijn de implementaties van het model in opmars, zij het in niet-gestandaardiseerde vorm. Eén van de groot ste nadelen van deze implementaties ten opzichte van oudere be naderingen, de slechte performance, wordt steeds minder groot. Door toenemend gebruik wordt de betrouwbaarheid van de onder liggende programmatuur beter. De commerciële druk en de grote concurrentie leiden wel nog tot problemen voor de afnemer van gegevensbankpakketten. Hij loopt het risico, dat hij als proefkonijn fungeert voor onvoldoende uitgeteste programmatuur en hij moet afwachten of het gegevensbankpakket waaraan hij zijn informatie voorziening heeft opgehangen, tot de overwinnaars in de concur rentieslag gaat behoren. Als logisch model voor gegevensbankstructurering is de relationele benadering bij de echte specialisten over het hoogtepunt heen. De volgende oorzaken zijn hiervoor aan te wijzen: niet alle operaties op gegevens die tot informatie kunnen lei den, kunnen op een doorzichtige manier in operaties op tabel len worden uitgedrukt; NGT GEODESIA 88 een deel van de operaties die op tabellen kunnen worden uitge voerd, kan foute of zelfs onzinnige informatie opleveren. Om dit te voorkomen, moeten de tabellen aan eisen voldoen. Het opstellen van de tabellen is dan niet meer triviaal, waardoor een groot deel van de charme van het concept voor de gebrui ker verloren gaat; voor een bepaalde toepassing is het opstellen van de tabellen niet uniek. De gebruiker moet weten hoe de tabellen zijn samengesteld. Er is een grens aan het aantal tabellen dat een gebruiker kan overzien, zonder zich weer van een gegevens bank afgesloten te voelen wegens gebrek aan eigen geheugen capaciteit; er zijn al nieuwe logische benaderingen ontwikkeld, die boven genoemde nadelen trachten op te heffen. Deze worden tegen woordig wel aangeduid met de term semantische gegevens banken. Voor een deel zijn het nieuwe concepten, voor een deel oude, die vijftien jaar geleden geen draagvlak vonden, voor een deel kan het als evolutie van het relationele model worden beschouwd. Er zijn al twee prototypen op deze basis bekend. De komende jaren is het heel moeilijk om beslissingen te nemen over investeringen in gegevensbanktechnologie. Ondanks de ogenschijnlijke doorbraak van de relationele technologie in de markt, zijn de onderliggende concepten nog niet stabiel en functio neel genoeg om deze technologie een voldoende lange levensduur te garanderen om tot rijpheid te komen in de zin waar ik het in deze lezing over heb gehad. Ik wil deze voordracht afsluiten met een samenvatting. Een belangrijk principe dat in de landmeetkunde wordt gehanteerd, is het „werken van groot naar klein". Deze wijze van werken is het gevolg van de ervaring, dat de aansluiting van meerdere, onaf hankelijk van elkaar opgezette metingen discrepanties oplevert. Het beheersbaar houden van deze discrepanties en hun gevolgen vereist een concept van hogere orde dan de individuele metings- opzet. In de landmeetkunde wordt in dit concept voorzien door de meetkundige grondslag. Landmeetkundige informatie onderscheidt zich van andere infor matie door de elementen waarop de informatie betrekking heeft. Het is echter geen ander soort informatie voor zover het de eigen schappen van het begrip informatie betreft. Het resultaat van een meting, op welke wijze ook gepresenteerd, bevat relaties tussen gegevens en is derhalve een informatiesysteem. Het zijn de rela ties tussen de gegevens die de eerdergenoemde aansluitingspro blemen veroorzaken. Nu ten gevolge van de moderne informatietechnologie binnen or ganisaties steeds meer informatiesystemen worden opgezet, wel ke geleidelijk steeds meer raakvlakken met elkaar krijgen, wordt het vakgebied van de informatica in volle hevigheid geconfron teerd met het oude landmetersprobleem: systemen die niet zijn ontworpen om samen als groter geheel te functioneren, leveren aansluitingsproblemen op die niet of slechts met veel extra kosten en moeite kunnen worden overkomen. Hoewel informatiesystemen uit verschillende componenten be staan en elke component zijn eigen aansluitingsproblematiek heeft, blijken zich de meest fundamentele incompatibiliteiten voor te doen in de structuur, definiëring en weergave van de compo nent gegevensverzamelingen. Een oplossing voor dit probleem kan worden gevonden in het concept „gegevensbank": verzamelingen gegevens, ondergebracht in een gemeenschappelijke logische en technische structuur, welke ten dienste staan van meerdere infor matiesystemen en zo voor de noodzakelijke integratie kunnen zorgen. Zoals het concept „meetkundige grondslag" in de praktijk wordt ondersteund door afspraken over rekenmodellen, coördinaten- en maatstelsels en verzekeringen in het terrein, moet ook het concept „gegevensbank" worden ondersteund door afspraken over gege vensstructuren, definities, computerprogramma's, wijzigings- en bevragingsprocedures, gezamenlijk aangeduid als gegevensbank technologie. Van een uitgewogen, uniforme gegevensbanktechnologie die als infrastructuur kan dienen voor het opzetten en onderhouden van samenhangende informatiesystemen is op dit ogenblik nog geen sprake. De omgeving waarin zo'n technologie tot stand moet komen, wordt gekenmerkt door een grote vraag naar informatie systemen, een groot commercieel aanbod van informatietechnolo- gieprodukten, dat via het wekken van onrealistische verwachtin gen de vraag naar informatiesystemen weer aanwakkert; een vraag van meestal onervaren informatietechnologie-gebruikers, die er niet van kunnen worden weerhouden onvoldoend beproefde produkten aan te schaffen. Al met al nog geen gunstig klimaat voor een vakgebied-brede bezinning op de mogelijkheden en on mogelijkheden van de beschikbare gegevensbanktechnologieën. Eerst moet nog veel leergeld worden betaald. 169

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

(NGT) Geodesia | 1988 | | pagina 21