Mutatie-uitwisseling op basis van standaarden Voor veel toepassingen van geo-informatie is het van groot belang dat de gebruikte gegevens actueel zijn. In dit artikel wordt een overzicht gegeven van de mogelijkhe den voor het actualiseren van gegevens vanuit een centrale bron, gegeven de huidige stand van de techniek. De aan dacht gaat speciaal uit naar op standaarden gebaseerde me thoden en niet naar specifieke oplossingen. Het onderzoek waarop dit artikel is gebaseerd, is uitgevoerd in het kader van RGI-project 116, Verkenning van innovaties bij geo-stan- daarden voor NGII. Om te werken met actuele informatie zijn er in de basis twee mogelijkheden: de gegevens worden voor iedere bevra ging bij de bronhouder opgehaald (data bij de bron) of er wordt gewerkt met een lokale kopie van de gegevens bin nen de eigen organisatie. Het eerste principe is vanuit het oogpunt van de kwaliteit van gegevens het beste. Omdat de gegevens direct bij de bron worden geraadpleegd, kan er in principe geen discus sie zijn over de actualiteit en juistheid van de gegevens. Dat wil niet zeggen dat de gegevens foutloos zijn, maar de bronhouder heeft kennelijk op dat moment geen betere ge gevens beschikbaar. Deze opzet stelt een aantal eisen aan de informatie-infrastructuur binnen en tussen de betrokken organisaties: de gegevens bij de bronhouder moeten altijd toegankelijk zijn, de bronhouder moet voldoende capaciteit hebben om alle bevragingen van alle afnemers af te kunnen handelen en de afnemer moet altijd verbinding kunnen hebben met de bronhouder. Met de huidige stand van tech niek kan het al lastig zijn om voor grote en populaire data sets aan al de hiervoor genoemde eisen te voldoen. In het verleden was het probleem bij gebrek aan snelle computer netwerken nog groter. Daarom zijn systemen opgezet waar bij de gebruikers lokaal een kopie hebben van de gegevens en periodiek nieuwe gegevens krijgen van de leverancier. Lokale kopieën actueel houden Voor het bijhouden van lokale kopieën moeten gegevens wor den uitgewisseld tussen leveranciers en afnemers. Deze ge gevens werden in het verleden bijvoorbeeld aangeleverd op magnetische tapes en later ook op cd's of dvd's. Met het be schikbaar komen van snelle netwerkver bindingen kan de levering van fysieke media vervangen zijn door leveringen via bijvoorbeeld e-mail of FTP. De ver werking van de gegevens is dan echter vaak gelijk gebleven. Voor het regelmatig bijwerken van de gegevens zijn in de basis twee opties: bij iedere levering wordt een volledige nieuwe set gegevens geleverd, of alleen de wijzigingen worden uitgewisseld. Het uitwisselen van volledige sets heeft als belangrijke voordelen dat het heel een voudig is om alle oude gegevens te ver vangen door alle nieuwe en dat het dui delijk is wat de actualiteit van de data Het uitwisselen van grote hoeveelheden gegevens was lastig zonder goede net werkverbindingen. (Afbeelding van www.skierpage.com.) is. Een nadeel is dat als de hoeveelheid nieuwe gegevens relatief klein is ten op zichte van de volledige dataset, er erg veel gegevens worden uitgewisseld die al bij de afnemer bekend zijn. Een oplos sing hiervoor is om gebruik te maken van incrementele updates. Dit houdt in dat alleen de wijzigingen in de gegevens aan de afnemer worden doorgegeven. Gegevens die niet veranderen, worden niet opnieuw verstuurd, waardoor de hoeveelheid te versturen gegevens klein kan blijven. Hier kleven ook weer een aantal voor- en nadelen aan. Het belang rijkste voordeel van het uitwisselen van alleen de wijzigingen is dat de omvang van de uitgewisselde gegevens kleiner is. Hierdoor kan de uitwisseling sneller plaatsvinden en is ook de verwerking van de wijzigingen mogelijk sneller. Een ander voordeel is dat door het specifiek aanleveren van wijzigingen, de afnemer expliciet op de hoogte wordt gebracht van wijzigingen en indien nodig daar direct aandacht aan kan besteden in in terne werkprocessen. Nadelen van deze methode zijn dat het bijhouden en cor rect verwerken van mutaties complex kan zijn en dat de afnemer strikt alle mutaties op volgorde moet verwerken om een goede gegevensset te hebben. Er zijn ook tussenvormen denkbaar. Zo is het ook mogelijk het interessegebied op te splitsen in kleine delen en de afne mer een complete beschrijving te geven van de delen waarbinnen wijzigingen hebben plaatsgevonden. Dit geeft een relatief eenvoudige verwerking bij de afnemer en houdt toch de hoeveelheid gegevens die verstuurd moeten worden beperkt. Eerder werd aangegeven dat vanuit kwaliteitsoogpunt, data bij de bron het beste wordt geacht. Een opmerkelijk gevolg van het data-bij-de-bron-princi pe is dat het in feite inhoudt dat voor iedere bevraging een complete dataset van de bronhouder naar de afnemer wordt verstuurd. In veel gevallen zal de hoeveelheid gegevens echter wel beperkt zijn omdat het alleen de gege vens betreft waar de afnemer direct be langstelling voor heeft. Echter, als de afnemer voor zijn werk een grote hoe veelheid data nodig heeft, bijvoorbeeld voor een analyse over een groot gebied, kan dit een zware belasting zijn voor GEO-INFO 2008-12

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Geo-Info | 2008 | | pagina 24