Mutatie-uitwisseling op basis van standaarden
Voor veel toepassingen van geo-informatie is het van
groot belang dat de gebruikte gegevens actueel zijn. In
dit artikel wordt een overzicht gegeven van de mogelijkhe
den voor het actualiseren van gegevens vanuit een centrale
bron, gegeven de huidige stand van de techniek. De aan
dacht gaat speciaal uit naar op standaarden gebaseerde me
thoden en niet naar specifieke oplossingen. Het onderzoek
waarop dit artikel is gebaseerd, is uitgevoerd in het kader
van RGI-project 116, Verkenning van innovaties bij geo-stan-
daarden voor NGII.
Om te werken met actuele informatie zijn er in de basis
twee mogelijkheden: de gegevens worden voor iedere bevra
ging bij de bronhouder opgehaald (data bij de bron) of er
wordt gewerkt met een lokale kopie van de gegevens bin
nen de eigen organisatie.
Het eerste principe is vanuit het oogpunt van de kwaliteit
van gegevens het beste. Omdat de gegevens direct bij de
bron worden geraadpleegd, kan er in principe geen discus
sie zijn over de actualiteit en juistheid van de gegevens.
Dat wil niet zeggen dat de gegevens foutloos zijn, maar de
bronhouder heeft kennelijk op dat moment geen betere ge
gevens beschikbaar. Deze opzet stelt een aantal eisen aan de
informatie-infrastructuur binnen en tussen de betrokken
organisaties: de gegevens bij de bronhouder moeten altijd
toegankelijk zijn, de bronhouder moet voldoende capaciteit
hebben om alle bevragingen van alle afnemers af te kunnen
handelen en de afnemer moet altijd verbinding kunnen
hebben met de bronhouder. Met de huidige stand van tech
niek kan het al lastig zijn om voor grote en populaire data
sets aan al de hiervoor genoemde eisen te voldoen. In het
verleden was het probleem bij gebrek aan snelle computer
netwerken nog groter. Daarom zijn systemen opgezet waar
bij de gebruikers lokaal een kopie hebben van de gegevens
en periodiek nieuwe gegevens krijgen van de leverancier.
Lokale kopieën actueel houden
Voor het bijhouden van lokale kopieën moeten gegevens wor
den uitgewisseld tussen leveranciers en afnemers. Deze ge
gevens werden in het verleden bijvoorbeeld aangeleverd op
magnetische tapes en later ook op cd's of dvd's. Met het be
schikbaar komen van snelle netwerkver
bindingen kan de levering van fysieke
media vervangen zijn door leveringen
via bijvoorbeeld e-mail of FTP. De ver
werking van de gegevens is dan echter
vaak gelijk gebleven.
Voor het regelmatig bijwerken van de
gegevens zijn in de basis twee opties:
bij iedere levering wordt een volledige
nieuwe set gegevens geleverd, of alleen
de wijzigingen worden uitgewisseld. Het
uitwisselen van volledige sets heeft als
belangrijke voordelen dat het heel een
voudig is om alle oude gegevens te ver
vangen door alle nieuwe en dat het dui
delijk is wat de actualiteit van de data
Het uitwisselen van
grote hoeveelheden
gegevens was lastig
zonder goede net
werkverbindingen.
(Afbeelding van
www.skierpage.com.)
is. Een nadeel is dat als de hoeveelheid
nieuwe gegevens relatief klein is ten op
zichte van de volledige dataset, er erg
veel gegevens worden uitgewisseld die
al bij de afnemer bekend zijn. Een oplos
sing hiervoor is om gebruik te maken
van incrementele updates. Dit houdt in
dat alleen de wijzigingen in de gegevens
aan de afnemer worden doorgegeven.
Gegevens die niet veranderen, worden
niet opnieuw verstuurd, waardoor de
hoeveelheid te versturen gegevens klein
kan blijven. Hier kleven ook weer een
aantal voor- en nadelen aan. Het belang
rijkste voordeel van het uitwisselen van
alleen de wijzigingen is dat de omvang
van de uitgewisselde gegevens kleiner
is. Hierdoor kan de uitwisseling sneller
plaatsvinden en is ook de verwerking
van de wijzigingen mogelijk sneller. Een
ander voordeel is dat door het specifiek
aanleveren van wijzigingen, de afnemer
expliciet op de hoogte wordt gebracht
van wijzigingen en indien nodig daar
direct aandacht aan kan besteden in in
terne werkprocessen. Nadelen van deze
methode zijn dat het bijhouden en cor
rect verwerken van mutaties complex
kan zijn en dat de afnemer strikt alle
mutaties op volgorde moet verwerken
om een goede gegevensset te hebben.
Er zijn ook tussenvormen denkbaar. Zo
is het ook mogelijk het interessegebied
op te splitsen in kleine delen en de afne
mer een complete beschrijving te geven
van de delen waarbinnen wijzigingen
hebben plaatsgevonden. Dit geeft een
relatief eenvoudige verwerking bij de
afnemer en houdt toch de hoeveelheid
gegevens die verstuurd moeten worden
beperkt.
Eerder werd aangegeven dat vanuit
kwaliteitsoogpunt, data bij de bron het
beste wordt geacht. Een opmerkelijk
gevolg van het data-bij-de-bron-princi
pe is dat het in feite inhoudt dat voor
iedere bevraging een complete dataset
van de bronhouder naar de afnemer
wordt verstuurd. In veel gevallen zal
de hoeveelheid gegevens echter wel
beperkt zijn omdat het alleen de gege
vens betreft waar de afnemer direct be
langstelling voor heeft. Echter, als de
afnemer voor zijn werk een grote hoe
veelheid data nodig heeft, bijvoorbeeld
voor een analyse over een groot gebied,
kan dit een zware belasting zijn voor
GEO-INFO 2008-12