zenden pagina's geschreven tekst. De keuze van de meest
geschikte gegevens (en bewerkingen) voor de afleiding
van bepaalde informatie wordt daardoor aanzienlijk
bemoeilijkt (abel, 1989). Het belang van het snel archi-
veren, karakteriseren en toegankelijk maken van gege
vens valt niet te bagatelliseren en gelukkig wordt deze
noodzaak steeds meer onderkend (cromp, 1991; lai&
GILLIES, 1991; MCDONALD BLAKE, 1991).
Maar naast de theoretische voordelen zijn de praktische
beperkingen minstens even belangrijk om te overwegen.
Immers, op welk niveau moet meta-informatie worden
vastgelegd? Bestands-, objects- of misschien zelfs punts-
niveau? Elk van deze mogelijkheden brengt geheel eigen
consequenties met zieh mee voor de afleiding, opslag en
weergave. Moet de meta-informatie in een of andere
gestandaardiseerde vorm worden gegoten zoals nauw-
keurigheid, daarbij de vergelijkbaarheid van gegevens
aanzienlijk vereenvoudigend, of betekent deze mate van
aggregatie juist informatieverlies? Het antwoord op tal
van dergelijke vragen is onderwerp van onderzoek,
maar duidelijk is al wel dat verschillende praktische
omstandigheden dit antwoord telkens anders zullen
bei'nvloeden. Organisatorische en financiele factoren
speien ongetwijfeld een grote rol in de overwegingen die
tot beslissingen betreffende de aard van de meta-infor
matie en de wijze van overdracht daarvan moeten
leiden. Impliciet stoelen deze beslissingen op een kosten-
batenanalyse waarin sprake zal zijn van een bepaald
omslagpunt waarna de investering in meer, of meer
nauwkeurige meta-informatie niet meer rendeert gezien
de resultaten van de integratie. Wanneer kennis beschik-
baar is over dit soort overwegingen, dan kan op een
efficiente en flexibele wijze worden geantieipeerd op
verschillende omstandigheden.
Het voorgaande kan gei'llustreerd worden aan de hand
van een voorbeeld waarin de rol van nauwkeurigheidsin-
formatie centraal Staat. Deze informatie kan zeer gede-
tailleerd zijn, door voldoende te investeren in de aflei
ding ervan. Echter, op een bepaald moment zal de infor
matie niet veel meer toevoegen terwijl de kosten oneven-
redig blijven toenemen. De beoogde toepassing zal
bepalen of de baten nog steeds tegen de kosten blijven
opwegen (figuur 5). Nauwkeurigheidsinformatie voor
een gewasclassificatie zou in het geval van een inventari-
satiestudie kunnen bestaan uit een 'percentage correct'
voor iedere klasse. Verder investeren in bijvoorbeeld
additionele informatie om de nauwkeurigheid op per-
ceelsniveau af te leiden, is in zo'n situatie overbodig.
Wanneer daarentegen de concentratie van bepaalde
bodemverontreinigende Stoffen wordt onderzocht,
dienen de waarden niet alleen zelf een zo hoge mogelijke
nauwkeurigheid te bezitten, maar moet tevens de infor
matie waarop die nauwkeurigheid is gebaseerd zo vol-
ledig en betrouwbaar mogelijk zijn. Extreem hoge
kosten (bijvoorbeeld voor bemonstering en laborato-
riumonderzoek) kunnen leiden tot beter gefundeerde
uitspraken betreffende de nauwkeurigheid van de gege
vens (metingen). Op deze weloverwogen wijze kunnen
de juiste acties worden ondernomen, waarbij nadelige
consequenties tot in het uiterste worden terugge-
Figuur 5. De relatie kosten-baten voor drie situaties.
Curve A beschrijft een situatie waarin de baten op een gegeven
moment vrijwel stagneren, terwijl de kosten blijven toenemen.
Met curve B wordt een situatie geschetst waarin, als gevolg van
grote investeringen, nog steeds een belangrijke toename van de
baten wordt verkregen.
Curve C vertoont een gelijkmatige toename van de baten met
toenemende kosten.
drangen. Bij dit laatste kan men denken aan financieel-
economische consequenties, zoals sanering in een te laat
Stadium tengevolge van verkeerde beslissingen, geba
seerd op onvolledige of zelfs foute nauwkeurigheidsin
formatie. Maar ook sociale en juridische consequenties
dienen te worden overwogen, bijvoorbeeld onverant-
woordelijke beslissingen als woningbouw op gifgrond en
de daaruit voorvloeiende gezondheidsrisico's en schade-
claims.
Een eerste stap in de ontwikkeling van een duidelijk
concept betreffende meta-informatie bestaat in het
onderscheiden van twee verschillende maar niettemin
minstens even belangrijke uitingen van dit soort infor
matie. Ze kunnen worden getypeerd als respectievelijk
fysieke en inhoudelijke meta-informatie.
Fysieke meta-informatie heeft betrekking op feiten die
voor een gegevensbestand als zodanig gelden: coördi-
naten die de begrenzing aangeven van het beschreven
gebied, thema, opnamedatum en -medium, en een over-
zicht van de bewerkingen die reeds zijn ondergaan zijn
slechts enkele voorbeelden die in dit kader kunnen
worden genoemd. De op deze manier vergaarde kennis is
beperkt tot de 'lineage' en gaat in feite voorbij aan meer
gegevensspeeifieke eigenschappen, die aan de basis
staan van de kwaliteitsinformitie. Het is deze 'content-
based' meta-informatie (mcdonald blake, 1991) die
nochtans in Sterke mate ontbreekt; digitale gegevensbe-
standen worden veelal slechts ontsloten aan de hand van
een voor dat doel juist toereikende hoeveelheid aan
informatie.
Gegeven de bovenstaande tweedeling is het duidelijk dat
met name de inhoudelijke meta-informatie veel meer
aandacht verdient. De Problemen waaraan de eerder
gestelde vragen refereren vereisen een gestandaardi
seerde benadering waarbij echter rekening wordt
gehouden met verschillende praktische omstandig
heden. Dit betekent geenszins dat de behandelde proble-
matiek zieh alleen in de praktijk laat oplossen. Het moet
mogelijk zijn om een raamwerk te ontwikkelen waar-
binnen de inderdaad vaak toepassingsafhankelijke
kennis moet worden beschouwd. Er zal, met andere
woorden, naar een degelijk theoretisch model moeten
52
KT 1992.XVIII.2