on-line
assistant
guided
KARTOGRAFISCH TIJDSCHRIFT
200I-XXV1I-4
reden hiervoor is nogal eenvoudig: geometrische definities zijn
onhandig in het gebruik. Met uitzondering van een aantal
professionele zoekopdrachten geeft de meerderheid van de
'netizens' er de voorkeur aan naar een geografisch gebied te
verwijzen door middel van een plaatsnaam (of van de plaatsna-
men van de aanpalende gebieden) in plaats van de exacte coör-
dinaten van de grenzen ervan op te geven. Een ruwe 'clipping'
van het gebied is meestal afgeperkt door bepaalde tolerantie-
waarden die varieren met de door de gebruiker uit te voeren
taken en met hun context. In een mobiele omgeving vereist
dezelfde fuzzy Operator 'dichtbij' verschillende waarden voor
de nabijheid, die afhangen van de rijsnelheid. Aan de andere
kant kan men op locatie gebaseerde thematische attributen en
hun verwijzingen slechts redelijkerwijs identificeren door mid
del van een 'fuzzy matching', gebaseerd op semantische over-
eenkomst of associatie. Omdat gebruikers niet bereid zijn voor
onnodige bits te betalen, of onnodige wachttijden te ervaren,
dienen de rond een locatie opgehoopte gegevens terug te wor
den gebracht tot het juiste detailniveau, dat relevant is voor
een bepaalde taak en context.
Data mining om waarde toe te voegen aan data warehouses
voor ruimtelijke gegevens
De effectiviteit van ruimtelijke zoektaken wordt sterk bein-
vloed door de beschikbaarheid en de transparantie van de op
internet bestaande databases. Een goede toegankelijkheid ver
eist dat de database als geheel goed gelabeld is met een samen-
vatting die de relevante trefwoorden bevat; en dat de individu-
ele gegevens gei'ndexeerd zijn met expliciete attributen en me-
tadata. De transparantie vereist verder methoden om de
ruimtelijke concepten te ontdekken die anders in de database
verborgen blijven en de ontdekte concepten te beschrijven met
een makkelijk te begrijpen taal. Een toegankelijke en transpa-
rante database Staat flexibele aggregatie en segregatie toe, en
daardoor 00k een door de gebruiker zelf bepaalde onderverde-
ling van de informatieruimte. Het aan de persoonlijke wensen
aanpassen van grote databases is echter complex en niet intui-
tief. Leveranciers van ruimtelijke gegevens zouden gek worden
als ze zouden proberen vast te stellen wät ze aan wie moeten
aanbieden, vooral als ze zelf het overzicht over hun eigen data
bases al kwijt zijn. Dergelijke taken dienen derhalve door au
tomatische 'data mining' Systemen voor ruimtelijke gegevens
te worden uitgevoerd.
Figuur 1 - Navigatie
In vergelijking met statistische methoden hebben strategieen in de informatie-
voor 'data mining' een aantal voordelen. Aan de ene kant zijn ruimte.
ze in Staat kennis te ontdekken op basis
van onvolledige monsters vol met ruis.
Aan de andere kant verstrekken ze
kwantitatieve criteria waarmee de opti-
malisering van een database gestuurd
kan worden. Op de technische universi-
teit van München is een 'data mining'
systeem ontwikkeld om de door Nav-
Tech onderhouden wegen-database te
onderzoeken. In de oorspronkelijke da
tabase wordt elk wegelement door circa
150 attributen beschreven. Men heeft
twee op de entropie-theorie gebaseerde
algoritmes en een modelleringstechniek
voor ruwe sets gebruikt om de individu-
ele attributen op volgorde van belang-
rijkheid te plaatsen en onderlinge afhan-
kelijkheden onder die attributen vast te
stellen, gebaseerd op hun waarden in een
willekeurig gekozen testgebied. Andere
algoritmes zijn ontwikkeld om wegen
aan de database te ontlenen, op basis van
hun geometrie. Met behulp van de ken
nis van het relatieve belang van de indi-
viduele attributen krijgen gebruikers de
flexibiliteit om locale wegen-databases te
kopen, met een beperkte set attributen.
Door de vastgestelde volgorde van de at-
tribuutwaarden en hun correlatiematrix
voor verschillende gebieden te vergelij-
ken, kan informatie worden gegenereerd
die de regionale verschillen in wegennet-
werken blootlegt. Op een vergelijkbare
manier kan men het relatieve belang van
een specifieke route voor een gebied
vaststellen door de verschillen na te gaan
in de attributen-ranglijst en correlatie
matrix wanneer die route er wel en niet
aan is toegevoegd. Er bestaan echter nog
maar heel weinig 'data mining' metho
den voor ruimtelijke gegevens die de
geometrische en semantische attributen
op een goed gei'ntegreerde manier kun-
nen verwerken. Hoewel de afzonderlijke
behandeling van geometrische en se
mantische gegevens betreffende ruimte
lijke objecten voor veel Gis-toepassingen
voldoende is, is het nog niet mogelijk
om een redelijke beschrijving te creeren
van ruimtelijke patronen die ontstaan als
resultaat van de interactie tussen geome
trische en semantische attributen.
Navigatie-gids en autonome zoek-'agent'
Het persoonlijke terugzoeken van gege
vens op het internet ten behoeve van op
locaties gebaseerde taken wordt geken-
merkt door een serie van vragen, in
combinatie met selecteren en bladeren
waardoor men successievelijk het doel
bereikt. De efficiency van een dergelijke
zoektaak hangt af van het handig formu-
leren van de zoekvragen, van de volgor
de waarin die vragen worden verwerkt
en van de reacties van de gebruiker op
40