on-line assistant guided KARTOGRAFISCH TIJDSCHRIFT 200I-XXV1I-4 reden hiervoor is nogal eenvoudig: geometrische definities zijn onhandig in het gebruik. Met uitzondering van een aantal professionele zoekopdrachten geeft de meerderheid van de 'netizens' er de voorkeur aan naar een geografisch gebied te verwijzen door middel van een plaatsnaam (of van de plaatsna- men van de aanpalende gebieden) in plaats van de exacte coör- dinaten van de grenzen ervan op te geven. Een ruwe 'clipping' van het gebied is meestal afgeperkt door bepaalde tolerantie- waarden die varieren met de door de gebruiker uit te voeren taken en met hun context. In een mobiele omgeving vereist dezelfde fuzzy Operator 'dichtbij' verschillende waarden voor de nabijheid, die afhangen van de rijsnelheid. Aan de andere kant kan men op locatie gebaseerde thematische attributen en hun verwijzingen slechts redelijkerwijs identificeren door mid del van een 'fuzzy matching', gebaseerd op semantische over- eenkomst of associatie. Omdat gebruikers niet bereid zijn voor onnodige bits te betalen, of onnodige wachttijden te ervaren, dienen de rond een locatie opgehoopte gegevens terug te wor den gebracht tot het juiste detailniveau, dat relevant is voor een bepaalde taak en context. Data mining om waarde toe te voegen aan data warehouses voor ruimtelijke gegevens De effectiviteit van ruimtelijke zoektaken wordt sterk bein- vloed door de beschikbaarheid en de transparantie van de op internet bestaande databases. Een goede toegankelijkheid ver eist dat de database als geheel goed gelabeld is met een samen- vatting die de relevante trefwoorden bevat; en dat de individu- ele gegevens gei'ndexeerd zijn met expliciete attributen en me- tadata. De transparantie vereist verder methoden om de ruimtelijke concepten te ontdekken die anders in de database verborgen blijven en de ontdekte concepten te beschrijven met een makkelijk te begrijpen taal. Een toegankelijke en transpa- rante database Staat flexibele aggregatie en segregatie toe, en daardoor 00k een door de gebruiker zelf bepaalde onderverde- ling van de informatieruimte. Het aan de persoonlijke wensen aanpassen van grote databases is echter complex en niet intui- tief. Leveranciers van ruimtelijke gegevens zouden gek worden als ze zouden proberen vast te stellen wät ze aan wie moeten aanbieden, vooral als ze zelf het overzicht over hun eigen data bases al kwijt zijn. Dergelijke taken dienen derhalve door au tomatische 'data mining' Systemen voor ruimtelijke gegevens te worden uitgevoerd. Figuur 1 - Navigatie In vergelijking met statistische methoden hebben strategieen in de informatie- voor 'data mining' een aantal voordelen. Aan de ene kant zijn ruimte. ze in Staat kennis te ontdekken op basis van onvolledige monsters vol met ruis. Aan de andere kant verstrekken ze kwantitatieve criteria waarmee de opti- malisering van een database gestuurd kan worden. Op de technische universi- teit van München is een 'data mining' systeem ontwikkeld om de door Nav- Tech onderhouden wegen-database te onderzoeken. In de oorspronkelijke da tabase wordt elk wegelement door circa 150 attributen beschreven. Men heeft twee op de entropie-theorie gebaseerde algoritmes en een modelleringstechniek voor ruwe sets gebruikt om de individu- ele attributen op volgorde van belang- rijkheid te plaatsen en onderlinge afhan- kelijkheden onder die attributen vast te stellen, gebaseerd op hun waarden in een willekeurig gekozen testgebied. Andere algoritmes zijn ontwikkeld om wegen aan de database te ontlenen, op basis van hun geometrie. Met behulp van de ken nis van het relatieve belang van de indi- viduele attributen krijgen gebruikers de flexibiliteit om locale wegen-databases te kopen, met een beperkte set attributen. Door de vastgestelde volgorde van de at- tribuutwaarden en hun correlatiematrix voor verschillende gebieden te vergelij- ken, kan informatie worden gegenereerd die de regionale verschillen in wegennet- werken blootlegt. Op een vergelijkbare manier kan men het relatieve belang van een specifieke route voor een gebied vaststellen door de verschillen na te gaan in de attributen-ranglijst en correlatie matrix wanneer die route er wel en niet aan is toegevoegd. Er bestaan echter nog maar heel weinig 'data mining' metho den voor ruimtelijke gegevens die de geometrische en semantische attributen op een goed gei'ntegreerde manier kun- nen verwerken. Hoewel de afzonderlijke behandeling van geometrische en se mantische gegevens betreffende ruimte lijke objecten voor veel Gis-toepassingen voldoende is, is het nog niet mogelijk om een redelijke beschrijving te creeren van ruimtelijke patronen die ontstaan als resultaat van de interactie tussen geome trische en semantische attributen. Navigatie-gids en autonome zoek-'agent' Het persoonlijke terugzoeken van gege vens op het internet ten behoeve van op locaties gebaseerde taken wordt geken- merkt door een serie van vragen, in combinatie met selecteren en bladeren waardoor men successievelijk het doel bereikt. De efficiency van een dergelijke zoektaak hangt af van het handig formu- leren van de zoekvragen, van de volgor de waarin die vragen worden verwerkt en van de reacties van de gebruiker op 40

Digitale Tijdschriftenarchief Stichting De Hollandse Cirkel en Geo Informatie Nederland

Kartografisch Tijdschrift | 2001 | | pagina 46