Linked open data AVG: nik
Privacy
In dit artikel verkennen we de
opkomst van linked open data, en
daarbij het combineren van data, in
het licht van privacy. We kijken
dan met name naar de Algemene
verordening gegevensbescherming
(AVG).
12
Geo-Info I 2019-3
Door Erwin Folmer en Mathieu Paapst
Interoperabiliteit, de mate waarin systemen/
organisaties met elkaar kunnen samenwerken,
is al decennia een groot streven. Standaarden
op technisch, semantisch en organisatorisch
niveau spelen daarin een grote rol. In de laatste
jaren hebben de W3C-standaarden rond linked
data een vlucht genomen, waardoor interope
rabiliteit op technisch en semantisch niveau
een steeds hoger niveau haalt. In essentie
worden data meer en meer op het web gepu
bliceerd, zijn data eenvoudig koppelbaar en
integraal bevraagbaar met andere data op het
web. Een krachtig fenomeen, waar veel waarde
mee te generen is, maar dan rijst ook de vraag
of er geen misbruik van te maken is. Ofspe-
cifieker: als al die data koppelbaar zijn en zo
eenvoudig nieuwe inzichten worden vergaard,
is privacy dan nog wel te garanderen?
In deze bijdrage willen we kort stilstaan bij de
vraag of en hoe linked data zich verhouden tot
privacy en of de AVG een afdoende bescher
ming kan vormen voor eventuele privacyge
varen bij het toepassen van linked data.
Om een goede analyse te kunnen uitvoeren,
is zuiverheid qua begrippen essentieel. Als we
praten over 'linked data', dan zijn dat de linked
data-standaarden toegepast in gesloten data-
context (of geen expliciet onderscheid). Als we
'linked open data' gebruiken, dan hebben we
het specifiek over de linked data-standaarden
toegepast op datasets met een open licentie.
Met linked data worden data in een netwerk
verbonden (in tegenstelling tot het publiceren
van datasilo's), ook wel bekend onder de
noemers 'web of data', 'semantisch web' en
'knowledge graph' (ook opgenomen in de
Gartner Technology Hype Cycle 2018). Met
een knowledge graph worden data integraal
bevraagbaar en kunnen machines over data
gaan redeneren om nieuwe inzichten boven
tafel te krijgen. Niet voor niks maken de grote
informatiebedrijven (Google, Facebook,
enzovoort) allemaal gebruik van een eigen
knowledge graph. In de context van LOD is
er sprake van een open knowledge graph op
het web. Een belangrijke 'verbinder' van data
is locatie: nagenoeg hebben alle data wel iets
van een geo/locatie-component in zich.
Als we spreken over privacy, dan dienen
we dat te onderscheiden in: de relationele
privacy (de bescherming van je gezinsleven),
de ruimtelijke privacy (de bescherming van
wat je doet in je woning), en de informatio-
nele privacy (de bescherming van gegevens
die direct of indirect iets zeggen over een
persoon). Het is dat laatste waar de Algemene
verordening gegevensbescherming (AVG) op
van toepassing is.
Identificatie
De meest belangrijke definitie in de AVG is die
van het begrip 'persoonsgegevens'. Het gaat
daarbij om alle informatie over een geïdentifi
ceerde of een direct danwel indirect identi
ficeerbare persoon. Vooral de term 'indirect
identificeerbaar' maakt dat allerlei data die op
het eerste gezicht geen persoonsgegevens
zijn, toch al heel snel onder de reikwijdte van
de AVG kunnen vallen. Daarbij is bijvoorbeeld
niet vereist dat alle informatie om een persoon
te kunnen identificeren bij een en dezelfde
persoon of organisatie berust. Zodraje
kunt beschikken over al dan niet wettelijke
middelen waarmee je data kunt koppelen
aan gegevens afkomstig van een derde, en