Publicatie:Linked (Open) (Usable) Data
De term ‘linked data’ en de variaties erop komen ter sprake bij het online beschikbaar maken van data. Linked data verwijst in de digitale wereld naar gegevens die met elkaar gekoppeld en verweven zijn op een specifieke duurzame manier. Dit artikel legt uit wat Linked Data betekent en hoe dit in de praktijk wordt toegepast.
Titel | Linked (Open) (Usable) Data (Voorkeurstitel) |
Locatie | META nummer 2020/6 |
Uitgever | |
Jaar van uitgave | 2020 |
Rechten | CC-BY-SA |
Persistent ID |
Auteurs
- Alina Saenko (meemoo, Vlaams instituut voor het archief)
- Bert Lemmens (meemoo, Vlaams instituut voor het archief)
Van steekkaarten naar het internet
Het idee van kennis aan elkaar te linken en vindbaar te maken heeft een lange geschiedenis. Begin 20ste eeuw poogde men om alle kennis ter wereld vindbaar te maken met analoge steekkaarten: het Répertoire Bibliographique Universel en het Mundaneum van Paul Otlet en Henri La Fontaine. Later begon men te dromen van machines die kennis zouden verzamelen, toegankelijk maken, zelf analyseren en nieuwe kennis creëren: de eerste computers die instructies konden uitvoeren, werden ontwikkeld.
Begin jaren ‘90 kwam door het werk van o.a. Tim Berners-Lee het internet tot stand: een netwerk dat meerdere machines fysiek met elkaar verbindt en voor de uitwisseling van gegevens zorgt. Met de publicatie van twee papers van Tim Berners-Lee: The Semantic Web (2001) en Linked Data (2006), werd het afsprakenkader van het beschikbaar maken en uitwisselen van data geïntroduceerd. Het belangrijkste concept daarin: gebruik HTTP-webadressen (identifiers als URI’s) om data duurzaam te koppelen met andere data. Zo kunnen ook machines de verschillende linken tussen informatie vinden en begrijpen.
LOD?
In 2010 schreef Tim Berners-Lee een nieuwe paper: Linked Open Data (LOD). De term open werd toegevoegd aan het afsprakenkader om de toegankelijkheid en de bruikbaarheid van kennis te verbeteren. Sindsdien spreken we over een vijfsterrensysteem, met data die toegankelijk is:
★ onder een open licentie (Open Data);
★★ als machineleesbare, gestructureerde data (bv. Excel i.p.v. PDF);
★★★ in een open formaat (bv. CSV i.p.v. Excel);
★★★★ in een W3C triple formaat (bv. RDF);
★★★★★ met duurzame links naar andere LOD.
LOUD?
In 2018 vulde Rob Sanderson (The Getty Institute) deze LOD-principes aan toen hij het begrip Linked Open Usable Data (LOUD) voorstelde om het aspect ‘bruikbaarheid’ meer aandacht te geven. Het louter online beschikbaar maken van data als LOD is niet voldoende. Er moet een goede balans zijn tussen ’volledigheid’ en ‘bruikbaarheid’ om de noden van verschillende doelgroepen beter te ondersteunen. De bijkomende vereisten om data LOUD te maken zijn o.a. ‘juiste’ selectie van data, eenvoudige patronen, meer praktische voorbeelden en handleidingen en gebruik van JSON-LD.
Gelinkte data in de praktijk
De website lod-cloud.net biedt een overzicht van beschikbare LOD-datasets uit verschillende sectoren. Eén relevant LOD-project is Virtual International Authority File (VIAF), een internationaal online LOD-thesaurusbestand van auteursnamen die voorkomen in catalogi van diverse bibliotheken in de wereld. Een ander populair en sectoroverschrijdend LOD-voorbeeld is Wikidata: een gezamenlijk bewerkbare database van Wikimedia Foundation die gegevens als LOD beschikbaar maakt voor hergebruik, zowel voor mensen als voor machines.
Het is steeds meer de norm voor bibliotheken, archieven en documentatiecentra om gegevens over hun collecties als LOD beschikbaar te maken. De principes die je daarbij best hanteert zijn:
- maak je eigen data beschikbaar in een vorm dat men er duurzaam naar kan linken;
- link je data waar mogelijk aan bestaande LOD-bronnen;
- verhoog de bruikbaarheid van je data door het zo simpel mogelijk te maken voor je doelgroepen.