Publicatie:Versiebeheer met persistente URI’s
Elke digitale resource op het web heeft een webadres dat de online locatie ervan aanduidt. Gepubliceerde resources kunnen echter veranderen. In bepaalde gevallen is het relevant om niet enkel de recentste versie online beschikbaar te maken, maar ook alle oudere versies. Hoe doe je dat op een duurzame manier?
Titel | Versiebeheer met persistente URI’s (Voorkeurstitel) |
Locatie | Meta nummer 2023/2 |
Uitgever | |
Jaar van uitgave | 2023 |
Rechten | CC-BY-SA |
Persistent ID |
Auteur
Alina Saenko (meemoo, Vlaams instituut voor het archief)
Persistente URI’s
Als een webadres wijzigt, dreigt er linkrot. Links naar de resource werken dan niet meer. Om dat te vermijden en duurzame toegang te verzekeren, gebruikt men een persistente uniform resource identifier (URI). Dat is een webadres dat (1) een resource (erfgoedobject, concept, beeld, metadata) op het web identificeert, (2) samengesteld is volgens bepaalde syntax- richtlijnen en (3) onveranderlijk blijft door duurzaam beheer ervan.
Versiebeheer
Online resources kunnen door de tijd heen wijzigen en nieuwe versies krijgen. Bijvoorbeeld: de metadata over een erfgoedobject kunnen aangepast worden. Voor historici is zowel de oude als de nieuwe versie relevant. Naar welke versie wil je dan verwijzen? En wil je iedere keer het volledige record opvragen of alleen de laatste wijziging?
Zo beland je bij versiebeheer als onderdeel van documentbeheer. Dat bepaalt welke documentversies bewaard moeten worden en welke afspraken over bestandsnamen nodig zijn. Bij versiebeheer van resources op het web voegt men een timestamp toe aan de persistente URI. Die tijdstempel duidt het moment aan waarop de resourceversie geïdentificeerd werd door de persistente URI, en volgt de ISO 8601-standaard.
Memento-protocol
Het raadplegen van een resourceversie via zo’n URI met een tijdstempel vereist een infrastructuur die zowel de bijbehorende resourceversie bewaart en op het web beschikbaar maakt als de navigatie naar de juiste versie ondersteunt.
Deze processen worden besproken in het Memento-protocol (RFC 7089. HTTP Framework for Time-Based Access to Resource States). Het behandelt de noodzakelijke componenten voor zo’n infrastructuur: de eigenlijke resource, de memento’s (oudere versies van de resource), een TimeGate die je doorstuurt naar het memento dat het dichtst bij een bepaalde tijdstempel ligt en de TimeMap die een overzicht geeft van alle beschikbare memento’s.
De uitwerking en de implementatie van een of meerdere van die componenten kunnen door organisaties zowel individueel als in groep gedragen worden. Meer informatie vind je op mementoweb.org.
Voorbeelden
The Internet Archive Wayback Machine gebruikt een tijdstempel in de URI voor elke gearchiveerde versie van een website, bijvoorbeeld https://web.archive.org/web/20010331120615/http://www. vvbad.be/. Ook Wikipedia gebruikt het protocol voor de oudere versies van zijn artikels.
In het project Collectie van de Gentenaar worden persistente URI’s met een tijdstempel gebruikt voor elke versie van een metadatarecord over een erfgoedobject: https://stad.gent/data/mensgemaaktobject/dmg/530026423/2023-01-06T22:56:51.828Z.
Zelf aan de slag?
De combinatie van persistente URI’s, tijdstempels en een infrastructuur die voldoet aan het Memento-protocol maakt een dynamisch versiebeheer van individuele online resources mogelijk. De huidige use cases in de erfgoedsector hebben vooral betrekking op het beschikbaar maken van versies van beelden van en metadata over erfgoedobjecten bij aggregatie naar een centraal online platform. De versies van de metadatarecords worden duurzaam geïdentificeerd en enkel de recentste update wordt doorgestuurd naar het centraal platform. Zo wordt de infrastructuur niet telkens overladen met een export van alle metadata
Als je zelf aan de slag wilt gaan met een dergelijk dynamisch versiebeheer moet je je vooraf afvragen wat je er precies mee wilt bereiken en hoe centraal of decentraal de nodige infrastructuur ingericht kan worden.