Publicatie:Persistente links
Linkrot. De frustratie van menig internetgebruiker en de vrees van menig webbeheerder. Linkrot is het fenomeen waarbij een link naar een document niet meer werkt omdat de koppeling met het digitale bestand verbroken is. Wanneer je een grote hoeveelheid documenten uit je collectie op het web plaatst, denk je dan ook best na hoe je linkrot voorkomt. Hoe kan je links naar documenten zo ‘persistent’ mogelijk maken?
Titel | Persistente links (Voorkeurstitel) |
Locatie | META nummer 2013/5 |
Uitgever | |
Jaar van uitgave | 2013 |
Rechten | CC-BY-SA |
Persistent ID |
Auteur
Bert Lemmens (PACKED vzw)
Persistente links
Linkrot. De frustratie van menig internetgebruiker en de vrees van menig webbeheerder. Linkrot is het fenomeen waarbij een link naar een document niet meer werkt omdat de koppeling met het digitale bestand verbroken is. Wanneer je een grote hoeveelheid documenten uit je collectie op het web plaatst, denk je dan ook best na hoe je linkrot voorkomt. Hoe kan je links naar documenten zo ‘persistent’ mogelijk maken?
Elke tekst, foto of film die je op het web plaatst krijgt een webadres. Als je bijvoorbeeld http://www.vvbad.be/meta/persistente-links in de adresbalk intikt, kan je dit artikel lezen in je webbrowser. Door het webadres te verspreiden wordt het artikel voor mensen en zoekmachines vindbaar op het web.
Maar wat als het webadres van een document verandert? Bijvoorbeeld omdat de indeling van je collectiewebsite wordt omgegooid. Of omdat het nieuwe CMS andere webadressen aanmaakt. In beide gevallen zit je met een heleboel veranderende links. Het gevaar dreigt dat je collectie onvindbaar wordt op het web. Om dit te voorkomen kan je een aantal voorzorgen nemen.
Maak op je collectiewebsite een onderscheid tussen informatie die tijdelijk of veranderlijk is (bv. contactgegevens, nieuws en informatie over evenementen) en informatie die onveranderlijk of ‘persistent’ is, zoals gegevens uit de collectiecatalogus of digitale representaties van collectiestukken. Gebruik voor de laatste categorie een afzonderlijke subdomeinnaam, die de gebruiker aangeeft dat hij op dit webadres de digitale collecties terugvindt (bv. http://collectie.naamvanmijnorganisatie.be). Op die manier kan je de collectiewebsite makkelijk wijzigen of vernieuwen, zonder dat je aan de webadressen van je digitale collectie hoeft te raken[1].
Een webadres (URI) heeft twee functies: Het geeft een document een ‘naam’ (URN) waarmee het uniek geïdentificeerd wordt op het web en het bepaalt de ‘locatie’ (URL) op een webserver waar je browser het document kan terugvinden. Het HTTP-protocol biedt de mogelijkheid een onderscheid te maken tussen ‘naam’ en ‘locatie’ van een bestand. Je kan (met hulp van je webbeheerder) je webserver zo instellen dat hij, op basis van een onveranderlijke webadres (bv. http://collectie.mijnorganisatie.be/referentie), het document op een ander webadres http://mijnbeeldbank.be/afbeeldingen/mijnbestand.jpg) terugvindt. Gebruik die mogelijkheid om documenten steeds hetzelfde webadres te laten behouden, wanneer je documenten verplaatst of nieuwe versies publiceert.
Denk ook goed na over de vorm van het webadres. Gebruik voor de ‘naam’ van een document enkel informatie die zelden of nooit verandert. Beperk je dus tot de informatie die het document identificeert en vermijd informatie die eigenschappen van het document weergeven (bv. de datum, het versienummer of de bestandsextensie). Gebruik de volgende opbouw: http://domeinnaam/type/concept/referentie[2] , waarbij:
- domeinnaam: de naam van de server
- type: het type document (beschrijving, afbeelding, video)
- concept: het type object (archiefstuk, boek, schilderij)
- referentie: het identificatienummer van het document
Vermijd tenslotte ook het gebruik van zogenaamde query strings: dit zijn URL’s waarin gegevens zijn opgenomen die door een programma op de webserver worden ingelezen, waarna dat programma het juiste document opzoekt. Een query string is te herkennen aan het vraagteken in het webadres (bv. http://www.domeinnaam/foto.aspx?id=34). Ook deze elementen zijn immers onderhevig aan verandering.
Naast een slim gebruik van het HTTP-protocol en een goede naam voor het document, staat of valt de persistentie van een webadres met de infrastructuur en organisatie die haar beheert. Ook hier kan je aantal voorzorgen nemen. Gebruik voor de opslag van de digitale documenten een afzonderlijke server die specifiek voor dit doel werd ingericht. Zorg dat je organisatie controle heeft over de domeinnaam van deze server.
Voetnoten
- ↑ Een alternatief is alle ‘persistente’ documenten onderbrengen in één bepaalde map (bv. www.mijnorganisatie.be/collectie).
- ↑ Het ISA programma van de Europese Commissie maakte een vergelijkende studie van de naamgevingsprotocollen in verschillende Europese landen en formuleerde 10 aanbevelingen voor persistente links, waaronder deze standaard opbouw. Zie: Archer, Phil, D7.1.3 - Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC, v0.16 (17/12/2012): .