Publicatie:Standaard XML Schema's
Vetgedrukte tekst Vaak is het delen van namen van elementen niet voldoende om de data uit je inventaris correct te interpreteren. Dit geldt vooral voor inventarissen waarin de beschreven objecten hiërarchisch geordend zijn. Dit is bijvoorbeeld het geval voor archiefinventarissen die gebruik maken van het multi-level description principe ontleend aan Standaard:ISAD(G) of voor bibliotheekcatalogi die gebruik maken van de Standaard:FRBR-entiteiten work-expression-manifestation-item. Voor deze inventarissen is een standaard namespace niet voldoende, maar gebruik je best een standaard XML Schema dat ook de structuur van de data vastlegt.
In een aantal domeinen in de erfgoedsector is er een groeiende consensus rond het gebruik van standaard uitwisselingsformaten voor de uitwisseling van data tussen collectieinventarissen. Dit maakt het mogelijk om op grote schaal data tussen collecties uit te wisselen en zo een groot aantal collecties doorzoekbaar te maken via eenzelfde online portaal. Om geen afbreuk te doen aan de eigenheid van de verschillende soorten mediaresources, worden domein-specifieke XML-Schema's ontwikkeld die de mogelijkheid bieden om je data zeer gedetailleerd te beschrijven. De belangrijkste datastructuren voor domeinspecifieke standaard XML-Schema's zijn:
- Standaard:MODS en MARCXML voor bibliotheken
- Standaard:EAD voor archieven
- Standaard:LIDO voor musea
Naast domeinspecifieke XML Schema's zijn er ook standaard XML-Schema's die alle soorten media resources proberen te vatten. Het meest verspreide grensoverschrijdende XML-schema is Dublin Core (zie ook Dublin Core namespace). Het grote voordeel van Dublin Core is dat het XML-Schema zowat alle bestaande mediaresources van metadata kan voorzien. Het grote nadeel is dan weer dat het schema zeer beperkt is: het kan alle mediaresources beschrijven, maar geen enkel in detail.
Daarnaast bestaan er ook specifieke uitwisselingsstandaarden voor data over digitale representaties:
- Standaard:PREMIS is een XML Schema met uitgebreide mogelijkheden voor het beschrijven van administratieve en structurele metadata over digitale representaties.
- Standaard:ALTO is een XML-Schema voor administratieve en structurele data over documenten die geproduceerd zijn door Optical Character Recognition (OCR).
Opmerking: Het is belangrijk om de aandacht te vestigen op het feit dat deze XML Schema's ontwikkeld werden voor het uitwisselen van data over objecten; niet voor het documenteren van data over objecten (bv. het opnemen van informatie in een collectiebeheersysteem). De hierboven vermelde standaarden bevatten vooral beschrijvende data, die het object identificeren en documenteren, en een selectie administratieve data, die nodig is voor de correcte uitwisseling van de data (rechten, relaties). Voor het beheer van collecties zijn administratieve data nodig die je niet met iemand buiten je organisatie wil delen (standplaatsen, gegevens over verwerving, conditie en conservatierapporten). De gegevens van je digitale inventaris die je in je collectiebeheersysteem bewaard zijn dus vaak veel uitgebreider dan de data die je wil delen met andere computersystemen.
Daarom is het belangrijk om de exportmogelijkheden van je collectiebeheersysteem te bekijken en te onderzoeken of je software de data uit je systeem makkelijk kan exporteren naar een standaard uitwisselingsformaat. In het CEST software register vind je een overzicht van softwareprogramma's voor collectiebeheer en de uitwisselingsstandaarden die ze ondersteunen.
Wanneer je collectiebeheersysteem je data niet in een standaard uitwisselingsformaat kan exporteren, is het noodzakelijk om je data van een XML-document met een softwarespecifiek formaat naar een standaardformaat te mappen. XML biedt een aantal mogelijkheden om de structuur van XML-documenten op eenvoudige wijze te transformeren. Hoe dat in zijn werk gaat, lees je op de volgende pagina.