Publicatie:UGent SIP Creator:Metadata voorbereiden
De UGent SIP Creator maakt bags: containerbestanden waarin data, metadata en checksums samen worden bewaard. Bags worden gebruikt om bestanden op een veilige manier over een netwerk te transporteren en om digitale bestanden te bewaren in een digitaal depot.
De UGENT SIP Creator tracht een containerbestand te creëren dat zo generiek mogelijk is, waardoor het digitale archief op een later ogenblik makkelijker opgenomen kan worden in een digitaal depot naar keuze. Daartoe wordt de metadata vastgelegd in een standaard tekstbestand: een METS XML-bestand. De UGent SIP Creator kan zo een METS XML-bestand volautomatisch genereren, als de gebruiker de metadata aanlevert in een van de volgende formaten:
- een valide XML-bestand dat wordt geëxporteerd uit een lokaal archiefbeheerssysteem. Gebruik bij voorkeur een standaard uitwisselingsformaat dat ondersteund wordt door de Library of Congress. In dat geval kan de UGent SIP Creator de metadata precies integreren in het METS XML-bestand en eventueel transformeren in een ander formaat.
- een standaard CSV-bestand dat gemaakt werd met behulp van het SODA:Invulformulier en waarin het digitaal archief beschreven wordt met behulp van EAD en PREMIS elementen.
- een bag-info.txt bestand dat je schrijft in een tekstverwerker en waarin het digitaal archief beschreven wordt met behulp van Dublin Core elementen.
1. Valide XML-bestand
De UGent SIP Creator kan metadata automatisch opslaan in een METS XML-bestand als het oorspronkelijke XML-bestand gevalideerd wordt door een van de volgende door de Library of Congress ondersteunde metadatastandaarden: MARC, MODS, EAD, MADS, DC volgens OAI, AMD, TextMD, VMD, Premis. Wanneer je metadata volgens een van deze standaarden exporteert uit je collectiebeheersysteem, controleer dan of de header van het XML-bestand de namespace vermeldt van de gebruikte standaard. Dit is noodzakelijk om het XML-bestand te valideren en de metadata succesvol in een METS XML-bestand te mappen.
LET OP! Als in de header van het XML-bestand een door de Library of Congress ondersteunde metadatastandaard staat, maar het aangeleverde XML-bestand voldoet niet aan deze standaard, dan wordt de import geweigerd. Als in de header van het XML-bestand geen namespace staat, zal het XML-bestand wel worden geïmporteerd, maar met de waarschuwing dat de metadata een zeer beperkte ondersteuning kent bij opname in een digitaal depot. Dit geldt ook voor XML-bestanden die worden gevalideerd volgens een ander schema (bvb een XML schema dat specifiek door jouw archiefbeheersysteem wordt gebruikt): de gegevens uit het XML-bestand zullen worden opgenomen in het METS XML-bestand, maar je krijg eveneens de waarschuwing dat de metadata een beperkte ondersteuning kent bij opname in een digitaal depot.
2. CSV-bestand
Indien de metadata niet beschreven zijn in een archiefbeheersysteem, is het mogelijk om aan het containerbestand metadata toe te voegen door middel van een CSV-bestand. Deze mogelijkheid werd in de software opgenomen omdat veel programma’s CSV ondersteunen voor import of export, en het op die manier het uitwisselen van data mogelijk maakt.
AMVB heeft in samenwerking met Packed vzw een formulier uitgewerkt waarin metadata kan worden opgenomen. Dit formulier kan worden omgezet naar een CSV-bestand, en zodoende worden opgeladen in de UGent SIP Creator. Meer uitleg en een handleiding hiervan vind je hier.
Bij het aanmaken van een bag kan je vervolgens dit CSV-bestand opladen. De UGent SIP Creator zal dan de metadata omzetten in een METS xml-bestand.
3. bag-info.txt bestand
Een bag-info.txt bestand is een eenvoudig tekstbestand, en dus een toegankelijke manier om metadata toe te voegen. Je hebt hiervoor geen kennis van informatica nodig, maar wel veel tijd, want dit vergt manueel werk.
Een bag-info.txt bestand moet voldoen aan de volgende eisen:
- Het bestand moet een .txt-file zijn
- Het bestand moet Dublin Simple Elements bevatten
- De bestandsnaam is bij voorkeur bag-info.txt, waarmee je te kennen geeft dat dit bestand de beschrijvende metadata bevat.
Een bag-info.txt bestand bevat een vlakke beschrijving van de bag met behulp van Dublin Core elementen. Wat er aan beschrijvende metadata wordt opgenomen, daar ben je zeer vrij in: zeer uitgebreid of zeer beperkt. Zo lang de structuur DC-Element maar gerespecteerd wordt:
DC-AccessRights: ugent DC-Creator: Claus, Hugo DC-Identifier: rug01: 000009017 DC-Title: Het verdriet van België
De UGent SIP Creator voegt daaraan nog twee administratieve elementen, Bag-Size en de Bagging-Date, toe. Het eindresultaat ziet er bijvoorbeeld uit als volgt:
Bag-Size: 758.7 KB Bagging-Date: 2011-01-09 DC-AccessRights: ugent DC-Creator: Claus, Hugo DC-Identifier: rug01: 000009017 DC-Title: Het verdriet van België
Met behulp van deze DC elementen, kan de UGent SIP Creator deze gegevens opnemen in het METS XML-bestand.