Publicatie:UGent SIP Creator:Bags maken
Een bag maak je in vier stappen:
- Een nieuwe bag aanmaken en hem een uniek identificatienummer geven;
- De digitale bestanden selecteren die je in de bag wil stoppen;
- De metadata in de bag stoppen;
- De bag creëren en opslaan.
Vooraleer aan deze stappen te beginnen, controleer of de volgende dingen klaar zijn:
- De digitale bestanden zijn verzameld op een netwerklocatie, draagbaar medium of lokale schijf.
- De bestandsnamen zijn genormaliseerd.
- De metadata is verzameld in een XML-, CSV- of bag-info.txt bestand.
1. Een nieuwe bag aanmaken
- Start de UGent SIP Creator software
- Klik op BagIt in de menubalk en kies Nieuwe bag of klik op het icoontje Nieuwe bag of toets Ctrl+N.
- Er opent een nieuw venster waarin je het identificatienummer van de bag bepaalt. De UGent SIP Creator genereert automatisch een Universally Unique Identifier (UUID). Je kan deze overschrijven en zelf een identifier toekennen, maar we raden aan de voorgestelde identifier te kiezen, om uniciteit praktisch te garanderen.
LET OP! De identifier moet beginnen met een letter (geen cijfer). Indien ongeldig, zal het tekstvak rood kleuren en is het niet mogelijk een bag aan te maken.
2. Bestanden toevoegen
- Ga naar 2. Data toevoegen.
- Klik op het groene icoontje Voeg toe. Er opent een dialoogvenster gelijkend op een Windows Verkenner. Dit kan enkele seconden duren.
- Selecteer de map(pen) en/of bestanden die je wil toevoegen aan de bag.
LET OP! De bestanden dienen wel geldige bestandsnamen te hebben. Indien dit niet het geval is krijg je een foutmelding. Sluit in dat geval de bag door Sluit bag te selecteren in het menu BagIt of toets Ctrl+X.
LET OP! Bij het selecteren van bestanden uit diverse bronmappen: eenzelfde bag kan geen meerdere bestanden met dezelfde bestandsnaam bevatten. - De toegevoegde bestanden verschijnen in de linker helft van het scherm. Mappen zijn uitklapbaar, zodat onderliggende mappen en bestanden zichtbaar gemaakt kunnen worden.
Indien een bestand of map verwijderd moet worden uit de selectie:
- Selecteer het betreffende bestand of de betreffende map.
- Klik op het icoontje Verwijder selectie.
3. Metadata toevoegen
Er zijn vier verschillende manieren om metadata toe te voegen aan een bag:
- 1. met een valide XML-bestand;
- 2. met een CSV-bestand;
- 3. met een bag-info.txt bestand;
- 4. manueel, door middel van Dublin Core Elements
3.1 Een valide XML-bestand
Voeg bij voorkeur metadata toe door middel van een valide XML-bestand met de volgende stappen:
- Ga naar 3. Metadata toevoegen.
- Selecteer het tabblad Vanuit bestand.
- Klik op Voeg toe. Een drop down menu verschijnt.
- Selecteer XML.
- Blader naar de map waarin het XML-bestand zit opgeslagen. Selecteer het gewenste XML-bestand.
- Klik op Open. Het geselecteerde XML-bestand verschijnt in de lijst van toegevoegde metadatabestanden. In deze lijst geeft de UGent SIP Creator welk formaat het XML-bestand heeft:
- de namespace waarmee de data wordt gevalideerd;
- het type metadata formaat. De UGent SIP Creator herkent vijftien verschillende types XML-bestanden: MARC, MODS, EAD, DC, NISOIMG, LC_AV, VRA, TEIHDR, DDI, FGDC, LOM, PREMIS, TEXTMD, METSRIGHTS, ISO_19115_2003_NAP en OTHER. Het laatste type omvat alle andere XML schema's.
- de naam van het root-element van het XML-document.
- Dubbelklik op een lijn in de lijst om de inoud van het XML-bestand te tonen. Je kan het XML-bestand eventueel ook van een "label" voorzien waarmee je aangeeft over welke metadata het gaat.
Het type XML-bestand dat de UGent SIP Creator identificeert bepaalt hoe de metadata in het METS XML-bestand wordt geïntegreerd, m.a.w. in welke secties van het METS XML-bestand de metadata wordt ondergebracht. Het 'type' zal daarbij opgenomen worden in de 'moeder'-tag van de betrokken sectie.
LET OP! Voeg géén mets.xml bestand toe. De opgeladen XML zal worden omgezet naar een mets.xml-bestand. Zo ontstaat een mets.xml in een mets.xml en dat geeft verwarring.
LET OP! XML-bestanden die als OTHER worden geïdentificeerd worden zonder meer opgenomen in de sectie met descriptieve metadata (mets:dmdSec). De UGent SIP Creator kan deze metadata niet transformeren naar een ander formaat.
3.2 CSV-bestand
Indien de metadata niet beschreven zijn in een archiefbeheersysteem, is het mogelijk om metadata toe te voegen aan de bag door middel van een CSV-bestand. Net als bij het XML-bestand, dient dit CSV-bestand aangemaakt te worden vooraleer de bag wordt aangemaakt. AMVB en Packed vzw hebben een formulier gemaakt dat de aanmaak van een CSV-bestand mogelijk maakt: het SODA:Invulformulier.
- Ga naar 3. Metadata toevoegen.
- Selecteer het tabblad Vanuit bestand.
- Klik op Voeg toe. Een drop down menu verschijnt.
- Selecteer CSV
- Blader naar de map waarin het CSV-bestand zit opgeslagen. Selecteer het gewenste CSV-bestand.
- Klik op Open. Er verschijnt een nieuw dialoogvenster.
- Kies een scheidingskarakter: kies het scheidingskarakter tussen de veldnamen en de veldwaarden (komma, puntkomma, spatie of tab).
- Kies een aanhalingskarakter: door aanhalingstekens kan de software eventuele leestekens in de veldwaarden niet verkeerdelijk interpreteren als een scheidingskarakter. Kies enkele of dubbele aanhalingstekens als aanhalingskarakter.
- Klik op Voltooien
3.3 bag-info.txt bestand
Indien je collectiebeheersysteem niet beschikt over de functionaliteit om XML-exports te maken en je hebt ook geen CSV-file ter beschikking, dan is er nog een derde mogelijkheid om metadata toe te voegen: een bag-info.txt bestand.
Een bag-info.txt bestand bevat een vlakke beschrijving van de bag, uitgedrukt in Dublin Core Elements. Hoe zo'n bag er uit moet zien, en wat de restricties zijn, vind je hier . Doordat het bestand DC elementen bevat, kan de UGent SIP Creator metadata mappingen maken op basis hiervan.
- Ga naar 3. Metadata toevoegen
- Selecteer het tabblad Vanuit bestand.
- Klik op Voeg toe. Een drop down menu verschijnt.
- Selecteer BAG-INFO
- Blader naar de map waarin het bag-info.txt bestand zit opgeslagen. Selecteer het gewenste bag-info.txt bestand en klik op Open. Het bag-info.txt bestand zal worden geconverteerd naar Dublin Core (OAI).
- Klik op Voltooien om het bag-info.txt bestand toe te voegen aan de bag
3.4 Metadata manueel toevoegen
Indien de metadata niet kunnen worden opgeladen vanuit een bestand, of indien deze metadata ontoereikend zijn, kan je manueel metadata toevoegen:
- Ga naar 3. Metadata toevoegen.
- Selecteer het tabblad Manueel. Het tabblad bevat een invulformulier dat standaard de elementen van Dublin Core Simple bevat en vier specifieke elementen voor de bag (Bag-ID, Payload-Oxum, Bag-Size en Bagging-Date).
- Vul de velden in met de beschrijvende metadata voor de bag:
- Door het vakje Standaard aan te vinken, kan je extra Dublin Core Simple elementen toevoegen. Eenzelfde DC-element mag meermaals voorkomen (behalve Bag-ID). Het is geen verplichting om alle velden in te vullen.
- Door het vakje Standaard uit te vinken, kan je ook andere elementen toevoegen. Maak in de eerste velden (de velden die de eerste kolom zullen vormen) enkel gebruik van letters, cijfers, koppeltekens en underscores. Gebruik bij voorkeur elementen uit een andere metadatastandaarden (bvb ead-creator, mods-title).
3.5 Overige metadata?
Indien je nog metadata wil opladen vanuit andere bestanden, kan je deze niet opladen als metadata, maar wel onder Data toevoegen. Deze bestanden worden dan mee opgenomen in de bag, maar de metadata zal niet kunnen worden gemapt naar andere standaarden.
4. Bag opslaan
- Ga naar '4. Opslaan
- Klik op het icoontje Opslaan als onderaan of op het icoontje Opslaan als... in de menubalk bovenaan. Er opent een nieuw venster.
- Bepaal in het veld Bestand de bestandsnaam van de bag. De UGent SIP Creator stelt de reeds aangemaakte UUID voor als bestandsnaam. Klik op Selecteer om (eventueel) een nieuwe bestandsnaam en een locatie voor de bag te bepalen.
- Bepaal in het veld Type opslag het bestandstype als dewelke de bag moet worden opgeslagen. De UGent SIP Creator kan bags op vijf verschillende manieren opslaan:
- als map: Dit is de standaard manier om een bag op te slaan: een mappenstructuur. Daarbij vormt de bag de hoofdmap, met daarin een submap data. Op hetzelfde niveau als de data wordt de metadata en de checksums opgeslagen. De bag wordt niet gecomprimeerd. Dit is de manier van opslaan die het minst rekenkracht vergt van de computer.
- als zip-bestand: Bij deze manier van opslaan wordt de bag-it mappenstructuur verpakt in een gecomprimeerd archiefbestand. De compressie is mathematisch lossless. Zip is een open compressiestandaard, en wordt door alle besturingssystemen ondersteund.
- als tar-bestand: Een tar-bestand is een archiefbestand dat de bag-it mappenstructuur opslaat. Deze tar vindt zijn oorsprong in backups, en is ongecomprimeerd. Default wordt tar enkel ondersteund op Linux en Mac.
- als tar.gz-bestand: Een tar.gz-bestand is de –uiteraard lossless- gecomprimeerde variant van het tar-bestand. De gebruikte compressiestandaard is gzip. Net als tar wordt tar.gz enkel ondersteund door Linux en Mac.
- als tar.bz2-bestand: Een tar.bz2-bestand is eveneens een lossless gecomprimeerde variant van het tar-bestand. De gebruikte compressiestandaard is bzip2, de opvolger van gzip. Deze geeft een betere compressie, maar is eveneens zwaarder qua verwerking. Ook deze wordt standaard enkel op Linux en Mac ondersteund.
- Bepaal in het veld Type checksum het algoritme waarmee de UGent SIP Creator een checksum genereert waarmee je op een later tijdstip de integriteit van de bag kan controleren. De UGent SIP Creator biedt vier verschillende algoritmes aan. Ze zijn gerangschikt van eenvoudig naar meer complex. De laatste zijn dus “veiliger”, maar vereisen eveneens meer rekencapaciteit van de processor om te maken of te controleren.
- MD5: gebaseerd op een checksumalgoritme dat een checksum van 32 tekens oplevert. MD5 is een populair algoritme op het web.
- SHA1: gebaseerd op een checksumalgoritme dat een checksum van 40 tekens oplevert.
- SHA256: gebaseerd op een checksumalgoritme dat een checksum van 64 tekens oplevert (i.e. 64 hexadecimalen, dus 256 bits).
- SHA516: gebaseerd op een checksumalgoritme dat een checksum van 128 tekens oplevert (i.e. 128 hexadecimalen, dus 521 bits).
- Klik op Voltooien om de bag op te slaan.