Publicatie:Information Package

Uit Meemoo Kennisbank
Naar navigatie springen Naar zoeken springen


Samenvatting

Een information package (IP) is een container waarin een of meerdere digitale objecten opgenomen zijn in een digitaal depot. De term is afkomstig uit het Open Archival Information System-model (OAIS), een ISO-standaard voor de langetermijnbewaring van digitale informatie.


Referentie
Titel Information Package (Voorkeurstitel)
Locatie META nummer 2023/5
Uitgever
Jaar van uitgave 2023
Rechten CC-BY-SA
Persistent ID


Auteur

Nastasia Vanderperren (meemoo, Vlaams instituut voor het archief)

Object, bestanden en metadata

De structuur van de meemoo-SIP. Bron: developer.meemoo.be/ docs/diginstroom/sip/1.0/ sip_structure

In een digitaal depot zitten digitale objecten, zoals publicaties of archiefbestanden. Een digitaal object kan uit een of meerdere bestanden bestaan, bijvoorbeeld één PDF-bestand of de verschillende TIFF-bestanden van een gedigitaliseerde krant. Een IP bevat de verschillende bestanden samen met metadata die bij het object en de bestanden horen.

Digitale bestanden zijn een combinatie van enen en nullen. Als je computer niet weet volgens welk bestandsformaat die nullen en enen gecodeerd zijn of met welke software het bestand geopend kan worden, dan is het niet meer leesbaar. Bovendien evolueren software en bestandsformaten. Het is goed mogelijk dat de software die we nu gebruiken binnen tien jaar niet meer bestaat. Daarom is het belangrijk om voor langetermijnbewaring van digitale bestanden ook de technische informatie van de bestanden mee in de IP te bewaren.

Net zoals bij een fysiek archiefstuk of een fysieke publicatie is beschrijvende informatie nodig, zodat een eindgebruiker een bepaald object kan opvragen of in zijn context kan plaatsen. Denk bijvoorbeeld aan de titel of de auteur van een publicatie.

Een derde soort metadata die opgenomen wordt, bestaat uit preserveringsmetadata, zoals checksums om te controleren of de bestanden in het digitaal depot juist overgebracht werden, een identifier om de bestanden ondubbelzinnig te kunnen identificeren en gegevens over de acties die op de bestanden uitgevoerd werden (bijvoorbeeld een virusscan). Deze informatie is nodig om de authenticiteit van de bestanden te garanderen.

Tot slot wordt structurele informatie bewaard. Als bij een gedigitaliseerde krant niet vastgelegd wordt wat de intellectuele volgorde is van de verschillende bestanden, dan is het voor de gebruiker moeilijk om die krant goed te interpreteren. Al deze relaties worden vastgelegd in de structurele metadata, net als de structuur van het informatiepakket zelf, zodat het onderscheid tussen de metadata en de digitale objecten duidelijk is.

Soorten IP’s

Een IP kun je zien als een mappenstructuur waarin de bestanden van het digitaal object in een bepaalde map zitten en de metadata, meestal in de vorm van XML-bestanden, in andere mappen. De structuur ervan wordt bepaald door het digitaal depot. In theorie kun je zelf een IP maken, maar in de praktijk wordt deze gecreëerd door software. Er worden drie soorten IP’s onderscheiden:

  1. De Submission Information Package (SIP) is het pakketje dat aangeleverd wordt aan het digitaal depot. De beheerder van het digitaal depot bepaalt de structuur van de SIP.
  2. Nadat de SIP in het digitaal depot opgenomen is, zal er een Archival Information Package (AIP) gemaakt worden. In deze fase worden preserveringsmetadata toegevoegd over acties die het digitaal depot op de bestanden uitvoert.
  3. Wanneer een gebruiker iets opvraagt, wordt de Dissemination Information Package (DIP) gecreëerd. Dat is een kopie van het digitale object in een bruikbaar formaat, vergezeld door metadata die de eindgebruiker nodig heeft om het digitale object te begrijpen.

Het belang van IP’s

Langetermijnbewaring is meer dan enkel de opslag van de digitale bestanden. Door de combinatie van de metadata en de digitale objecten in een IP zijn alle gegevens aanwezig die nodig zijn voor duurzame bewaring. Dat neemt niet weg dat het voor archieven, bibliotheken en documentatiecentra een uitdaging blijft om al die metadata te voorzien en te beheren, en om een digitaal depot in te richten.