Publicatie:Registratie van audio cd-r discs voor migratie

Uit Meemoo Kennisbank
Naar navigatie springen Naar zoeken springen


Samenvatting

In deze gevalstudie vindt u een bondig overzicht van de registratie die vooraf ging aan migratie van audio cd-r discs door het Vlaams Instituut voor Archivering (VIAA). Ze is gebaseerd op de resultaten van de registratie door de Content Providers (CP's) in het AMS-registratiesysteem van VIAA.

Bij de aanvang van het migratieproject werd uitgegaan van bepaalde geschatte cijfers en voorspellingen wat betreft omvang, timing en budget. Absolute cijfers ontbraken bij de CP's. Zowel voor VIAA als CP's zelf was de registratie dus een manier om de te migreren collecties beter te leren kennen.


Referentie
Titel Registratie van audio cd-r discs voor migratie (Voorkeurstitel)
Locatie
Uitgever
Jaar van uitgave 2016
Rechten CC-BY-SA
Persistent ID


Auteur(s)

Loes Nijsmans (VIAA)

Status

De registratie (en de daaropvolgende migratie) zijn afgerond.

De vooropgestelde timing voor de registratie was van 1 november 2014 tot 11 maart 2015. De effectieve registratie liep van 20 oktober 2014 tot 1 juli 2015. Dit is ongeveer vier maanden langer dan in de originele planning voorzien. De eerste audio cd-r disc werd geregistreerd door IFF, de laatste werd geregistreerd door S.M.A.K.

Deze gevalstudie heeft enkel betrekking op de registratie. Voor de gevalstudie over de digitalisering, klik hier.

Er werden door de SP in totaal 1.209 cd-r’s verwerkt. Dat is ongeveer een derde minder dan oorspronkelijk werd ingeschat. Dit is deels toe te schrijven aan het feit dat de 200 door het ModeMuseum Hasselt in de inventarisatie opgegeven audio cd-r discs uiteindelijk andere optische formaten dan audio cd-r discs bleken te zijn. Ook bij de andere CP’s waren de uiteindelijke aantallen wat lager dan oorspronkelijk opgegeven.

Daarbij moet nog een belangrijke kanttekening gemaakt worden: er werden oorspronkelijk 1.200 dragers naar de SP getransporteerd. Daar werd echter opgemerkt dat er enkele doosjes waren waarin zich meerdere schijfjes bevonden waarvan de SP geen metadata had ontvangen. Er zat dus niets anders op dan extra records aan te maken in AMS per extra schijf. Die negen audio cd-r discs werden dan verzameld in een extra batch (CDRB02A), maar hoefden dus niet meer fysiek getransporteerd te worden. Zo kwam VIAA op een totaal van 1.209 records, en dus 1.209 digitale bestanden.

De geregisteerde audio cd-r discs waren afkomstig van zestien CP's uit de cultureel-erfgoedsector:

  • ADVN;
  • AMSAB;
  • Cultureel Erfgoed Annuntiaten;
  • Den AST;
  • IFF;
  • KC Antwerpen;
  • Letterenhuis;
  • M HKA;
  • Museum Dhondt-Dhaenens;
  • Museum dr. Guislain;
  • Provinciale Bibliotheek Limburg;
  • S.M.A.K.;
  • Stadsarchief & HIDOC Dendermonde;
  • Stadsarchief Gent;
  • Stadsarchief Waregem;
  • UGent.

Ondanks dat er dus zeven CP's bij kwamen ging het aantal audio cd-r discs toch naar beneden. Deze zeven extra partners behoren tot Kring 2, die in 2014 werd bevraagd en in 2015 CP werden bij VIAA (Kring 2).

Dit migratieproject krijgt bovendien mogelijk later nog een uitbreiding. Bij de CP’s van VIAA kunnen immers nog steeds audio cd-r discs binnenkomen. Daarnaast voorziet VIAA ook om vanaf 2016 zijn groep van CP’s uit te breiden, die op hun beurt nog over audio cd-r discs kunnen beschikken. De audio cd-r discs die op die manier nog aangemeld worden, kunnen gebundeld worden in één of meerdere extra batches, die later gedigitaliseerd kunnen worden door dezelfde SP, Picturae (Heiloo, Nederland).

Probleemstelling

Het Vlaams Instituut voor Archivering (VIAA) werd opgericht in december 2012. De eerste stap was het in kaart brengen van het aandeel audiovisueel materiaal in de collecties van een afgebakende kring partners. Dit waren de cultureel erfgoedinstellingen die gesubsidieerd worden binnen het Vlaams cultureel-erfgoeddecreet, de regionale omroepen en de openbare omroep. VIAA heeft daarop in 2013 samen met FARO en PACKED vzw een globale inventaris opgemaakt van audiovisueel materiaal dat aanwezig was door de inventarislijsten, ingevuld door de instellingen zelf, te verzamelen. Op basis van deze cijfers is beslist om te starten met een eerste digitaliseringsgolf van twee videoformaten (Betacam SP en U-matic) en twee audioformaten (kwartduims audiotape en compact audiocassette).

In 2014 hebben VIAA en PACKED vzw een tweede kring partners bevraagd: de stadsarchieven van de centrumsteden en de cultureel-erfgoedinstellingen die erkend zijn binnen het Vlaams cultureel-erfgoeddecreet. Tegelijkertijd bereidde VIAA haar tweede digitaliseringsgolf voor met zes dragerformaten:

  • Betamax;
  • VCR;
  • open reel video;
  • audio cd-r;
  • wasrol;
  • draadspoel.
Afbeelding 1: cd-r disc.


De omvang van de registratie van de audio cd-r discs werd in augustus 2014 als volgt vastgelegd:

  • de CP's registreren 1.816 audio cd-r discs;
  • aangezien de duurtijd van de audio cd-r discs door de CP's in de inventarisatietabellen meestal niet opgegeven werd, werd er bij de aanbesteding uitgegaan van een gemiddelde van 0,8 uur of 48 minuten per schijfje, dus in totaal ongeveer 1.500 uren.
  • er zijn negen CP's betrokken uit de cultureel-erfgoedsector en geen omroepen:
  • ADVN;
  • AMSAB-ISG;
  • In Flanders Fields Museum;
  • KC Antwerpen;
  • Letterenhuis;
  • M HKA;
  • Provinciale Bibliotheek Limburg;
  • S.M.A.K.;
  • UGent.

Het gaat in dit project enkel over zelfgeschreven audio cd-r discs (Orange Book), maar ook de cd-rw valt hierbinnen. Wat duidelijk niet in de scope van dit project valt zijn commerciële (geperste) cd’s, data-cd’s allerhande, cd-rom en dvd-r(w). Hoe een CP deze formaten uit elkaar kon houden, werd toegelicht in de handleiding voor de CP's. In deze gevalstudie zijn de termen ‘audio-cd-r’ en ‘cd-r’ inwisselbaar.

Dit rapport behandelt enkel de registratie van de audio cd-r discs uit de cultureel-erfgoedsector (Kring 1 en 2). De 22.000 audio cd-r discs van de VRT die door de omroep zelf worden gedigitaliseerd vallen hier buiten.

Bij de aanvang van het migratieproject werd uitgegaan van bepaalde cijfers en voorspellingen wat betreft scope, timing en budget. Die cijfers waren vaak gebaseerd op schattingen omwille van het ontbreken van absolute cijfers bij de CP’s. Tijdens het verloop van het project werd duidelijk dat de vooropgestelde cijfers qua aantal te migreren dragers zouden wijzigen.

Methode

Tijdens de voorbereiding en de registratie werden metadata verzameld in het registratiesysteem AMS. Dat registratiesysteem werd op maat ontwikkeld voor VIAA door het Amerikaanse AVPreserve.

De metadata die nodig waren voor de digitalisering en transport werden ingegeven door de CP's zelf. Er werd door alle CP’s samen gedurende veertig werkdagen geregistreerd, en er waren vijftien registratoren aan het werk.


Afbeelding 2: het invulformulier voor de registratie van audio cd-r discs in AMS.


Om de registratie zo vlot mogelijk te laten verlopen, voorzag VIAA een gedetailleerde (interne) handleiding voor de CP's. Hierin stonden onder andere de verschillende kenmerken van een audio cd-r disc beschreven, alsook een toelichting bij alle velden die in te vullen waren in AMS. Er werd ook aan de registratoren ter plaatse een opleiding gegeven door een VIAA-medewerker.

De registratie was zowel voor VIAA als de CP's zelf een manier om de te migreren collectie beter te leren kennen.

Resultaten

Content Providers

Er werden audio cd-r discs van zestien verschillende CP's geregistreerd in dit migratieproject.

KC Antwerpen heeft met 536 het grootste aantal audio cd-r discs. PBL bezit met 2 stuks het kleinste aantal.

Afbeelding 3: de aantallen van de verschillende CP's in aflopende volgorde.

Merk

Tijdens de registratie werden acht verschillende merken opgegeven. TDK kwam van de gekende merken het meest voor: 156 keer, of 13% van het totaal. ‘Onbekend’ en ‘Andere’ werden opvallend veel aangeduid, resp. 395 en 253 keer. In totaal vertegenwoordigen die 54 %; dat is meer dan de helft.

Afbeelding 4: de merken van de audio cd-r discs in oplopende volgorde.

Datum

Om de ouderdom van de audio cd-r discs in te schatten, werd naar de ‘productiedatum’ gevraagd van de inhoud. Doordat de productiedatum van de audio cd-r discs soms moeilijk te achterhalen is, vroegen we om de dichtstbijliggende datum in te geven, hetgeen meestal de datum van opname was. In totaal werden er tweeëndertig verschillende jaartallen genoteerd.

De jongste dateert uit 2015. Er zijn ook enkele audio cd-r discs aangemeld met een datum die voor het op de markt komen van de cd-r zelf ligt: 1950, 1957, 1963, 1964, 1965, 1978, 1979 en 1987. Dit kan er op wijzen dat de inhoud een kopie is van een oudere drager.

De meeste van de gedateerde audio cd-r discs dateren volgens de registratie uit de periode 2000-2010. Het piekjaar is 2006: 158 stuks of 13% van het totaal. In die tijd was het uiteraard al duidelijk dat de audio cd-r disc geen geschikt medium is voor duurzame langetermijnopslag. De CP’s hebben de meerderheid van deze dragers niet zelf geschreven, maar verworven van hun archiefvormers.

Afbeelding 5: de geregistreerde productiedatum van de inhoud van de audio cd-r discs per jaar.


Deze statistiek heeft ook een inhoudelijke waarde en geeft dus een eerste indicatie in verband met de annotatie, als basis voor de toekomstige ontsluiting. Van ongeveer 17% van de opnames afkomstig van de audio cd-r discs is er zelfs geen jaar bekend en zullen archivarissen en collectiebeheerders dus volledig moeten trachten te dateren op basis van de inhoud en/of hun archiefcontext, zodat deze informatie meer volledig en betrouwbaar wordt.

  • Enkel jaar en maand gekend: 38 stuks
  • Enkel jaar gekend: 561 stuks
  • Jaar, maand en dag onbekend (xxxx-xx-xx): 200 stuks

Dit betekent dat 410 audio cd-r discs (34%) tot op de dag gedateerd zijn. Gezien het feit dat dit een recente drager is (die nu nog steeds frequent gebruikt wordt), is dat een vrij klein percentage.

Duur

Volgens de registratie vertegenwoordigden de audio cd-r discs in het totaal 874 uren, 47 minuten en 25 seconden, dat is iets meer dan de helft van de inschatting bij de aanbesteding. De kortst geregistreerde duurtijd was 8 seconden; de langste 6 uren, 2 minuten en 44 seconden. Dit laatste is vermoedelijk een fout, vermits er niet meer dan 80 minuten op een audio cd-r disc kan staan.

De duurtijd die het meest werd aangeduid (na 0 minuten) is 80 minuten (79 keer). Dit is de maximum duurtijd die werd meegegeven in de handleiding en werd vermoedelijk door de CP’s aangeduid omdat ze niet over extra informatie beschikten over de duurtijd. Het feit dat 0 minuten zo vaak werd aangeduid (80 keer), heeft te maken met dezelfde reden. De gemiddelde duurtijd van de geregistreerde audio cd-r discs is 43 minuten en 25 seconden.

Deterioratiefenomenen

Er werd aan de content partners gevraagd om in AMS aan te geven indien er bepaalde deterioratiefenomenen voorkwamen.

Bij audio cd-r discs kunnen er verschillende fenomenen waargenomen worden. Volgende opties konden aangeduid worden door de CP’s tijdens de registratie (meerdere mogelijk):

  • verkleuring;
  • krassen;
  • stift;
  • schilfers;
  • audio speelt niet af;
  • disc rot.

Deze fenomenen zijn ofwel met het blote oog waar te nemen, ofwel door de schijf af te spelen.

Een fenomeen dat specifiek is voor cd-r is disc rot. Disc rot betekent dat het schijfje onleesbaar is, door toedoen van fysische of chemische factoren die de reflectieve laag van de schijf aantasten. Men kan disc rot op 2 manieren herkennen:

  • als men de schijf tegen een sterk licht houdt, ziet men licht schijnen door gaatjes de grootte van een speldenprik
  • als men een verkleuring waarneemt op de schijf, die lijkt op een koffievlek.

Ook ‘Andere’ en ‘Geen’ waren opties die konden aangeduid worden als er respectievelijk een ander deterioratiefenomeen zichtbaar was, dan de opties die in de lijst staan, of als er geen deterioratiefenomenen zichtbaar waren. Dit laatste staat altijd standaard aangeduid, zodat in het geval er zicht geen deterioratie voordoet, de CP dit veld niet telkens moet invullen.

Afbeelding 6: de deterioratiefenomenen zoals aangeduid door de CP’s in de registratie, met 'geen' als duidelijke uitschieter.


Volgens de CP's waren de audio cd-r discs in redelijk goede staat, slechts vierenzeventig schijfjes vertoonden deterioratiefenomenen zoals 'krassen' (26), 'stift' (18), 'speelt niet af' (16) of 'andere' (14). De rest vertoonden volgens de CP's geen tekenen van deterioratie.

Bewaard door een andere VIAA-partner

Er werd aan de content partners ook gevraagd of zij weet hadden van kopieën of originelen die bij andere partners van VIAA bewaard zouden kunnen worden. In vijfendertig gevallen of 3% werd deze vraag positief beantwoord. Deze partner was in vierendertig gevallen VRT, in één geval werd niet aangeduid welke partner dat dan was.

Deze checkbox werd toegevoegd, zodat men hierop in het archiefsysteem kan filteren om eventuele dubbels eruit te halen of andere collecties te verrijken. Het moet nog blijken of deze filter effectief zal gebruikt worden. Toch is dit gegeven ook op een andere manier interessant:

  • het biedt de meest aangeduide content partner (VRT) de kans om in deze collecties op zoek te gaan naar eventuele archiefstukken die zij zelf niet meer hebben.
  • het biedt de oorspronkelijke partner de kans om deze stukken eventueel over te dragen aan de VRT, of indien het om dubbels gaat, te schrappen uit hun eigen collectie.
  • het biedt VIAA de kans om dubbels in kaart te brengen en hierrond een procedure te ontwikkelen.

Gerelateerde documenten in de dragerdoos

Slechts in 108 gevallen (9%) werd deze checkbox aangevinkt. Dit lijkt weinig, maar voor de CP's is het wel interessant snel te kunnen zien bij welke audio cd-r discs er papieren documenten zaten, zodat ze indien gewenst snel weer bij elkaar gebracht kunnen worden na de digitalisering.

Oorspronkelijk dragernummer

Dit vrije veld werd voorzien zodat de CP hier het inventarisnummer van de drager kon invullen, zoals gekend binnen de organisatie. Op die manier is er altijd een link tussen de VIAA-nummering (PID, dit is een unieke nummering automatisch toegekend aan het record in AMS, en de barcode) en het inventarisnmmer van de CP. VIAA heeft steeds aangemoedigd om in het geval er nog geen oorspronkelijk dragernummer bestond bij de CP, deze gelegenheid aan te grijpen om dit te toe te kennen.

Dit veld werd in 997 gevallen ingevuld (82%), en werd dus nuttig bevonden door de CP en door VIAA.

Standplaats drager

Dit vrije veld werd toegevoegd in de registratie zodat de CP na de de dragers makkelijk en snel terug kan plaatsen in het archief. Dit veld werd in 1.069 gevallen (88%) ingevuld, wat relatief veel is. Aangezien het geen verplicht veld was en slechts een minimale inspanning vraagt van de CP om het in te vullen, kunnen we aanwezigheid van dit veld als positief evalueren.

Lessons learned

Voor het bepalen van de velden die moesten worden ingevuld door de content partner in het registratieformulier, werd uitgegaan van de volgende drie criteria:

  1. Het veld is nuttig voor de logistieke opvolging (doorheen het volledige traject van de drager) of het is nuttig voor de SP in het uitvoeren van de digitalisering.
  2. De inhoud van het veld is met enige zekerheid aan te leveren. Het heeft geen zin een veld aan te leveren waarvan de inhoud zo onbetrouwbaar is dat het de SP niet helpt.
  3. De inhoud van het veld invullen is technisch en qua timing haalbaar voor de CP. Anders kost dit hem te veel tijd, zeker als men de deadline van de registratie wil halen.

Het niet correct weergegeven van bepaalde gegevens tijdens de registratie kunnen we op twee manieren verklaren.

Enerzijds kan VIAA er niet van uitgaan dat elke registrator dezelfde technische kennis heeft wat betreft het identificeren en het inspecteren van audiovisueel materiaal. Om de registrator bij te staan heeft VIAA echter wel een zeer gedetailleerde handleiding bijgeleverd (zowel op papier als digitaal), waarin de meeste kenmerken van de audio cd-r discs staan uitgelegd en hoe deze te herkennen. VIAA kan niet achterhalen of deze handleiding effectief gebruikt werd.

Hoewel de digitaliseringsprojecten van VIAA een grote hulp zijn voor de CP's om de digitaliseringsachterstanden in te halen, mag anderzijds ook niet worden vergeten dat de registratie, barcodering en verpakking van de dragers moet gerealiseerd worden naast hun dagelijkse werk. Voor CP's met grote hoeveelheden is dit een groot deel extra werk dat erbij komt. Beide zaken kunnen dus worden aangehaald als reden waarom de registratie niet altijd even grondig gebeurde.

Van de kant van VIAA waren er enkele veranderingen in de scope, de timing en het budget. Wat betreft de scope valt het verschil op in aantallen en duurtijd, tussen het uitgangspunt van het project en het uiteindelijke resultaat.

Het moet daarbij worden opgemerkt dat VIAA geen enkel zicht had op de correctheid van de tijdens de inventarisatie opgegeven aantallen. Het feit dat het aantal audio cd-r discs een derde lager lag dan oorspronkelijk ingeschat, lag aan een verkeerde opgave van cijfers bij één CP in het bijzonder, maar ook aan een lichte overschatting bij de meeste andere CP’s. VIAA vertrouwt hier op de kennis van de collectiebeheerders bij het invullen van de inventaris en heeft niet de middelen noch het personeel om dit te gaan controleren. Daarnaast bleek de duurtijd per audio cd-r disc een zesde lager te zijn dan oorspronkelijk ingeschat, en tot slot was ruim 18% van de dragers onleesbaar.

Alle factoren bij elkaar opgeteld, zorgen ervoor dat het project uiteindelijk maar ruim 42% opleverde van de oorspronkelijk ingeschatte duurtijd, en 55% van het oorspronkelijk ingeschatte aantal bestanden.

Wat de timing betreft, bleef het project grosso modo binnen de vooraf opgestelde grenzen.

Tot slot wil VIAA ook enkele bijzondere slotopmerkingen maken over dit eerste migratieproject van optische schijven van VIAA. Enerzijds werden door de CP’s slechts enkele schijven foutief als audio cd-r disc herkend en meegegeven voor digitalisering. Dit is een bijzonder succes te noemen, aangezien verwarring met andere optische schijfjes bijzonder makkelijk kan voorvallen. Anderzijds lag de dropout-rate (het aantal dragers dat niet kon gedigitaliseerd worden) bijzonder hoog in vergelijking met alle andere digitaliseringsprojecten van VIAA. Dit heeft VIAA ertoe gebracht een speciaal project rond de problematiek van de diverse optische schijfjes te organiseren in de zomer van 2016, waarin bewustmaking rond het gebruik in de archiefwereld en preservatie centraal zullen staan.

Bronnen

Verwante gevalstudies:

Contactgegevens

Loes Nijsmans, project manager digitalisering VIAA

tel: +32 9 298 0501

e-mail: loes.nijsmans@viaa.be