Richtlijn:Geluidsopnames digitaliseren
Bij de digitalisering van een geluidsopname wordt de spanning van een elektrische signaal, opgewekt door het afspelen van een magneetband, op regelmatige tijdstippen, gemeten en omgezet in een binair getal en vastgelegd in een digitaal bestand. Deze reeks getallen laat toe om het analoge signaal op een later tijdstip te reconstrueren. Analoge geluidsopnames worden meestal gedigitaliseerd omdat de magneetbanden waarop ze bewaard worden in zeer slechte staat zijn en verloren dreigen te gaan. Door geluidsopnames te digitaliseren kan je ze alsnog bewaren en aan het publiek beschikbaar te stellen.
Deze richtlijn is van toepassing op het digitaliseren van geluidsopnames in erfgoedcollecties, waar de kwaliteit van de digitale reproductie voldoende hoog moet zijn om het analoge origineel in geval van verlies te vervangen en het formaat van de digitale reproductie duurzaam genoeg om op lange termijn bewaard te worden. Deze richtlijn bevat specifieke minimum- en aanbevolen standaarden voor de omzetting van analoge geluidsopnames in een digitaal audiobestand, registratie van identificatie- en beheersgegevens, en verschillende versies van het digitale bestand voor archivering, reproductie en raadpleging.
1. Beschrijf de collectie geluidsopnames
Verzamel eerst de nodige gegevens (metadata) over de geluidsopnames die je wil digitaliseren. Vorm jezelf een beeld van de audiocollectie als geheel en van de afzonderlijke geluidsopnames. Deze gegevens heb je nodig om de collectie te ontsluiten en om de kostprijs en tijdsduur van het gehele digitaliseringsproject in te schatten.
Minimumrichtlijn
- Beschrijf je collectie formeel op (deel)collectieniveau. Bepaal het aantal en het type van je materiaal. Onderscheid eventueel deelcollecties. Hierbij kan de richtlijn (deel)collecties registreren je helpen. Stel zowel de kwaliteit als de kwantiteit vast van je collectie om de kostprijs en tijdsduur van het gehele digitaliseringsproject in te schatten.
- Beschrijf de collectie op de niveaus waarop ze ontsloten wordt. Wanneer je bijvoorbeeld een interview dat uit verschillende geluidsopnames bestaat als een geheel ontsluit, moeten die opnames ook als een geheel beschreven worden. Dit is noodzakelijk om de digitale geluidsopnames online te kunnen identificeren en vindbaar te maken.
Aanbevolen richtlijn
- Hou je aan het 1-op-1-principe: een metadatarecord beschrijft óf de inhoud van de geluidsname óf de originele drager van de geluidsopname óf de digitale reproductie van de geluidsopname. Voor hiërarchisch beschreven geluidsopnames geldt hetzelfde: een metadatarecord beschrijft óf de collectie óf een reeks opnamesessies óf een geluidsopname.
- Beschrijf de collectie op de niveaus waarop de geluidsopname in een digitaal bestand bewaard wordt. Wanneer bijvoorbeeld een interview uit verschillende sessies bestaat die in aparte digitale bestanden bewaard wordt, voorzie dan voor elk digitaal bestand de noodzakelijke metadata om de opnamesessie te identificeren. Dit is noodzakelijk om zoekresultaten te kunnen koppelen aan het juiste digitale bestand.
- Gebruik, naargelang de aard van de collectie geluidsopnames, de geschikte standaard datastructuur voor de beschrijving van de collectie. Maak daarbij gebruik van de richtlijnen voor het registreren van objecten, de aanmaak van een bibliotheekcatalogus of het inventariseren van een archief.
- Maak, indien van toepassing, gebruik van datastructuren, beschrijvingsregels en terminologieën die specifiek ontwikkeld werden voor geluidsopnames:
- Maak gebruik van de EBUCORE standaarddatastructuur voor de beschrijving van radiouitzendingen.
- Maak gebruik van de IASA Cataloguing Rules voor het beschrijven van geluidsopnames in een bibliotheekcatalogus.
- Maak gebruik van de GTAA terminologie voor het doorzoekbaar maken van geluidsopnames op onderwerp, genre, plaats en maker.
2. Maak een 'eerste' moederbestand
Dit moederbestand is de eerste digitale kopie van de originele geluidsopname en vormt de basis voor alle verdere kopieën. Het moederbestand ontstaat door omzetting van een analoge (Reel-to-Reel tape, Compact Cassette) of digitale (Digital Compact Cassette, DAT, MiniDisc) geluidsband naar een digitaal bestandsformaat. Bewaar tijdens het digitaliseringtraject steeds een onbewerkte versie van het moederbestand. Hou het origineel bij zolang je geen sluitende zekerheid hebt over de kwaliteit en de langetermijnbewaring van het archiveringsbestand.
Hou bij de het vastleggen van de kwaliteitseisen voor het moederbestand rekening met de doelstellingen van je digitaliseringsproject. Stel vast op welke manieren het moederbestand de geluidsopname moet representeren:
- het digitale audiobestand dient enkel om de inhoud van de geluidsopname te ontsluiten.
- het digitale audiobestand dient een betrouwbare weergave te zijn van de originele analoge geluidsopname.
- het digitale audiobestand dient het originele analoge document in geval van verlies of beschadiging te vervangen.
Stel de kwaliteitseisen voor het moederbestand niet bij in functie van de beschikbare budgetten, technologie en kennis, maar zorg dat je voldoende opslagcapaciteit, hard- en software en IT-vaardigheden in huis hebt om de doelstellingen van je project te realiseren.
Hou deze overwegingen in het achterhoofd bij het maken van de volgende keuzes:
2.1 Controleer het bronmateriaal en stel de digitaliseringsapparatuur in
Om het beoogde kwaliteitsniveau te behalen is het niet alleen belangrijk dat het bronmateriaal in een zo goed mogelijke conditie is, maar ook dat de digitaliseringsapparatuur correct wordt ingesteld. Voer daarom steeds de volgende routinecontroles uit:
Minimumrichtlijn
- Inspecteer en reinig het geluidsmateriaal vooraleer je start met de digitalisering. De aanwezigheid van stofdeeltjes en ander vuil kan resulteren in kwaliteitsverlies.
- Reinig de afspeelkoppen van het afspeeltoestel.
- Controleer of de digitaliseringsapparatuur correct is aangesloten.
- Controleer of de drager en het signaal van de geluidsopname correct geïdentificeerd zijn.
- Vermijd subjectieve beslissingen bij het instellen van de digitaliseringsapparatuur.
2.2 Selecteer een bestandsformaat
Het bestandsformaat van een digitale geluidsopname bepaalt de wijze waarop het digitaal gecodeerde geluidssignaal vastgelegd wordt in een computerbestand.
Minimumrichtlijn
- Behoud het oorspronkelijke aantal audiokanalen.
- Bewaar een mono geluidsopname als een opname met twee identieke kanalen (dubbel mono); beide kanalen moeten in fase zijn.
Aanbevolen richtlijn
- Gebruik een open en goed gedocumenteerd bestandsformaat. Zo vermijd je afhankelijk te worden van specifieke software voor het transcoderen van het moederbestand. Bovendien kan je een open moederbestand meteen gebruiken als archiverings- of reproductiebestand en vermijd je bijkomende transcoderingen:
- WAV is een breed ondersteund audioformaat dat ongecomprimeerde audiobestanden kan bewaren en ontwikkeld werd door Microsoft en IBM;
- AIFF is een breed ondersteund audioformaat dat ongecomprimeerde audiobestanden kan bewaren en ontwikkeld werd door Apple;
- FLAC is een open-source, lossless gecomprimeerd audioformaat.
2.3 Bepaal de codering van het geluidssignaal
De codering van het geluidssignaal omvat de parameters die gebruikt worden om het analoge geluidssignaal om te zetten in een discreet signaal, in het bijzonder de bemonsteringsfrequentie (sample rate) en de bitdiepte (bit depth).
Minimumrichtlijn
- Gebruik Linear Pulse Code Modulation voor de codering van het geluidsignaal.
- Pas geen compressie toe.
- Gebruik voor een bitdiepte (bit depth) van 24 bit.
- Gebruik voor een bemonsteringsfrequentie (sample rate) van minimaal 48 Khz.
Aanbevolen richtlijn
- Gebruik een bemonsteringsfrequentie van 96 kHz voor een geluidsopname van hoge kwaliteit.
- Vermijd bij de aanmaak van het moederbestand ruisonderdrukking of andere restauratie-ingrepen op het originele geluidssignaal.
2.4 Bepaal de bestandsnaam
De bestandsnaam bestaat uit een reeks karakters die een bestand identificeren. Bepaal voor je organisatie een eenduidige structuur voor bestandsnamen en communiceer deze naar alle medewerkers.
Minimumrichtlijn
- De bestandsnaam moet elk digitaal beeld in de collectie van je organisatie uniek identificeren.
- Gebruik enkel letters, cijfers, liggend streepje ( _ underscore) of koppelteken (- "hyphen"). Gebruik geen speciale tekens zoals haakjes, streepjes, leestekens, etc. Die tekens hebben vaak specifieke betekenissen voor dataverwerkende scripts of software en kunnen dus onvoorspelbare effecten hebben. Vermijd ook diakritische tekens (accenten, trema's).
- Gebruik een betekenisloze structuur (bvb. een unieke reeks cijfers en/of letters) of een betekenisvolle structuur met een zo beperkt mogelijk aantal onderdelen (bvb. identificatienummer tekstdocument + volgnummer pagina).
Aanbevolen richtlijn
- Gebruik betekenisloze bestandsnamen om de digitaliseringsworkflow eenvoudig te houden. Uit de praktijk blijkt dat betekenisvolle bestandsnamen eerder hinderlijk zijn voor een vlotte digitaliseringsworkflow. Bovendien heeft een complexe naamgeving invloed op de kostprijs van de digitalisering, omdat in het werkproces dan meer tijd kruipt. Indien mogelijk werk je dus met betekenisloze namen, bijvoorbeeld doorlopende nummers.
- Gebruik betekenisvolle bestandsnamen wanneer deze bestandsnamen reeds verspreid zijn in verschillende computersystemen, bijvoorbeeld via aggregatie van de metadata. Hierdoor vermijd je dat je data op verschillende plaatsen moet updaten.
- Neem in de bestandsnaam een code op die verwijst naar de naam van de erfgoedorganisatie die het tekstdocument bewaart.
2.5 Registreer structurele metadata over de geluidsopname
Structurele metadata bevatten informatie over de structurele samenhang van de onderdelen van een geluidsopname, zoals bijvoorbeeld een reeks opnames die een geheel vormen of een opname die bestaat uit meer dan de twee gangbare stereokanalen. De registratie van structurele metadata is noodzakelijk om de structuur van de oorspronkelijke geluidsopname digitaal te reconstrueren.
Minimumrichtlijn
- Gebruik een gestructureerd tekstbestand (CSV of XML) om structurele informatie over een gedigitaliseerd geluidsopname te bewaren.
- Gebruik de bestandsnaam alleen om structurele metadata over eenvoudige geluidsopnames te bewaren. Beperk de structurele informatie tot een volgnummer dat bijvoorbeeld verwijst naar de reeks sessies die samen een geluidsopname vormen.
- Vermijd het gebruik van een hiërarchische mappenstructuur om de structuur van een gedigitaliseerde geluidsopname te registreren.
Aanbevolen richtlijn
- Gebruik het METS XML Schema om complexe documentstructuren te registreren.
- Gebruik het PREMIS XML Schema om, naast administratieve gegevens, ook structurele gegevens te bewaren.
3. Registreer administratieve metadata over de geluidsopname
Om de lange termijn bewaring, preservering en de toegankelijkheid van de gedigitaliseerde geluidsopname te verzekeren is het noodzakelijk om enkele administratieve gegevens over het document te registreren. Deze metadata geldt als een soort 'editievermelding' of 'verantwoording' bij de digitale kopie van het origineel en omvat informatie over de rechten die op de digitale kopie berusten, technische metadata over de wijze waarop de digitale kopie is vervaardigd en preserveringsdata die nodig is om de integriteit en authenticiteit van de digitale kopie op lange termijn te verzekeren.
Minimumrichtlijn
- Bepaal welke administratieve en structurele metadata worden bewaard.
- Gebruik zo veel mogelijk bestaande datastructuren. Als je zelf een datastructuur ontwikkelt of een bestaande datastructuur aanpast, zorg er dan voor dat het uitvoerig gedocumenteerd is (welke velden zijn er, wat betekenen ze, hoe worden ze ingevuld ...).
- Als je administratieve en structurele metadata apart van het audiobestand bewaart, gebruik hiervoor dan een gestructureerd tekstbestand (bv. XML, CSV, databasebestand).
- Als je administratieve en structurele metadata in het audiobestand zelf bewaart, gebruik dan de standaardtags die door het bestandsformaat gespecifieerd worden (bv. BWF).
Aanbevolen richtlijn
- Gebruik metadata-extractiesoftware zoals ExifTool om administratieve metadata uit audiobestanden te extraheren en eventueel bijkomende metadata toe te voegen.
- Gebruik identificatiesoftware zoals DROID, JHOVE2 of JHOVE om technische metadata te extraheren en te identificeren.
- Als je het bestandsformaat kent, kun je allerlei technische metadata opvragen uit de online databank PRONOM.
- Gebruik software als JHOVE2 of JHOVE om het audiobestand te valideren.
- Gebruik de PREMIS standaard datastructuur om de technische-, juridische en preserveringsmetadata vast te leggen.
4. Maak archiverings-, reproductie- en raadplegingsbestanden
Op basis van het moederbestand maak je een reeks bestanden die het eindproduct van je digitaliseringsproject vormen. Maak bij het bepalen van kwaliteitseisen voor eindproducten onderscheid tussen drie types:
- Het archiveringsbestand is een digitale kopie van het oorspronkelijke geluidsopname in de hoogst mogelijke kwaliteit - bij voorkeur voldoende hoog om het origineel in geval van vernietiging of beschadiging te vervangen.
- Het reproductiebestand is een moederbestand dat je zelf gebruikt voor het maken van verschillende soorten raadplegingsbestanden.
- Het raadplegingsbestand is een digitale kopie die gebruikt wordt om een geluidsopname digitaal ter beschikking te stellen.
Hou bij het maken van raadplegingsbestanden ook rekening met juridische beperkingen van auteursrechten op geluidsopnames, de richtlijnen voor het publiceren van een website en open data.
Minimumrichtlijn
- Gebruik voor het archiveringsbestand een open codec en containerformaat. Dit waarborgt dat bestanden op lange termijn toegankelijk blijven.
- Gebruik voor het reproductiebestand een open en goed ondersteunde codec en containerformaat.
- Gebruik voor het raadplegingsbestand een codec en containerformaat met de grootst mogelijke toegankelijkheid voor je doelgroep.
Aanbevolen richtlijn
- Aanbevolen bestandsformaten en codecs voor archiverings- en reproductiebestanden:
- Aanbevolen bestandsformaten en codecs voor raadplegingsbestanden:
- MP3,
- lossless of lossy FLAC
- AAC.
- Gebruik een bitdiepte van 16 bit en een bemonsteringsfrequentie van 44,1 kHz voor de codering van een opname van cd-kwaliteit.
- Wanneer audiobestanden online worden gehost, worden ze vaak 'gestreamd'. Bij streaming wordt geen kopie gedownloadt op de computer van de eindgebruiker, maar wordt het geluidsignaal onmiddelijk afgespeeld in de browser van de eindgebruiker. De kwaliteit van de streaming is sterk afhankelijk van de capaciteit van de netwerkverbinding: hoeveel data de browser per seconde ontvangt. Om de streaming van een geluidsopname te vergemakkelijken wordt het raadplegingsbestand daarom gecomprimeerd. De mate waarin het bestand wordt gecomprimeerd wordt afgemeten aan de bitsnelheid (bit rate), de hoeveelheid data die per seconde nodig is om de geluidsopname af te spelen. De bitsnelheid wordt uitgedrukt in bits per seconde:
- Geluidsbestanden worden online het best gerepresenteerd met een bitsnelheid van 192 kbps.
- Voor lage kwaliteit audiostreams volstaat een bitsnelheid van 128 kbps.
- Voor de weergave van spraak (mono) volstaat 64 kbps.