Richtlijn:Fotocollectie digitaliseren
Bij de digitalisering van foto's wordt de vorm en kleur van een fotografische afdruk, diapositief of negatief gecodeerd in een digitale rasterafbeelding. Fotocollecties worden meestal gedigitaliseerd om de authentieke vorm en inhoud van foto's, die in zeer slechte staat zijn of die verloren dreigen te gaan, toch te bewaren en aan het publiek beschikbaar te stellen.
Deze richtlijn is van toepassing op het digitaliseren van een foto's in erfgoedcollecties, waar de kwaliteit van de digitale reproductie voldoende hoog moet zijn om het analoge origineel in geval van verlies te vervangen en het formaat van de digitale reproductie duurzaam genoeg om op lange termijn bewaard te worden. Deze richtlijn bevat specifieke minimum- en aanbevolen standaarden voor de omzetting van zowel afdrukken als positieven en negatieven.
1. Beschrijf de collectie foto's
Verzamel eerst de nodige gegevens (metadata) over de documenten die je wil digitaliseren. Vorm jezelf een beeld van de fotocollectie als geheel en van de afzonderlijke fotografische afdrukken, positieven en negatieven voor je aan de eigenlijke omzetting van analoog naar digitaal begint. Deze gegevens heb je nodig om de collectie te ontsluiten en om de kostprijs en tijdsduur van het gehele digitaliseringsproject in te schatten.
Minimumrichtlijn
- Beschrijf je collectie op (deel)collectieniveau. Bepaal het aantal en het type van je materialen. Onderscheid eventueel deelcollecties. Hierbij kan de richtlijn (deel)collecties registreren je helpen. Stel zowel de kwaliteit als de kwantiteit vast van je collectie om de kostprijs en tijdsduur van het gehele digitaliseringsproject in te schatten.
- Beschrijf de collectie op de niveaus waarop ze ontsloten wordt. Wanneer je van een fotocollectie elke foto afzonderlijk digitaal toegankelijk wil maken, moet elke foto ook afzonderlijk beschreven worden. Dit is noodzakelijk om de foto online te kunnen identificeren en vindbaar te maken.
Aanbevolen richtlijn
- Hou je aan het 1-op-1-principe: een metadatarecord beschrijft óf de analoge foto (het document in de collectie) óf wat er op de foto afgebeeld staat (bv. het afgebeelde schilderij) óf de digitale reproductie (het bestand met de digitale rasterafbeelding). Voor hiërarchisch beschreven fotocollecties geldt hetzelfde: een metadatarecord beschrijft óf de collectie óf een reeks foto's (bv. in een album) óf de foto etc.
- Beschrijf de collectie op de niveaus waarop de foto in een digitaal bestand bewaard wordt. Wanneer je bijvoorbeeld de voor en achterzijde van een foto digitaliseert, voorzie dan beide digitale bestanden van de noodzakelijke metadata om het digitale beeld te identificeren. Dit is noodzakelijk om zoekresultaten te kunnen koppelen aan het juiste digitale bestand.
- Gebruik, naargelang de aard van de fotocollectie, de geschikte standaard datastructuur voor de beschrijving van de collectie. Maak daarbij gebruik van de richtlijnen voor het registreren van objecten, de aanmaak van een bibliotheekcatalogus of het inventariseren van een archief.
- Maak, indien van toepassing, gebruik van datastructuren, beschrijvingsregels en terminologieën die specifiek ontwikkeld werden voor foto's:
2. Maak een moederbestand
Dit moederbestand is de eerste kopie van de analoge foto en vormt de basis voor alle verdere kopieën. Bewaar tijdens het digitaliseringtraject steeds een onbewerkte versie van het moederbestand. Bewaar het analoge origineel zolang je geen sluitende zekerheid hebt over de kwaliteit en de langetermijnbewaring van het archiveringsbestand.
Hou bij het vastleggen van de kwaliteitseisen voor het moederbestand rekening met doelstellingen van je digitaliseringsproject[1]. Stel vast op welke manieren het moederbestand de foto moet representeren:
- het digitale beeld dient om de inhoud van de foto te ontsluiten.
- het digitale beeld dient een betrouwbare weergave te zijn van de originele foto.
- het digitale beeld dient de originele foto in geval van verlies of beschadiging te vervangen.
Zorg ervoor dat je voldoende opslagcapaciteit, hard- en software en it-vaardigheden in huis hebt om de doelstellingen van je project uit te voeren. Vermijd dat je de kwaliteitseisen voor het moederbestand bijstelt in functie van de beschikbare technologie en kennis.
Hou deze overwegingen in het achterhoofd bij het maken van de volgende keuzes:
2.1. Selecteer een bestandsformaat
Het bestandsformaat van het moederbestand bepaalt de specifieke codering van de beeldpunten in een computerbestand.
Minimumrichtlijn
- Gebruik Uncompressed Baseline IBM TIFF v6.0. Dit is het meest aanbevolen formaat omwille van zijn robuustheid en brede ondersteuning.
Aanbevolen richtlijn
- Gebruik JPEG2000 als je de omvang van het moederbestand wil beperken. JPEG2000 biedt technisch superieure mogelijkheden voor het gebruik van lossless of lossy compressie.
- Gebruik JPEG, PNG en JPEG2000 met lossy compressie enkel als het origineel wordt bewaard en de digitale representatie louter gebruikt wordt voor raadpleging van de inhoud van de foto.
- Gebruik GIF enkel voor logo's en grafieken'
- Vermijd het gebruik van PDF/A als moederbestand, omdat het heel moeilijk is om van dit bestandsformaat verdere reproductie- of raadplegingsbestanden te maken.
- Als een document uit meerdere foto's bestaat (bv. recto/verso fotografische afdruk, bijlagen, een fotoalbum, etc.):
- Gebruik voor het moederbestand TIFF- en JPEG2000-bestanden in combinatie met een XML-bestand waarin je de structurele relaties tussen de verschillende bestanden vastlegt.
- Vermijd het gebruik van Multipage-TIFF als moederbestand, omdat dit niet door alle software herkend of ondersteund wordt. Sommige programma's zullen enkel het eerste TIFF-bestand weergeven.
- Vermijd het gebruik van PDF als moederbestand om alle onderdelen als één bestand aan te bieden, omdat het heel moeilijk is om van dit bestandsformaat verdere reproductie- of raadplegingsbestanden te maken.
2.2. Bepaal de resolutie
De resolutie is het aantal beeldpunten of pixels waaruit een digitaal beeld bestaat. Hoe meer pixels, des te nauwkeuriger het digitale beeld het origineel benadert. De resolutie wordt uitgedrukt in pixels per inch (2,45cm) (ppi). Resolutie wordt ook vaak uitgedrukt in dots per inch(dpi), maar deze eenheid heeft enkel betrekking op de afdrukresolutie en niet op de schermresolutie.
Minimumrichtlijn
- Gebruik bij het digitaliseren van foto's een resolutie van minimum 300 ppi. Dit is de minimale resolutie om een gedigitaliseerde foto op ware grootte af te drukken.
- Gebruik bij het digitaliseren van positieven en negatieven een resolutie die overeenkomt met 300 ppi vermenigvuldigd met de reductiefactor van het positief of negatief (300 true ppi).
Aanbevolen richtlijn
- Voor grotere originelen (kaarten, plannen) volstaat een lagere resolutie.
- Raadpleeg voor het maken van kwaliteitsvolle reproducties de Richtlijnen Preservation Imaging Metamorfoze (Koninklijke Bibliotheek en Nationaal Archief) of de Guidelines Digitisation of photographic materials (Nationaal Archief).
2.3. Bepaal de kleurruimte en kleurdiepte
De kleurruimte is de methode gebruikt om de kleur van elk beeldpunt digitaal te coderen. De bitdiepte bepaalt het aantal bits (nullen en enen) die daar per beeldpunt voor gebruikt worden. Hoe meer bits gebruikt worden, hoe meer kleuren er mogelijk zijn en hoe nauwkeuriger een kleur gecodeerd kan worden.
Minimumrichtlijn
- Gebruik de ECIRGB-kleurruimte voor de codering van de primaire kleuren in een digitaal beeld.
- Gebruik een bitdiepte van 8 of 16 bit per pixel voor een moederbestand dat enkel grijswaarden bevat.
- Gebruik een bitdiepte van minimum 24 bit per pixel voor een moederbestand dat kleuren bevat (dus minimum 8 bit per primaire kleur).
- Voor zwart-witafbeeldingen volstaat 1 bit per pixel. Hiermee worden afbeeldingen bedoeld die enkel zuiver wit en zwart bevatten, geen grijswaarden dus, bv. grafieken of tekstdocumenten.
Aanbevolen richtlijn
- Gebruik voor afbeeldingen met een groot dynamisch bereik een bitdiepte van 30 tot 48 bit (10 of 16 bits per primaire kleur).
2.4. Bepaal de bestandsnaam
De bestandsnaam is een reeks karakters die een digitaal bestand identificeren. Bepaal voor je organisatie een eenduidige structuur voor bestandsnamen en communiceer deze naar alle medewerkers.
Minimumrichtlijn
- De bestandsnaam moet elk digitaal beeld in de collectie van je organisatie uniek identificeren.
- Gebruik enkel letters, cijfers, liggend streepje ( _ underscore) of koppelteken (- "hyphen"). Gebruik geen speciale tekens zoals haakjes, streepjes, leestekens, etc. Die tekens hebben vaak specifieke betekenissen voor dataverwerkende scripts of software en kunnen dus onvoorspelbare effecten hebben. Vermijd ook diakritische tekens (accenten, trema's).
- Gebruik een betekenisloze structuur (bv. een unieke reeks cijfers en/of letters) of een betekenisvolle structuur met een zo beperkt mogelijk aantal onderdelen (bv. identificatienummer foto + volgnummer voor- en achterzijde).
Aanbevolen richtlijn
- Gebruik betekenisloze bestandsnamen om de digitaliseringsworkflow eenvoudig te houden. Uit de praktijk blijkt dat betekenisvolle bestandsnamen eerder hinderlijk zijn voor een vlotte digitaliseringsworkflow. Bovendien heeft een complexe naamgeving invloed op de kostprijs van de digitalisering, omdat in het werkproces dan meer tijd kruipt. Indien mogelijk werk je dus met betekenisloze namen, bijvoorbeeld doorlopende nummers.
- Gebruik betekenisvolle bestandsnamen wanneer deze bestandsnamen reeds verspreid zijn in verschillende computersystemen, bijvoorbeeld via aggregatie van de metadata. Hierdoor vermijd je dat je data op verschillende plaatsen moet updaten.
- Neem in de bestandsnaam een code op die verwijst naar de naam van de erfgoedorganisatie die de foto bewaart.
2.5. Registreer structurele metadata over de foto
Structurele metadata bevatten informatie over de structurele samenhang van de onderdelen van een fotocollectie, zoals het aantal en de volgorde van een reeks foto's of de ordening van een verzameling foto's in een fotoalbum. De registratie van structurele metadata is noodzakelijk om de structuur van het oorspronkelijke document digitaal te reconstrueren.
Minimumrichtlijn
- Gebruik een gestructureerd tekstbestand (CSV of XML) om structurele informatie over een reeks of verzameling foto's te bewaren.
- Gebruik de bestandsnaam alleen om structurele metadata over eenvoudige reeksen of verzamelingen te bewaren. Beperk de structurele informatie tot een volgnummer dat verwijst naar de plaats van een foto in een reeks of verzameling.
- Vermijd het gebruik van een hiërarchische mappenstructuur om de structuur van een reeks of verzameling foto's te registreren.
Aanbevolen richtlijn
- Gebruik het METS XML Schema om de structuur complexe reeksen of verzamelingen te registreren.
- Gebruik het PREMIS XML Schema om, naast administratieve gegevens, ook structurele gegevens te bewaren.
3. Registreer administratieve metadata over de foto
Om de lange termijn bewaring, preservering en de toegankelijkheid van de gedigitaliseerde foto te verzekeren is het noodzakelijk om enkele administratieve gegevens over dit document te registreren. Deze metadata geldt als soort 'editievermelding' of 'verantwoording' bij de digitale kopie van de originele foto en omvat informatie over de rechten die op de digitale kopie berusten, technische metadata over de wijze waarop de digitale kopie is vervaardigd en preserveringsdata die nodig is om de integriteit en authenticiteit van de digitale kopie op lange termijn te verzekeren.
Minimumrichtlijn
- Bepaal welke administratieve en structurele metadata worden bewaard.
- Als je administratieve en structurele metadata apart van het beeldbestand bewaart, gebruik hiervoor dan een gestructureerd tekstbestand (bv. XML, CSV, databasebestand).
- Als je administratieve en structurele metadata in het beeldbestand zelf bewaart, gebruik dan de standaard tags die door het bestandsformaat gespecifieerd worden (bv. TIFF baseline tags).[2]
Aanbevolen richtlijn
- Gebruik metadata-extractiesoftware zoals ExifTool om administratieve metadata uit beeldbestanden te extraheren en eventueel bijkomende metadata toe te voegen.
- Gebruik identificatiesoftware zoals DROID, JHOVE2 of JHOVE om technische metadata te extraheren en te identificeren.
- Als je het bestandsformaat kent, kun je allerlei technische metadata opvragen uit de online databank PRONOM.
- Gebruik software als JHOVE2 of JHOVE om het beeldbestand te valideren.
- Gebruik de PREMIS standaard datastructuur om de technische-, juridische en preserveringsmetadata vast te leggen.
4. Maak archiverings-, reproductie- en raadplegingsbestanden
Op basis van het moederbestand maak je een reeks bestanden die het eindproduct van je digitaliseringsproject vormen. Maak bij het bepalen van kwaliteitseisen voor eindproducten onderscheid tussen drie types:
- Het archiveringsbestand is een digitale kopie van de oorspronkelijke foto in de hoogst mogelijke kwaliteit - bij voorkeur voldoende hoog om het origineel in geval van vernietiging of beschadiging te vervangen.
- Het reproductiebestand is een moederbestand dat je zelf gebruikt wordt voor het maken van verschillende soorten raadplegingsbestanden.
- Het raadplegingsbestand is een digitale kopie die gebruikt wordt om een foto digitaal ter beschikking te stellen.
Hou bij het maken van raadplegingsbestanden ook rekening met juridische beperkingen van auteursrechten op foto's, de richtlijnen voor het publiceren van een website en open data.
Minimumrichtlijn
- Gebruik voor het archiveringsbestand een open bestandsformaat. Dit waarborgt dat bestanden op lange termijn toegankelijk blijven.
- Gebruik voor het reproductiebestand een open en goed ondersteund bestandsformaat.
Aanbevolen richtlijn
- Aanbevolen bestandsformaten voor archiveringsbestanden:
- Aanbevolen bestandsformaten voor reproductiebestanden:
- Lossless of lossy JPEG2000.
- Aanbevolen bestandsformaten voor raadplegingsbestanden:
- JPEG2000 om digitale beelden toegankelijk te maken op hoge resolutie.
- JPEG en PNG om digitale beelden online toegankelijk te maken op schermresolutie.
- GIF om logo's en grafieken online toegankelijk te maken.
- PDF om document toegankelijk te maken die meerdere foto's bevatten (bv. recto/verso fotografische afdrukken, bijlagen, albums etc.).
Referenties
- ↑ M. Vandermaesen, Digitaal Beeldarchief: Aanbevelingen voor het opzetten van beeldbanken, aan de hand van 'lessons learnt' en 'best practices', Antwerpen, 2005, p. 34
- ↑ Zie onder meer de aanbevelingen van FADGI: Guidelines: Embedded Metadata in TIFF Images en Guidelines: Minimal Descriptive Embedded Metadata in Digital Still Images