Publicatie:Hoe archiveer ik e-mails? (geactualiseerde versie, 12/2018)
Het archiveren van e-mails is voor veel organisaties een uitdaging. Mailboxen puilen uit van inkomende en uitgaande berichten en worden steeds meer als een vergaarbak van informatie en kennis gebruikt, mede omdat ze allerlei bestanden in bijlagen kunnen bevatten. Bij de bewaring van e-mails vormt het behoud van de band tussen bijlagen en e-mail een extra uitdaging.In deze handleiding staat het digitaal archiveren van e-mails centraal. E-mails zijn documenten die digitaal geboren zijn. Het digitaal zijn is dan ook een essentieel kenmerk dat bewaard moet worden. (Deze versie is een geactualiseerde versie van Publicatie:Hoe archiveer ik e-mails?).
Titel | Hoe archiveer ik e-mails? (geactualiseerde versie
12/2018) (Voorkeurstitel) |
Locatie | |
Uitgever | |
Jaar van uitgave | 2018 |
Rechten | CC-BY-SA |
Persistent ID |
Het archiveren van e-mails is voor veel organisaties een uitdaging. Mailboxen puilen uit van inkomende en uitgaande berichten en worden steeds meer als een vergaarbak van informatie en kennis gebruikt, mede omdat ze allerlei bestanden in bijlagen kunnen bevatten. Dit is geen goede manier van werken indien je de informatie voor lange termijn wil bewaren. E-mailtoepassingen zijn immers niet gemaakt om duurzaam te bewaren. Bij de bewaring van e-mails vormt het behoud van de band tussen bijlagen en e-mail een extra uitdaging.
Voor de bewaring van e-mails op mailservers en in e-mailclients bestaat er geen standaardformaat. E-mailclients, zoals Microsoft Outlook of Apple Mail, gebruiken een eigen propriëtair bestandsformaat. Dit kan betekenen dat niet alle metadata bewaard worden en dat e-mails onleesbaar worden wanneer de e-mailclient niet meer beschikbaar is. Bovendien gebruiken steeds meer mensen webmaildiensten zoals Gmail of Outlook.com (het vroegere Hotmail). Wanneer deze diensten stoppen of (hoge) kosten beginnen vragen, dreig je al je e-mails te verliezen.
Het artikel is opgebouwd in twee delen: In het eerste deel geven we je enkele vuistregels mee over het duurzaam omgaan met e-mail; in het tweede deel gaan we aan de slag met enkele tools. We gaan uit van het digitaal archiveren van e-mails. E-mails zijn documenten die digitaal geboren zijn. Het digitaal zijn is dan ook een essentieel kenmerk dat bewaard moet worden.[1]
Vuistregels
Orden je e-mails
E-mails kan je ordenen door je mailbox[2] te structureren volgens de mappenstructuur van je organisatie. Wanneer je je persoonlijk e-mailadres gebruikt voor je organisatie, kan je aparte mappen maken voor je persoonlijke e-mails en voor de e-mails die je hebt verstuurd en ontvangen bij het uitoefenen van taken of activiteiten voor je organisatie. Dit maakt het eenvoudiger om e-mails terug te vinden, en om e-mails en bijlagen achteraf buiten de e-mailclient in de juiste mappen van de mappenstructuur op te slaan.
Schoon je mailbox
Je e-mailarchief wordt toegankelijker door je mailbox regelmatig te schonen. E-mailcorrespondentie bevat immers veel ballast - denk aan bv. spam, reclameberichten en nieuwsberichten - die niet bewaard hoeven te worden. Het opkuisen van je mailbox maakt dat je makkelijker e-mails kan terugvinden en dat enkel archiefwaardige e-mails bewaard worden. Binnen je organisatie kan je via een selectielijst afspreken welke e-mails bewaard moeten worden en welke niet.[3] E-mails die verstuurd of ontvangen worden bij het uitoefenen van taken of activiteiten van je organisatie worden bewaard; louter informatieve e-mails die geen rechtstreekse band hebben met je organisatie kunnen verwijderd worden.
Gebruik een geschikt protocol
Protocols zijn regels waaraan computers zich moeten houden om met elkaar te communiceren. POP en IMAP zijn protocols voor het ophalen van e-mails van de server. Internet Message Access Protocol, meestal afgekort tot IMAP, maakt het mogelijk dat e-mails gesynchroniseerd worden, zodat je je e-mails zowel kan consulteren op je smartphone als op tablet, laptop, computer, etc. POP, kort voor Post Office Protocol, verwijdert de e-mails van de mailserver bij het ophalen. Gebruik daarom IMAPS. Dit is een vorm van IMAP over een versleutelde (en dus beveiligde) verbinding.
Bewaar alle essentiële kenmerken van e-mails
Centrale concepten bij archivering zijn authenticiteit en integriteit. Authenticiteit verzekert je dat een archiefstuk is wat het beweert te zijn en integriteit verzekert dat de inhoud van een archiefstuk volledig en waar is. Om deze twee eigenschappen bij e-mails te preserveren, dienen de volgende elementen bewaard te worden:
- Ontstaanscontext: dit zijn alle gegevens die de functie van een archiefstuk weergeven in relatie tot de activiteiten van de archiefvormer. Het verduidelijkt het onderwerp of de zaak waarop de e-mail betrekking heeft, de herkomst en de onderlinge samenhang tussen verwante e-mails, bijlagen en archiefdocumenten.
- Structuur geeft de relaties weer tussen de verschillende componenten van een e-mail (header, body en bijlagen) en tussen verwante e-mails (bv. bij het beantwoorden of doorsturen van een e-mail).
- Inhoud: bestaat uit het onderwerp van de e-mail, de tekst die verstuurd werd en de bijlagen.
Deze gewenste gegevens kan je bewaren door te kiezen voor een bestandsformaat dat e-mails bewaart volgens het Internet Message Format (IMF). IMF is een standaardformaat voor het transport van e-mails. Het maakt het mogelijk dat iedere e-mail die iemand naar je verstuurt via zijn e-mailclient of webmaildienst leesbaar is in je e-mailapplicatie zonder dat jullie dezelfde applicatie gebruiken. Druk daarom e-mails nooit af met het oog op lange termijnbewaring. E-mails bevatten verborgen metadata die je niet ziet wanneer je de e-mail in je e-mailtoepassing opent. Ze bevatten informatie over de te bewaren elementen van het document. Deze metadata verlies je bij het afdrukken. De ontstaanscontext van e-mails bewaar je ook door e-mails onder te brengen in een gestructureerde mappenstructuur (zie 1. Orden je e-mails).
Scheid e-mails en bijlagen
Wanneer bijlagen verstuurd worden in een bestandsformaat dat niet duurzaam is, dreigt het gevaar van obsoletie. Dit betekent dat het bestandsformaat niet meer gelezen kan worden, omdat de software niet meer beschikbaar is. Bij e-mails die in HTML opgesteld werden, staan afbeeldingen soms op een externe webserver omdat het bericht anders te groot wordt. Deze afbeeldingen kan je verliezen, wanneer je ze niet gescheiden bewaart. Bewaar afbeeldingen en bijlagen daarom apart van de e-mail in een geschikt archiveringsformaat, maar zorg wel dat de relatie tussen de e-mails, afbeeldingen en bijlagen duidelijk is. Je kan de link tussen een e-mail en bijlagen duidelijk maken door eenzelfde bestandsnaam te gebruiken.
Kies een geschikt bestandsformaat
Een geschikt bestandsformaat is een formaat dat gestandaardiseerd is, waarvan de bestandsspecificatie open is en dat gelezen kan worden door verschillende toepassingen. Op deze manier maak je je niet afhankelijk van een bepaalde softwareleverancier. Het is essentieel dat het bestandsformaat alle essentiële kenmerken van de e-mail bewaart.
Voor de bewaring van e-mails zijn EML en MBOX de facto standaarden.[4] Deze bestandsformaten slaan de e-mails met bijlagen op volgens het Internet Message Format (IMF) en kunnen geopend worden door de meeste e-mailtoepassingen en tekstverwerkingsprogramma’s. EML slaat bestanden apart op (één e-mail is één EML-bestand), terwijl MBOX een volledig e-mailarchief kan bewaren (één e-mailarchief is één MBOX-bestand). MBOX slaat een e-mailarchief op volgens de structuur waarin de e-mails geordend zijn in de e-mailclient. Doordat MBOX een volledig e-mailarchief in één bestand bewaart, is het moeilijk om bijlagen en e-mails apart te bewaren en de band tussen bijlagen en e-mails door middel van de bestandsnaam te behouden. Probeer daarom EML te gebruiken. MBOX kan wel een nuttig formaat zijn wanneer je een e-mailarchief in bulk wil exporteren, bv. wanneer een archiefvormer zijn e-mailarchief aan je heemkundige kring wil overdragen.
Bewaar de e-mails duurzaam
E-mailclients en mailservers zijn niet ontwikkeld om e-mails duurzaam te bewaren. Daarom moeten archiefwaardige e-mails steeds buiten de e-mailapplicatie bewaard worden. Sommige e-mailclients en webmailapplicaties bieden een archiveringsfunctie aan. Dit is echter geen duurzame bewaring. E-mailclients gebruiken propriëtaire en gecomprimeerde formaten waardoor je metadata en informatie kan verliezen. Bij webmail is het niet duidelijk hoe de e-mails gearchiveerd worden. Bovendien blijf je hierbij afhankelijk van bedrijven zoals Google en Microsoft voor het beheer van je bestanden.
Bij webmailapplicaties is het vaak niet mogelijk om e-mails eenvoudig te exporteren. Gebruik daarom een e-mailclient, zoals Mozilla Thunderbird. Dit is een gratis en open source e-mailtoepassing die gebruikt kan worden met ieder mogelijk e-mailadres en die het mogelijk maakt om e-mails te exporteren in het EML- en MBOX-formaat. E-mailclients hebben als voordeel dat je een mappenstructuur kan opbouwen in de mailbox.[5] Let op, sommige e-mailclients, zoals Microsoft Outlook, kunnen niet exporteren in EML of MBOX.[6]
Wanneer een archiefvormer zijn e-mailarchief aan je heemkundige kring wenst over te dragen, heb je extra informatie nodig. E-mailservers en e-mailaccounts worden afgeschermd met een wachtwoord. Daarbij zijn e-mails onderhevig aan de wetten voor de bescherming van de privacy, de communicatievrijheid en het telecommunicatiegeheim. Vraag daarom steeds een schriftelijke toestemming aan de archiefvormer om e-mails te mogen bewaren en het wachtwoord van de e-mailserver of e-mailaccount om zelf de e-mails te kunnen archiveren. Zorg ervoor dat de structuur waarin de archiefvormer zijn e-mails ordende, behouden blijft zodat de context van de e-mails bewaard blijft. Dit kan je doen door het volledige e-mailarchief in MBOX te exporteren of door alle EML-bestanden onder te brengen in een gestructureerde mappenstructuur.
Verder gelden voor de duurzame bewaring van e-mails de algemene regels met betrekking tot duurzame bewaring. Zorg steeds dat je goede back-upprocedures gebruikt en dat je van je bestanden verschillende back-ups hebt die op verschillende (geografische) locaties bewaard worden. Bewaak de integriteit van je bestanden door checksums te gebruiken en de bestanden periodiek te controleren. Volg evoluties op op het vlak van bestandsformaten. Dit is zeker voor bijlagen belangrijk, aangezien je hier een grote verscheidenheid aan bestandsformaten kunt hebben.
Aan de slag met enkele tools
Mozilla Thunderbird: e-mails archiveren met een e-mailclient
Webmail binnenhalen
- Open Mozilla Thunderbird
- Klik op 'Nieuwe account aanmaken: E-mail'
- Een nieuw venster opent. Kies voor 'Dit overslaan en mijn bestaande e-mailadres gebruiken'.
- Vul naam, e-mailadres en wachtwoord in en klik op 'doorgaan'.
- Thunderbird zoekt je e-mailservers voor inkomende en uitgaande e-mail. Duid 'IMAP' aan en klik op 'Gereed'.
- Thunderbird vraagt toestemming om toegang te hebben tot je e-mails en haalt vervolgens alle berichten op.
E-mails exporteren naar de mappenstructuur
- Open het bericht dat je wil exporteren.
- Klik in het venster op 'Bestand' en vervolgens 'Opslaan als'. Kies ervoor om het bericht als een bestand op te slaan.
- Plaats de e-mail in de juiste map en klik op 'Opslaan'.
- De e-mail werd als een EML-bestand opgeslagen.
Je kan in Thunderbird de extensie (add-on) ImportExportTools installeren. Deze tool maakt het mogelijk om meerdere e-mails in het EML-formaat uit je mailbox te exporteren.
- Doe een rechtermuisklik op de map die je wil exporteren.
- Kies voor 'Importeren/exporteren in mbox/eml-opmaak - alle berichten in de map exporteren - eml-opmaak'.
- Selecteer de map waar je de e-mails wil onderbrengen en klik 'select folder'.
- Je krijgt volgend venster te zien. Klik op 'OK'.
- Alle e-mails werden opgeslagen. Er werd tevens een bestand 'index.html' opgeslagen. Dit is een html-bestand met een tabel van alle e-mails die je geëxporteerd hebt.
Een e-mailarchief opslaan in MBOX
- Doe een rechtermuisklik op het e-mailadres dat je wil archiveren.
- Kies voor 'Importeren/exporteren in mbox/eml-opmaak' en vervolgens 'Alle mappen exporteren (inclusief structuur)'.
- Klik op 'OK'.
- Selecteer de map waar je het e-mailarchief wil opslaan en klik 'select folder'.
- Mozilla Thunderbird exporteert het volledige e-mailarchief in MBOX. Per map in de mailbox wordt een MBOX-bestand gemaakt.
Mailstore Home: back-upsoftware voor e-mails
MailStore Home is gratis software[7] voor het centraliseren en lokaal bewaren van verschillende e-mailaccounts. Je kan er e-mails centraliseren van verschillende e-mailclients en webmailapplicaties en exporteren in EML.
Importeren van e-mail
- Open MailStore Home.
- Ga naar de tab 'Archive E-mail'. Je kan via deze functie e-mail importeren vanuit webmail (eerste kolom), vanuit e-mailclients (tweede kolom) of je kan e-mailbestanden, zoals EML en MSG, importeren (derde kolom).
- In dit voorbeeld tonen we hoe je webmail kan ophalen. Vul in het veld 'E-mail account' het e-mailadres in en klik op 'Start'.
- Vul het wachtwoord in.
- MailStore Home configureert je serverinstellingen en haalt vervolgens je e-mails op.
Een volledige map exporteren
- Ga naar de tab 'Export E-mail'.
- Kies bij 'Create profile' voor 'Directory (File System)'.
- Een nieuw venster opent. Kies voor 'EML Files' en selecteer de map die je wil exporteren.
- Selecteer de folder waar je de e-mails wil onderbrengen.
- Het nieuwe profiel wordt gecreëerd.
- Selecteer het profiel en klik op 'Run'.
- MailStore exporteert de e-mails naar de gekozen doelmap.
Google Takeout: een back-up maken van je e-mails uit Gmail
Met Google Takeout kun je gegevens uit bv. Gmail, Google Foto’s, Mijn kaarten, Google Play Books en Contacten archiveren om ze eventueel later te importeren in een andere dienst, of gewoon als eigen back-up te bewaren.
- Ga naar https://takeout.google.com/.
- Klik onder "Product" op de knop "Niet selecteren".
- Wanneer er geen producten geselecteerd zijn, zal de knop "Niet selecteren" veranderen in "Alles selecteren" en zullen alle schuivers op 'uit'. staan (naar links verschoven zijn)
- Scroll naar beneden tot je "Mail" ziet verschijnen en verplaats de schuiver achter "Mail" naar rechts. Je selecteert zo het product "Mail".
- Wanneer je de schuiver achter "Mail" naar rechts hebt verplaatst zal die blauw worden.
- Als je op het pijltje links van de schuiver klikt, zal er meer informatie verschijnen onder "Mail". Je kunt dan aangeven of je al dan niet al je e-mails wil opnemen, en of je bepaalde labels wil selecteren.
- Scroll helemaal naar beneden nadat je het product "Mail" hebt geselecteerd door de schuiver naar rechts te verplaatsten, en klik op de knop "Volgende".
- Onder "Bestandstype" kun je nu aanduiden in welk formaat je de geselecteerde e-mails wil archiveren: als .zip of als .tgz.
- Onder "Archiefgrootte" kun je de maximale grootte van e-mailarchief instellen. Archieven die groter zijn dan de ingestelde archiefgrootte, worden opgesplitst in meerdere bestanden.
- Als "Archiefgrootte" kun je kiezen tussen 1, 2, 4, 10 en 50 GB. Zodra je de gewenste archiefgrootte hebt geselecteerd, klik je onderaan op de knop "Archief maken".
- Je e-mails worden dan voorbereid en gearchiveerd. Zodra je e-mails zijn gearchiveerd, kun je het e-mailarchief beheren door op de knop "Archief beheren" te klikken.
- Wanneer de beheerinstellingen in orde zijn, kun je klikken op de knop "Gereed".
Bronnen
- Digital Preservation Coalition: Preserving Email
- Edavid: Richtlijn 1
- KADOC: Digitaal op orde
- Lifewire: How to Export Your Emails from Gmail as Mbox Files
Contactgegevens
Nastasia Vanderperren
PACKED vzw
Delaunoystraat 58 #23
1080 Brussel
E nastasia@packed.be
T ++32 (0)2 217 14 05
Voetnoten
- ↑ Zie ook: http://www.edavid.be/davidproject/teksten/Richtlijn1.pdf.
- ↑ Met mailbox bedoelen we zowel de inbox als de outbox.
- ↑ Een selectielijst is een document waarin bepaald wordt welke documenten bewaard of vernietigd worden. Voor een voorbeeld van een selectielijst voor e-mails, zie hier
- ↑ EML en MBOX zijn gestandaardiseerd en worden breed ondersteund, maar zijn niet open.
- ↑ Zie ook: https://kadoc.kuleuven.be/advies/digitaalorde
- ↑ Het eerder vermelde Apple Mail kan wel e-mails exporteren in EML.
- ↑ bij non-commercieel gebruik.