Publicatie:Visual name authority: een gedeeld beheer voor persoonsidentificatie

Uit Meemoo Kennisbank
Naar navigatie springen Naar zoeken springen


Samenvatting

Artificiële intelligentie is een brandend actuele toepassing, waar meemoo niet schuw van is. Denk maar aan onderzoekstraject FAME, de toepassing van spraakherkenning, entiteitsherkenning en gezichtsherkenning in het GIVE-project, of mediaproject Shared AI. Het is wel duidelijk: AI is hier om te blijven! Toch liggen er nog heel wat obstakels op de weg, die de boel afremmen. Om de weg te plaveien voor toekomstige projecten voor de creatie of verrijking van beschrijvende metadata, schaart meemoo zich samen met 24 partners achter de bouw van een Visual Name Authority.

Looptijd: 2023-2026


Referentie
Titel Visual Name Authority

een gedeeld beheer voor persoonsidentificatie (Voorkeurstitel)

Locatie
Uitgever
Jaar van uitgave 2023
Rechten CC-BY-SA
Persistent ID


Uitdaging

Beschrijvende gegevens - ook wel metadata - zijn onmisbaar voor een goede vind- en doorzoekbaarheid van digitale erfgoedcollecties. Denk aan persoonsnamen, titels, data of locaties die je zoektocht naar en doorheen (digitale) collecties een stuk eenvoudiger maken. In het bijzonder persoonsnamen zijn vaak het startpunt van een zoektocht. Dat er nood is aan meer en goede metadata, da’s wel duidelijk. Maar die metadata moeten ook ondubbelzinnig zijn: als je een foto van biljarter Eddy Merckx opzoekt, wil je niet de foto’s of video’s over wielrenner Eddy Merckx vinden! Om verwarring te vermijden, koppel je persoonsnamen dus best aan een authority-bestand. Deze betrouwbare bronnen bevatten extra biografische informatie, wat maakt dat een persoon ondubbelzinnig wordt geïdentificeerd.

Vandaag de dag zit informatie nog al te vaak versnipperd in authorities per deelgebied, wat ervoor zorgt dat je verschillende bronnen moet aanwenden. Niet zo eenduidig! Bovendien zijn nog heel wat persoonsnamenlijsten niet online beschikbaar voor derden. Of werd er niet voor iedere persoonsnaam een persistente identifier opgenomen, wat noodzakelijk is om duurzame koppelingen te kunnen leggen. Daarnaast heb je voor de toepassing van gezichtsherkenning een goede referentieset met portretfoto’s nodig, zodat je de gedetecteerde gezichten kan linken aan een naam. Zo’n referentieset die relevant is voor een brede waaier aan collecties in de cultureelerfgoedsector in Vlaanderen, ontbreekt vandaag. Deze grote beperkingen kwamen duidelijk naar voren in voorgaande metadataprojecten, en grijpen we nu aan in het project Visual Name Authority.

In beeld: Studiehoofden, collectie KMSKA, artinflanders.be, foto: Dominique Provost, publiek domein.

Onze rol

In het project Visual Name Authority neemt meemoo een coördinerende en uitvoerende rol op. Onze projectpartners, onder meer culturele archieven, erfgoedbibliotheken en musea, staan in voor:

  • het voorbereiden en aanleveren van persoonsdata en portretfoto’s;
  • het mee nadenken over de realisatie van het project;
  • het participeren in en begeleiden van werkgroepen en een stuurgroep;
  • het vervullen van een brugfunctie naar andere organisaties.

Wat is een authority?

Authorities of gecontroleerde termenlijsten bevatten een reeks consistent gebruikte en zorgvuldig gedefinieerde namen en onderwerpen. Door een naam of onderwerp aan deze lijsten te koppelen, zorg je ervoor dat er geen verwarring is tussen verschillende schrijfwijzen of aliassen. En voeg je waardevolle informatie toe. Dit alles maakt het zoekproces stukken eenvoudiger. Voorbeelden van gekende authorities zijn Wikidata, ODIS, RKDartists&, ULAN of VIAF.

Aanpak

Samen met 24 partners uit de cultuursector brengen we de basisinformatie uit verschillende bestaande authorities samen onder één koepel. Aan persoonsnamen koppelen we in functie van gezichtsherkenning bovendien een kleine set aan gezichtsuitsnedes uit portretfoto’s. Er ontstaat zo één overkoepelende en gekoppelde bron. Samenwerking staat hierin centraal, want door gegevens van verschillende partners samen te brengen, zal de lijst stukken rijker zijn. Door het maken van een visuele persoonsnamenlijst willen we de metadatacreatie en -verrijking met behulp van artificiële intelligentie voor erfgoedorganisaties faciliteren én de vind- en doorzoekbaarheid van hun collecties verbeteren.

Concreet zal de Visual Name Authority bestaan uit:

  • een overkoepelende lijst met relevante persoonsnamen die uniek en ondubbelzinnig worden geïdentificeerd en gekoppeld aan bestaande authorities;
  • de creatie van een gedeelde referentieset van uitsnedes uit portretfoto's van relevante personen.

In deze overkoepelende Visual Name Authority zullen we persoonsnamen op een unieke en persistente manier identificeren en ze koppelen aan de overeenkomstige persoonsnamen in lokale namenlijsten en andere externe databronnen. Op die manier ontstaan er ook onderlinge koppelingen tussen de lokale namenlijsten en andere externe databronnen. Zo wordt duidelijk dat de persoon uit de ene lijst, dezelfde persoon is als uit een andere lijst! Er ontstaat één overkoepelende en gekoppelde bron, aangevuld met portretfoto’s. Samenwerking staat hierin centraal, want door gegevens van verschillende partners samen te brengen, zal de lijst stukken rijker zijn.

Het project is opgedeeld in drie fasen.

Fase 1 (september 2023 - augustus 2024)

In deze eerste fase van het project ligt de focus op het uitvoeren van een haalbaarheidsstudie, opgesplitst in vijf werkpakketten:

  • WP 1: een juridisch en ethisch kader;
  • WP 2: doelgroepen en use cases;
  • WP 3: namenlijst en gezichtenboek;
  • WP 4: governance en borging;
  • WP 5: projectmanagement en disseminatie.

Daarnaast stond er in mei 2024 een studiedag op de planning. Tijdens deze studiedag stelden we ten eerste Visual Name Authority voor. Vervolgens kwamen ODIS, KBR, Netwerk Digitaal Erfgoed en Cultuurconnect vertellen hoe zij aan de slag gaan met authorities - in het bijzonder persoonsnamenauthorities. Ten slotte organiseerden we een brainstorm met de aanwezigen rond de vraag "Hoe kunnen we in België en Nederland samenwerken rond het efficiënt gebruik van persoonsnamenauthorities? En welke afspraken, middelen en infrastructuur zijn hiervoor nodig?"

Fase 2 (september 2024 - augustus 2025)

Tijdens de tweede projectfase zal er een workflow en prototype worden uitgedacht. Dit gebeurt opnieuw in vijf werkpakketten:

  • WP1: voorbereiden metadata en foto's;
  • WP2: uittekenen van een workflow en achterliggende processen;
  • WP3: uittekenen van een prototype;
  • WP4: governance en borging;
  • WP5: projectmanagement en -disseminatie.

Ook in de tweede projectfase wordt een studiedag georganiseerd.

Fase 3 (september 2025 - september 2026)

In de slotfase krijgt het prototype vorm en wordt het ook ontwikkeld. Met het oog op de toekomst worden alle resultaten ten slotte duurzaam verankerd in een groter ecosysteem.

Resultaten

Fase 1 (september 2023 - augustus 2024)

Partners

Culturele archieven
  • ADVN
  • Amsab-ISG
  • AMVB
  • Archief- en Onderzoekscentrum voor Vrouwengeschiedenis
  • CAVA
  • KADOC-KU Leuven
  • Letterenhuis
  • Liberas
  • VAi
Erfgoedbibliotheken
  • KBR
  • Openbare Bibliotheek Brugge
  • Universiteitsbibliotheek UGent Boekentoren
Musea
  • FOMU
  • Huis van Alijn
  • Industriemuseum
  • M HKA
  • MoMu
  • Museum Dr. Guislain
Andere
  • Kunstenpunt
  • Archiefpunt
  • Centrum voor Vlaamse Muziek
  • ODIS
  • Wikimedia België

Heb je een vraag?

Neem contact op met Axelle Vanmaele, medewerker Expertise (meemoo).