Une école d'été Biblissima+ sous forme de transcribathon pour la reconnaissance automatique de texte
11-13 sept. 2024 Lyon (France)

TranscriboQuest 2024

Première édition de TranscriboQuest - septembre 2024

TranscriboQuest, organisé par Biblissima+ avec le soutien du projet ATRIUM, est un transcribathon de trois jours combinant sessions de formation et activités de transcription pratique. Cet événement a permis aux participants d'acquérir les bases de la reconnaissance automatique de l’écriture, de se familiariser avec l'outil eScriptorium, et de contribuer à la création d’un jeu de données d’entraînement désormais intégré à la plateforme HTR-United.

  • Date : 11-13 septembre 2024
  • Lieu : Lyon, ENS site Descartes, bâtiment Buisson
  • Participants : 33
  • Formateurs : Enki Baptiste, Julie Bordier, Olivier Brisville, Thibault Clérice, Simon Gabay, Matthias Gille Levenson, Ariane Pinche, Marianne Reboul.
  • Comité d'organisation : Thibault Clérice (Inria) et Ariane Pinche (CNRS)
  • Audience internationale : 17 pays représentés (Allemagne, Autriche, Belgique, Bulgarie, Canada, Danemark, Espagne, France, Grèce, Italie, Norvège, Pologne, Portugal, Suisse, Turquie, Royaume-Uni, USA)

Formation et équipes

Pour cette première édition, six équipes ont été constituées :

  • Medieval Literary (6 personnes) – Formateur : Matthias Gille Levenson
  • Medieval Practice (6 personnes) – Formateur : Julie Bordier
  • Modern (7 personnes) – Formateur : Simon Gabay
  • Ancient Greek (6 personnes) – Formateur : Marianne Reboul
  • Old Norse (5 personnes) – Formateur : Ariane Pinche
  • Arabic (3 personnes + Enki Baptiste, assistant formateur et participant) – Formateur : Olivier Brisville

Déroulement de la formation

Avant l’événement :

Les équipes ont été formées en fonction des domaines d'études et des compétences paléographiques des formateurs. Tout au long de l'été, chaque équipe a collaboré avec son formateur afin de préparer le corpus à transcrire. Des réunions méthodologiques préliminaires ont permis d'affiner les approches de transcription.

Pendant l’événement :

  • Jour 1 : Formation intensive sur les bases de l’ATR et la maîtrise de eScriptorium.
  • Jours 2 et 3 : Les sessions de transcription ont été au cœur de la formation. Chaque équipe a travaillé sur la création d’un jeu de données d’entraînement pour l’ATR, en combinant transcription des documents et réflexion méthodologique sur les règles de transcription pour garantir la qualité des données produites.

Le 12 septembre 2024, de 17h00 à 18h00, une conférence publique en visioconférence a été donnée par Elena Pierazzo : "Travailler à la frontière de la connaissance : 25 + 5 ans de philologie numérique".

  • Jour 3 : Documentation des jeux de données et présentation finale devant un jury composé de Peter Stokes et Thibault Clérice, suivie d'une cérémonie de remise des prix.

Résultats et jeux de données produits

À l'issue de la formation, chaque équipe a produit un jeu de données open source :

Félicitations à l’équipe DReMAR, grande gagnante de cette première édition !

Personnes connectées : 2 Vie privée
Chargement...