Projet Himanis : faire des recherches plein texte dans le Trésor des Chartes avec OCR d'écritures manuscrites grâce au deep learningCycle « Les Lundis numériques de l'INHA »

L’intelligence artificielle (deep learning) a débloqué l’accès au texte des manuscrits médiévaux ! Les partenaires du projet européen HIMANIS ont réalisé, pour la première fois au monde, l’indexation et la recherche en plein texte de dizaines de milliers de pages de manuscrits médiévaux, dont l’écriture est, souvent difficile à lire même pour les historiens chevronnés. Sur les deux cents volumes des « registres du Trésor des chartes », cartulaires et formulaires, contenant les textes produits par la chancellerie royale française de 1302 à 1486, les défis du multilinguisme et de la variation des écritures durant deux siècles, avec la présence de nombreuses abréviations, ont pu être relevés avec succès. La taille du corpus et la possibilité de recherche en plein texte dans des sources manuscrites, ouverte à tous, en accès libre sur le web, sont des nouveautés inédites dans le domaine des études médiévales. Les résultats de ces recherches présentent ainsi une révolution pour les historiens.

Intervenant

  • Dominique Stutzmann (IRHT)

Dominique Stutzmann est ancien élève de l’École nationale des Chartes (archiviste paléographe, 2002), docteur en histoire (2009). Il a été conservateur à la bibliothèque d’État de Berlin puis à la Bibliothèque nationale de France. Il est, depuis 2010, chargé en recherche au CNRS. Ses recherches actuelles portent, d’une part, sur l’écriture dans l’espace français du XIIe au XVIe siècle, ses usages sociaux et les modalités de leur évolution et, d’autre part, sur l’élaboration d’une «paléographie artificielle», c’est-à-dire l’application de l’intelligence artificielle pour avancer les connaissances en histoire de l’écriture. Il a dirigé et dirige dix projets de recherche avec des financements européens ou nationaux portant sur les textes médiévaux et leur transmission manuscrite, et a publié six livres, cinq bases de données et un logiciel, et une soixantaine d’articles.

À propos des lundis numériques

L’Institut national de l’histoire de l’art effectue depuis plusieurs années une veille active dans le domaine des humanités numériques avec un accent porté sur ce qui touche au domaine visuel. De nombreux contacts et échanges sont régulièrement établis entre les différentes composantes de l’établissement et diverses équipes sur des problématiques et des projets concernant les enjeux, les représentations, les aspects techniques ou les questions juridiques liées à l’histoire de l’art et à l’image.

Voir le programme complet

___

Informations pratiques

10 décembre 2018 - 18H-20H

Galerie Colbert, salle Giorgio Vasari
Institut national d’histoire de l’art
2, rue Vivienne ou 6 rue des Petits Champs
75002 Paris

entrée libre

___

Suivez les lundis numériques de l’INHA
sur Twitter : #LundisNum