1 000
imprimés transcrits et modernisés orthographiquement
Traitement textuel
Processus de transcription automatique.
Cuéllar, Álvaro. (2023). «La Inteligencia Artificial al rescate del Siglo de Oro. Transcripción y modernización automática de mil trescientos impresos y manuscritos teatrales» . Hipogrifo. Revista de literatura y cultura del Siglo de Oro, vol. 11, núm. 1, pp. 101-115.
Nouveau flux de travail
En plus de nos modèles généraux de HTR, nous développons un nouveau processus pour les manuscrits théâtraux particulièrement complexes. Nous obtenons d’abord une lecture automatique initiale, puis nous la confrontons page par page à des modèles linguistiques et à une lecture visuelle directe du fac-similé.
L’objectif est de produire des textes plus utiles pour la lecture et la recherche : ils sont organisés par journées, numérotés simplement par pages, conservent les doutes lorsque la lecture n’est pas certaine et sont préparés en TEI pour BITESO.
Ce procédé ne remplace pas une édition critique, mais il permet de transformer des manuscrits difficiles en textes numériques navigables, révisables et liés à leurs images.
Nous avons récemment développé des processus de transcription automatique grâce à Transkribus. Ces processus nous ont permis de transcrire automatiquement et de moderniser l’orthographe d’environ 1000 imprimés et 350 manuscrits de théâtre du Siècle d’or, qui font désormais partie de CETSO et de TEXORO.
1 000
imprimés transcrits et modernisés orthographiquement
350
manuscrits intégrés aux flux de travail du projet
99 %
de précision approximative pour les imprimés
90 %
de précision approximative pour les manuscrits
Les trois modèles utilisés sont publics et peuvent être employés par toute personne via Transkribus.
Transkribus, 2021
Modèle entraîné pour la transcription automatique d’imprimés théâtraux du Siècle d’or.
Transkribus, 2021
Version orientée vers la modernisation orthographique automatique d’imprimés déjà transcrits.
Transkribus, 2021
Modèle centré sur les manuscrits théâtraux, avec modernisation orthographique et détection de traits pertinents.
Ces modèles nous permettent de transcrire des imprimés et manuscrits théâtraux avec un haut degré de précision : environ 99 % pour les imprimés et 90 % pour les manuscrits. Nos transcriptions peuvent en outre moderniser automatiquement l’orthographe selon les normes actuelles et détecter certains éléments, comme les italiques.

Si vous souhaitez en savoir plus sur l’outil, appliquer nos modèles de transcription à vos documents ou obtenir la transcription d’un imprimé ou manuscrit précis pour votre recherche, veuillez contacter Álvaro Cuéllar.