TEXORO
Effectuez des recherches textuelles complexes dans un corpus du Siècle d'or de 38 millions de mots
Résumés automatiques
Consultez les résumés automatiques de toutes les œuvres de la base de données
Réseau stylométrique
Visualisez le réseau de relations stylométriques des 3 000 œuvres du corpus

Le projet ETSO: Estilometría aplicada al Teatro del Siglo de Oro est né de l’intérêt du chercheur Álvaro Cuéllar (Universitat Autònoma de Barcelona) et du professeur Germán Vega García-Luengos (Universidad de Valladolid) pour l’application de nouveaux outils informatiques aux nombreux problèmes d’attribution que pose le théâtre du Siècle d’or espagnol. Ce portail propose des analyses susceptibles d’éclairer les questions d’attribution dans la vaste production théâtrale de cette période. La stylométrie permet notamment d’identifier, dans le corpus disponible, les œuvres dont les fréquences lexicales sont les plus proches de celles du texte étudié. Comme chaque auteur emploie les mots dans des proportions différentes, les œuvres tendent souvent à se rapprocher selon leur auteur. Il faut toutefois rester prudent, car d’autres ressemblances peuvent tenir au genre, au thème, à la datation, à la provenance, à l’état du texte ou à d’autres facteurs.
On peut consulter ici des exemples où la stylométrie confirme l’attribution traditionnelle, comme La dama boba, Don Gil de las calzas verdes, El médico de su honra, ainsi que des cas où elle suggère une attribution inattendue et potentiellement éclairante, comme La francesa Laura, La monja alférez, La puerta Macarena (primera parte). Les nouvelles attributions signalées ici ne sont que des indices préliminaires produits par un traitement informatique automatique. Chaque cas doit donc faire l’objet d’une étude philologique détaillée, attentive à ses complexités propres.
Humanités numériques
Stylométrie, intelligence artificielle, transcription automatique (HTR)...
Chez ETSO, nous employons différentes techniques informatiques qui nous permettent de travailler sur les textes d’une manière auparavant impossible.
Grâce à Stylo (Maciej Eder, Jan Rybicki et Mike Kestemont), nous pouvons rapprocher les textes selon leurs usages lexicaux.
Transkribus (P. Kahle, S. Colutto, G. Hackl et G. Mühlberger) nous permet de transcrire automatiquement des imprimés anciens et des manuscrits avec un haut degré de précision.
Nous utilisons également d’autres techniques de stylométrie et d’intelligence artificielle pour traiter et analyser les textes.

TEXORO : textes du Siècle d'or
Recherches textuelles dans 3000 œuvres du Siècle d’or
TEXORO est une plateforme de recherche textuelle qui permet d’interroger de manière unifiée un vaste corpus d’œuvres du Siècle d’or espagnol. La ressource réunit près de 3000 textes, plus de 38 millions de mots indexés et des œuvres de plus de 400 auteurs, et offre plusieurs façons d’explorer ce patrimoine littéraire selon des critères lexicaux, textuels et documentaires.
Le moteur de recherche permet de localiser des mots, des expressions exactes et des motifs avec jokers, ainsi que de lancer des requêtes avancées combinant termes, conditions de proximité et filtres par titre, genre, attribution traditionnelle, attribution stylométrique ou état du texte. TEXORO facilite ainsi aussi bien les recherches ciblées que les explorations plus complexes de la présence, de la distribution et des relations des mots ou expressions dans l’ensemble du corpus.
BITESO
Textes numériques du Siècle d’or en accès ouvert
BITESO réunit et met en accès ouvert une vaste collection de textes numériques du Siècle d’or espagnol. La ressource repose en grande partie sur des transcriptions automatiques d’imprimés anciens et de manuscrits préparées pour les analyses stylométriques d’attribution, ainsi que sur des matériaux relus, fournis ou vérifiés grâce à la collaboration de spécialistes.
Les textes intégrés à BITESO doivent être compris comme des versions de travail : ils ne remplacent pas les éditions critiques, peuvent contenir des erreurs de transcription et présentent une qualité textuelle inégale selon la source et l’état de révision. Dans leur état actuel, ils sont proposés sans noms de personnages ni didascalies et ne contiennent que le texte épuré de chaque œuvre.
Comment pouvons-nous vous aider ? Comment pouvez-vous nous aider ?
Nous pouvons vous aider à explorer les ressources disponibles pour l’étude du théâtre et de la littérature du Siècle d’or. Examen de autorías donne accès aux rapports stylométriques des œuvres du corpus, avec des indices sur leurs possibles relations d’auteur. TEXORO permet d’effectuer des recherches textuelles dans près de 3000 œuvres et plus de 38 millions de mots. BITESO offre un accès ouvert à des textes numériques issus en grande partie de transcriptions automatiques d’imprimés anciens et de manuscrits. Les résumés automatiques fournissent également une première orientation sur l’intrigue et le contenu des œuvres, toujours comme aide préliminaire et non comme substitut à la lecture ou à l’analyse philologique.
Vous pouvez aussi collaborer avec nous en envoyant des textes du Siècle d’or qui ne figurent pas encore dans nos ressources, des informations bibliographiques, des informations sur les attributions, des données sur les témoins textuels ou tout matériau susceptible d’améliorer l’ensemble. Citer nos ressources dans des publications, travaux académiques ou activités d’enseignement nous aide également à diffuser le projet et à obtenir le soutien nécessaire pour le maintenir et l’élargir.
