El proyecto ETSO: Estilometría aplicada al Teatro del Siglo de Oro surge del interés del investigador Álvaro Cuéllar (Universität Wien) y del catedrático Germán Vega García-Luengos (Universidad de Valladolid) en aplicar las nuevas herramientas informáticas a los numerosos problemas de autoría que presenta el teatro del Siglo de Oro español. Este portal trata de ofrecer análisis que puedan arrojar luz sobre las atribuciones de la vasta producción teatral del periodo aurisecular. Gracias a la estilometría podemos averiguar, en una de sus más útiles funcionalidades, qué obras tienen frecuencias en léxico más cercanas a las del texto que nos interesa en el corpus del que dispongamos. Cada autor usa las palabras en unas proporciones distintas, por lo que las obras suelen relacionarse en función de su autoría. Bien es cierto que debemos ser siempre precavidos por otras relaciones que pueden estarse produciendo por razón del género literario, la temática, la datación, la procedencia, el estado del texto, etc.
Se pueden consultar aquí ejemplos en los que la estilometría ratifica la atribución tradicional, como en La dama boba, Don Gil de las calzas verdes o El médico de su honra, y también casos en los que la estilometría apunta hacia una autoría inesperada y potencialmente esclarecedora, como en La francesa Laura, La monja alférez o La puerta Macarena (Primera parte). Debemos tener en cuenta que las nuevas atribuciones aquí señaladas son meros indicios de autoría arrojados por el proceso informático de forma automática. Todos los casos deben ser estudiados pormenorizadamente desde la filología atendiendo a sus complejidades particulares.
Estilometría, Inteligencia Artificial, Transcripción automática (HTR)...
En ETSO empleamos diferentes técnicas informáticas que nos permiten trabajar los textos como nunca antes había sido posible.
Gracias a Stylo (Maciej Eder, Jan Rybicki y Mike Kestemont) podemos relacionar los textos por sus usos léxicos.
Transkribus (P. Kahle, S. Colutto, G. Hackl y G. Mühlberger) nos posibilita transcribir y modernizar impresos y manuscritos antiguos automáticamente con un alto grado de acierto.
Además, empleamos otras técnicas estilométricas o de Inteligencia Artificial para tratar los textos.

CETSO
Un corpus creciente
Poco a poco, el corpus va creciendo gracias a obras procedentes de muchas fuentes. Por el momento, no podemos hacer públicos los textos íntegros de las obras porque no son de nuestra propiedad, pertenecen a distintos proyectos y algunos están pendientes de publicación en ediciones impresas. Lo que sí podemos hacer es utilizar las frecuencias de sus palabras para nuestras investigaciones.
En los últimos meses hemos podido añadir centenares de obras a través de la transcripción y modernización automática de manuscritos e impresos antiguos. Esto ha sido posible gracias a la herramienta Transkribus y los modelos entrenados por Álvaro Cuéllar, libres ya para la comunidad investigadora. Estos textos producto de la transcripción automática, si bien no presentan la misma calidad, han demostrado que sirven para su comparación estilométrica con el resto del corpus, pues obtienen unos resultados muy similares a los procedentes de ediciones cuidadas.
TEXORO: Textos del Siglo de Oro
Búsquedas en el corpus
Después de haber recopilado los más de 2800 textos de más de 350 dramaturgos que componen CETSO, queríamos ofrecer a la comunidad la posibilidad de realizar búsquedas internas en ellos. Así surge TEXORO: Textos del Siglo de Oro, donde, a través de la celda "Buscar en TEXORO", se puede consultar en qué obras aparecen las palabras que indiquemos.
En estos momentos TEXORO cuenta con los mismos textos que CETSO, pero es nuestra intención que un futuro crezca ofreciendo otros tipos de textos fuera del ámbito teatral. Es por esta razón que le hemos dado una entidad propia dentro del proyecto, alejándonos de los análisis de estilometría del teatro aurisecular.
Ahora solo es posible realizar búsquedas de palabras en TEXORO, pero estamos trabajando para que se puedan lanzar búsquedas más complejas, como grupos de palabras, y otras opciones de interés, como operadores lógicos o distancias entre las palabras.
¿Cómo te podemos ayudar? ¿Cómo nos puedes ayudar?
Podemos ayudarte a investigar la autoría de obras teatrales del Siglo de Oro. Si el informe de la obra que te interesa no está todavía en CETSO, escríbenos y nos pondremos en contacto contigo. De igual manera, si tienes interés en algún texto procedente de la transcripción y modernización automática de impresos y manuscritos, o si quieres más información sobre estos procesos, puedes escribirnos al respecto. En TEXORO se pueden realizar búsquedas en los 36 millones de palabras que componen el corpus actualmente, pero si te interesa realizar una búsqueda avanzada (en construcción ahora mismo) puedes escribirnos.
Nos puedes ayudar enviándonos textos del Siglo de Oro que todavía no tengamos en la base de datos. Nos comprometemos a responderte con un informe personalizado y a indicar la procedencia del texto en nuestro portal (si es que quieres que se haga público). Necesitamos también ayuda en múltiples trabajos dentro del proyecto, así que si te interesa el mundo de las Humanidades Digitales y el Siglo de Oro ponte en contacto con nosotros. Citar el proyecto nos ayuda mucho a difundir nuestro trabajo y a conseguir becas y financiación para poder seguir nuestra labor. Finalmente, se trata de un trabajo amplio que abarca multitud de textos y autores, por lo que es difícil tener todos los datos controlados. Si encuentras cualquier tipo de error o errata en la información de la página te estaremos muy agradecidos si nos los comunicas a través del contacto.
ETSO es un proyecto de
Actualidad

La monja alférez. De la academia al escenario a nombre de su legítimo autor: Juan Ruiz de Alarcón
La monja alférez fue uno de los primeros textos que despertaron la curiosidad del proyecto ETSO. Atribuida de forma tradicional a Juan Pérez de Montalbán, discípulo de Lope de Vega, la obra presentaba una relación especial con el conjunto textual de Juan Ruiz de Alarcón, dramaturgo novohispano.
Aquí se puede ver el análisis estilometríco en el que se compara la obra con el corpus CETSO, constituido por 2800 obras de 350 dramaturgos. Los resultados muestran que las obras con un léxico más cercano fueron escritas por Ruiz de Alarcón. Pérez de Montalbán, sin embargo, no presenta ninguna relación con la obra, a pesar de ser un autor con un importante número de comedias.
A partir de esta pista autorial el profesor Germán Vega García-Luengos emprendió el análisis histórico-filológico pertinente del texto y encontró una serie contundente de pruebas que apuntalaban la obra como un texto de Juan Ruiz de Alarcón. Aquí se puede consultar el estudio completo, que fue presentado en las XLII Jornadas de teatro Clásico del Festival Internacional de Teatro Clásico de Almagro.
Ante la atribución a un autor novohispano, la Compañía Nacional de Teatro de México ha decidido realizar un montaje de la comedia. Esta se ha estrenado en España a principios de julio del año 2022 en el marco del Festival Iberoamericano del Siglo de Oro Clásicos en Alcalá.
El suceso ha despertado el interés de la prensa y han aparecido noticias en El Norte de Castilla y El Cultural.