El proyecto ETSO: Estilometría aplicada al Teatro del Siglo de Oro surge del interés del investigador Álvaro Cuéllar (Universitat Autònoma de Barcelona) y del catedrático Germán Vega García-Luengos (Universidad de Valladolid) en aplicar las nuevas herramientas informáticas a los numerosos problemas de autoría que presenta el teatro del Siglo de Oro español. Este portal trata de ofrecer análisis que puedan arrojar luz sobre las atribuciones de la vasta producción teatral del periodo aurisecular. Gracias a la estilometría podemos averiguar, en una de sus más útiles funcionalidades, qué obras tienen frecuencias en léxico más cercanas a las del texto que nos interesa en el corpus del que dispongamos. Cada autor usa las palabras en unas proporciones distintas, por lo que las obras suelen relacionarse en función de su autoría. Bien es cierto que debemos ser siempre precavidos por otras relaciones que pueden estarse produciendo por razón del género literario, la temática, la datación, la procedencia, el estado del texto, etc.

Se pueden consultar aquí ejemplos en los que la estilometría ratifica la atribución tradicional, como en La dama bobaDon Gil de las calzas verdes o El médico de su honra, y también casos en los que la estilometría apunta hacia una autoría inesperada y potencialmente esclarecedora, como en La francesa LauraLa monja alférez o La puerta Macarena (Primera parte). Debemos tener en cuenta que las nuevas atribuciones aquí señaladas son meros indicios de autoría arrojados por el proceso informático de forma automática. Todos los casos deben ser estudiados pormenorizadamente desde la filología atendiendo a sus complejidades particulares.

Estilometría, Inteligencia Artificial, Transcripción automática (HTR)...

En ETSO empleamos diferentes técnicas informáticas que nos permiten trabajar los textos como nunca antes había sido posible.

Gracias a Stylo (Maciej Eder, Jan Rybicki y Mike Kestemont) podemos relacionar los textos por sus usos léxicos.

Transkribus (P. Kahle, S. Colutto, G. Hackl y G. Mühlberger) nos posibilita transcribir y modernizar impresos y manuscritos antiguos automáticamente con un alto grado de acierto.

Además, empleamos otras técnicas estilométricas o de Inteligencia Artificial para tratar los textos.

 

ETSO - Lenguaje R

3000

Obras

350

Dramaturgos

37

Millones de palabras

200

Colaboradores

CETSO
Un corpus creciente

Poco a poco, el corpus va creciendo gracias a obras procedentes de muchas fuentes. Por el momento, no podemos hacer públicos los textos íntegros de las obras porque no son de nuestra propiedad, pertenecen a distintos proyectos y algunos están pendientes de publicación en ediciones impresas. Lo que sí podemos hacer es utilizar las frecuencias de sus palabras para nuestras investigaciones.

En los últimos meses hemos podido añadir centenares de obras a través de la transcripción y modernización automática de manuscritos e impresos antiguos. Esto ha sido posible gracias a la herramienta Transkribus y los modelos entrenados por Álvaro Cuéllar, libres ya para la comunidad investigadora. Estos textos producto de la transcripción automática, si bien no presentan la misma calidad, han demostrado que sirven para su comparación estilométrica con el resto del corpus, pues obtienen unos resultados muy similares a los procedentes de ediciones cuidadas.

TEXORO: Textos del Siglo de Oro

Búsquedas en el corpus

 

Después de haber recopilado los más de 2800 textos de más de 350 dramaturgos que componen CETSO, queríamos ofrecer a la comunidad la posibilidad de realizar búsquedas internas en ellos. Así surge TEXORO: Textos del Siglo de Oro, donde, a través de la celda "Buscar en TEXORO", se puede consultar en qué obras aparecen las palabras que indiquemos.

En estos momentos TEXORO cuenta con los mismos textos que CETSO, pero es nuestra intención que un futuro crezca ofreciendo otros tipos de textos fuera del ámbito teatral. Es por esta razón que le hemos dado una entidad propia dentro del proyecto, alejándonos de los análisis de estilometría del teatro aurisecular.

Ahora solo es posible realizar búsquedas de palabras en TEXORO, pero estamos trabajando para que se puedan lanzar búsquedas más complejas, como grupos de palabras, y otras opciones de interés, como operadores lógicos o distancias entre las palabras.

¿Cómo te podemos ayudar? ¿Cómo nos puedes ayudar?

Podemos ayudarte a investigar la autoría de obras teatrales del Siglo de Oro. Si el informe de la obra que te interesa no está todavía en CETSOescríbenos y nos pondremos en contacto contigo. De igual manera, si tienes interés en algún texto procedente de la transcripción y modernización automática de impresos y manuscritos, o si quieres más información sobre estos procesos, puedes escribirnos al respecto. En TEXORO se pueden realizar búsquedas en los 36 millones de palabras que componen el corpus actualmente, pero si te interesa realizar una búsqueda avanzada (en construcción ahora mismo) puedes escribirnos.

Nos puedes ayudar enviándonos textos del Siglo de Oro que todavía no tengamos en la base de datos. Nos comprometemos a responderte con un informe personalizado y a indicar la procedencia del texto en nuestro portal (si es que quieres que se haga público). Necesitamos también ayuda en múltiples trabajos dentro del proyecto, así que si te interesa el mundo de las Humanidades Digitales y el Siglo de Oro ponte en contacto con nosotros. Citar el proyecto nos ayuda mucho a difundir nuestro trabajo y a conseguir becas y financiación para poder seguir nuestra labor. Finalmente, se trata de un trabajo amplio que abarca multitud de textos y autores, por lo que es difícil tener todos los datos controlados. Si encuentras cualquier tipo de error o errata en la información de la página te estaremos muy agradecidos si nos los comunicas a través del contacto.

ETSO es un proyecto de

 

Álvaro Cuéllar

Universitat Autònoma de Barcelona

ETSO - Estilometría aplicada al Teatro del Siglo de Oro - Germán Vega García-Luengos

Germán Vega García-Luengos

Universidad de Valladolid