ETSO. Estilometría aplicada al Teatro del Siglo de Oro surge del interés del catedrático de la Universidad de Valladolid, Germán Vega García-Luengos, y del doctorando Álvaro Cuéllar en aplicar las nuevas herramientas informáticas a los numerosos problemas de autoría que presenta el teatro del Siglo de Oro español. Este portal trata de ofrecer análisis que puedan arrojar luz sobre las atribuciones de la vasta producción teatral del periodo aurisecular.

Uno de los programas más eficaces para realizar los análisis y el que se utiliza para los resultados que se ofrecen aquí es Stylo. Se trata de un paquete de R desarrollado por el Computational Stylistics Group, equipo formado por miembros de las universidades de Cracovia y Amberes, a cuya cabeza se sitúan los investigadores Maciej Eder, Jan Rybicki y Mike Kestemont.

Gracias a la estilometría podemos averiguar, en una de sus más útiles funcionalidades, qué textos tienen frecuencias en léxico más cercanas a las del que nos interesa en el corpus del que dispongamos: en estos momentos está compuesto por más de 2700 obras de más de 350 autores.

Ver ejemplos de La dama boba, Don Gil de las calzas verdes y El médico de su honra.

Imaginemos el potencial que ofrece esta herramienta con obras de las que no conocemos con seguridad su autoría. Podemos estudiar un sinnúmero de casos problemáticos, pero necesitaremos siempre un amplio corpus con el que comparar nuestro texto tras prepararlo adecuadamente, esto es, con ortografía modernizada, iguales variantes léxicas, sin acotaciones y sin los nombres de los personajes. Además, debemos contar con la pericia y los protocolos para que los resultados que obtengamos sean lo más rigurosos posible.

Ahí radica el valor de ETSO, del que puedes beneficiarte y con el que puedes colaborar. Si nos escribes podemos analizar con nuestro corpus la autoría de alguna obra en cuestión o de alguna de sus jornadas utilizando todos los enfoques que conocemos. Desde luego, no hay que considerar los resultados como concluyentes, pero sí como indicios, a veces muy elocuentes, de la proximidad o lejanía que mantienen los textos.

CETSO: Un corpus creciente

Poco a poco, el corpus va creciendo gracias a obras procedentes de muchas fuentes. Por el momento, no podemos hacer públicos los textos íntegros de las obras porque no son de nuestra propiedad, pertenecen a distintos proyectos y algunos están pendientes de publicación en ediciones impresas. Lo que sí podemos hacer es utilizar las frecuencias de sus palabras para nuestras investigaciones. Si cuentas con alguna obra del Siglo de Oro con ortografía modernizada o sabes cómo acceder a ella, por favor, escríbenos, agradeceremos mucho la colaboración. Cuanto más grande sea el corpus, mejores y más fiables resultados obtendremos.

En los últimos meses hemos podido añadir centenares de obras a través de la transcripción y modernización automática de manuscritos e impresos antiguos. Esto ha sido posible gracias a la herramienta Transkribus y los modelos entrenados por Álvaro Cuéllar, que serán liberados en breve para su uso por la comunidad investigadora. Estos textos producto de la transcripción automática, si bien no presentan la misma calidad, han demostrado que sirven para su comparación estilómetrica con el resto del corpus, pues obtienen unos resultados muy similares a los procedentes de ediciones cuidadas.