
ETSO: Estilometría aplicada al Teatro del Siglo de Oro 项目源于研究者 Álvaro Cuéllar (Universitat Autònoma de Barcelona) 与教授 Germán Vega García-Luengos (Universidad de Valladolid) 的共同兴趣:将新的计算工具应用于西班牙黄金时代戏剧中大量作者归属问题。本门户提供的分析旨在帮助理解这一时期庞大戏剧生产中的归属问题。文体计量学的一项重要用途,是在现有语料库中识别词汇频率最接近待研究文本的作品。由于每位作者使用词语的比例各不相同,作品往往会按照作者归属呈现相互接近的关系。不过,必须始终保持谨慎,因为相似性也可能来自体裁、主题、年代、来源、文本状况或其他因素。
这里可以查看文体计量学支持传统归属的例子,如 La dama boba、Don Gil de las calzas verdes、El médico de su honra,也可以查看文体计量学指向意外且可能具有启发性的归属案例,如 La francesa Laura、La monja alférez、La puerta Macarena (primera parte)。这里提出的新归属只应视为由自动计算处理产生的初步作者归属线索。因此,每一个案例都必须结合其具体复杂性进行细致的文献学研究。
数字人文
文体计量学、人工智能、自动转录(HTR)……
在 ETSO,我们使用多种计算技术,使我们能够以前所未有的方式处理文本。
借助 Stylo(Maciej Eder、Jan Rybicki 和 Mike Kestemont),我们可以根据词汇使用情况将文本相互关联。
Transkribus(P. Kahle、S. Colutto、G. Hackl 和 G. Mühlberger)使我们能够以较高准确率自动转录古代印刷本和手稿。
此外,我们还使用其他文体计量和人工智能技术来处理和分析文本。

TEXORO:西班牙黄金时代文本
在 3000 部西班牙黄金时代作品中进行文本检索
TEXORO 是一个文本搜索平台,可通过统一界面检索西班牙黄金时代的大型作品语料库。该资源汇集近 3000 篇文本、超过 3800 万个索引词以及 400 多位作者的作品,可从词汇、文本和文献等角度探索这一文学遗产。
检索器可以查找词语、精确短语和带通配符的模式,也支持通过组合术语、邻近条件以及标题、体裁、传统归属、文体计量归属或文本状态等筛选条件进行高级查询。通过这种方式,TEXORO 既支持有针对性的检索,也支持对整个语料库中词语或表达的出现、分布和关系进行更复杂的探索。
BITESO
开放获取的西班牙黄金时代数字文本
BITESO 汇集并开放提供一批西班牙黄金时代数字文本。该资源在很大程度上基于为文体计量作者归属分析而制作的古代印刷本和手稿自动转录文本,同时也包括经专家合作校阅、提供或核验的材料。
BITESO 中的文本应被视为工作文本:它们不能替代校勘本,可能包含转录错误,并且文本质量会因来源和校订程度而不同。目前这些文本不含人物姓名和舞台说明,只提供每部作品的整理正文。
我们可以怎样帮助您?您可以怎样帮助我们?
我们可以帮助您探索用于研究西班牙黄金时代戏剧和文学的各项资源。Examen de autorías 提供语料库中作品的文体计量报告,并给出可能的作者归属关系线索。TEXORO 可在近 3000 部作品和 3800 多万个词中进行文本检索。BITESO 开放提供数字文本,其中很大一部分来自古代印刷本和手稿的自动转录。自动摘要还可为作品情节和内容提供初步参考,但它们始终只是辅助工具,不能替代阅读或文献学分析。
您也可以向我们提供尚未纳入资源的西班牙黄金时代文本、书目信息、归属研究动态、文本见证资料,或任何有助于改进合集的材料。在出版物、学术研究或教学活动中引用我们的资源,也有助于传播项目并获得维护和扩展所需的支持。
