
项目 ETSO:应用于黄金世纪戏剧的文体计量学 源于研究者的兴趣 Álvaro Cuéllar (巴塞罗那自治大学)和教授 Germán Vega García-Luengos (巴利亚多利德大学)应用新的计算机工具解决众多问题 呈现西班牙黄金时代戏剧的作者。该门户试图提供以下分析: 可以揭示耳耳时期大量戏剧作品的归属。 借助风格测定法,我们可以在其最有用的功能之一中找出哪些作品具有 词汇频率最接近我们现有语料库中我们感兴趣的文本的词汇频率。 每个作者使用的词语比例不同,因此作品通常是相关的 其作者身份的功能。确实,我们必须始终对其他可能会造成影响的关系保持谨慎。 由于文学体裁、主题、日期、起源、状态而产生 文本的内容等
文体测量法认可传统归因的例子可以在这里查阅,例如 en La dama boba, Don Gil de las calzas verdes o El médico de su honra, 以及文体测量法指向意想不到且可能具有启发性的作者身份的情况,例如 La francesa Laura, La monja alférez o La puerta Macarena (primera parte). 我们必须考虑到新的 此处指出的归属仅仅是计算机过程以某种方式抛出的作者身份的指示 自动的。所有案例都必须从语言学角度进行详细研究,并考虑到它们的情况 特别的复杂性。
数字人文
文体测量、人工智能、自动转录 (HTR)...
在 ETSO,我们使用不同的计算机技术,使我们能够以前所未有的方式处理文本。 以前这是可能的。
由于 Stylo (Maciej Eder, Jan Rybicki y Mike Kestemont) 我们可以通过文本的用途来联系它们 词典。
Transkribus (P. Kahle, S. Colutto, G. Hackl y G. Mühlberger) 使我们能够转录和现代化 古代印刷品和手稿自动且高度准确。
此外,我们还使用其他文体测量或人工智能技术来处理文本。

TEXORO:黄金世纪文本
在3000部黄金世纪戏剧中进行文本检索
TEXORO 是一个文本搜索平台,允许 以统一的方式查阅黄金时代的大量作品. 该资源汇集了近 3,000 篇文本、超过 3800 万个索引单词和 400 多名作者的作品,并为从词汇、文本和文献标准探索数百年文学遗产提供了不同的可能性。
该搜索引擎允许您使用通配符查找单词、精确短语和模式,以及通过组合术语、邻近条件和按标题、流派、传统归因、风格归因或文本状态进行过滤来执行高级查询。 通过这种方式,TEXORO 促进了 特定的搜索以及更复杂的探索 整个语料库中单词或表达方式的存在、分布和关系。
BITESO
开放获取黄金时代的数字文本
BITESO 汇集了黄金时代的大量数字文本并开放获取。 该资源在很大程度上来自对作者身份进行风格计量分析的印刷品和手稿的自动转录,以及由于不同专家的合作而审查、提供或对比的材料。 其目标是为社区提供一个简单的访问点,以获取在许多情况下仍包含在旧文档中的文本,这些文本难以处理或阅读。
纳入 BITESO 的文本并不渴望取代关键版本,也不总是呈现相同的启发性质量。 此外,在目前的状态下,它们不包括角色的名字或舞台指示,而只包括每部作品的干净诗句。 然而,它们为阅读、咨询、教学、语言学研究和对数百年文学遗产的计算探索提供了有用的材料。 该资源的目的是促进这些材料的公开流通,并促进以新的形式获取黄金时代的戏剧和文学。
我们能为您提供什么帮助?你能如何帮助我们?
我们可以帮助您探索可用于黄金时代戏剧和文学研究的不同资源。 在作者归属检验中,可以查阅纳入语料库作品的文体计量报告,并了解其可能的作者关系线索。 TEXORO 允许您对近 3,000 部作品和超过 3800 万个单词进行文本搜索,并提供查找单词、短语、模式、术语组合和邻近关系的选项。 BITESO 提供对数字文本的开放访问,这些文本在很大程度上来自印刷品和手稿的自动转录。 此外,自动摘要可以让您对作品的情节和内容获得初步了解,始终作为初步帮助,而不是替代阅读或语言学分析。
您还可以与我们合作,向我们发送尚未纳入我们资源的黄金时代文本、书目信息、归属新闻、证词数据或任何可以改进集合的材料。 研究人员、教师和专家的合作对于继续扩展、审查和纠正现有信息至关重要。 因此,如果您发现文本中的错误、拼写错误、问题、自动摘要中的错误或可以更好地指定的数据,请将您的更正建议发送给我们,我们将不胜感激。 在出版物、学术著作或教学活动中引用我们的资源也有助于我们传播项目并获得维护和扩展项目所需的支持。
