文本处理

自动转录

自动转录流程。

Cuéllar, Álvaro. (2023). «La Inteligencia Artificial al rescate del Siglo de Oro. Transcripción y modernización automática de mil trescientos impresos y manuscritos teatrales» . Hipogrifo. Revista de literatura y cultura del Siglo de Oro, vol. 11, núm. 1, pp. 101-115.

我们最近借助 Transkribus 开发了自动转录流程。这些流程使我们能够自动转录约 1000 部西班牙黄金时代戏剧印刷本和 350 份手稿,并进行拼写现代化处理;这些文本现已成为 CETSO 和 TEXORO 的一部分。

1,000

部印刷本已自动转录并完成拼写现代化

350

份手稿已纳入项目工作流程

99%

印刷本的近似准确率

90%

手稿的近似准确率

所使用的三个模型均为公开模型,任何人都可以通过 Transkribus 使用。

Transkribus, 2021

Spanish Golden Age Prints 1.0

用于西班牙黄金时代戏剧印刷本自动转录的模型。

Transkribus, 2021

Spanish Golden Age Prints (Spelling Modernization) 1.0

用于已转录印刷本自动拼写现代化的版本。

Transkribus, 2021

Spanish Golden Age Manuscripts (Spelling Modernization) 1.0

面向戏剧手稿的模型,包含拼写现代化和相关特征检测。

这些模型使我们能够以较高准确率转录戏剧印刷本和手稿:印刷本约为 99%,手稿约为 90%。此外,我们的转录还可以按照现代规范自动进行拼写现代化,并检测某些元素,如斜体。

自动转录应用于西班牙黄金时代戏剧文本的示例。 自动转录和拼写现代化的第二个例子。

如果您想进一步了解该工具、将我们的转录模型应用于您的文档,或需要为研究获取某部印刷本或手稿的具体转录,请联系 Álvaro Cuéllar。