Визуализация стилометрического анализа проекта ETSO

Examen de autorías

Просмотреть стилометрические отчеты по 3000 театральным произведениям испанского Золотого века

Интерфейс текстового поиска TEXORO

TEXORO

Выполняйте сложный текстовый поиск в корпусе испанского Золотого века объемом 38 миллионов слов

Цифровая библиотека BITESO

BITESO

Просматривайте более 1500 цифровых текстов испанского Золотого века в открытом доступе

Автоматические резюме произведений

Автоматические аннотации

Просмотреть автоматические аннотации всех произведений в базе данных

Стилометрическая сеть проекта ETSO

Стилометрическая сеть

Визуализируйте сеть стилометрических отношений для 3000 произведений корпуса.

График стилометрических отношений проекта ETSO

Проект ETSO: Estilometría aplicada al Teatro del Siglo de Oro возник из интереса исследователя Álvaro Cuéllar (Universitat Autònoma de Barcelona) и профессора Germán Vega García-Luengos (Universidad de Valladolid) к применению новых компьютерных инструментов к многочисленным проблемам авторской атрибуции, которые ставит театр испанского Золотого века. Портал предлагает анализы, способные прояснить вопросы атрибуции в обширной театральной продукции этого периода. Стилометрия позволяет, в одном из своих наиболее полезных применений, определить в доступном корпусе произведения, чьи лексические частоты наиболее близки к частотам изучаемого текста. Поскольку каждый автор использует слова в разных пропорциях, произведения часто сближаются в соответствии с авторством. Однако всегда необходима осторожность: сходства могут быть связаны также с жанром, темой, датировкой, происхождением, состоянием текста или другими факторами.

Здесь можно ознакомиться с примерами, в которых стилометрия подтверждает традиционную атрибуцию, такими как La dama boba, Don Gil de las calzas verdes, El médico de su honra, а также со случаями, где она указывает на неожиданную и потенциально значимую атрибуцию, такими как La francesa Laura, La monja alférez, La puerta Macarena (primera parte). Новые атрибуции, указанные здесь, являются лишь предварительными признаками авторства, полученными в результате автоматической компьютерной обработки. Поэтому каждый случай требует подробного филологического изучения с учетом его особой сложности.

Цифровые гуманитарные науки

Стилометрия, искусственный интеллект, автоматическая транскрипция (HTR)...

В ETSO мы используем разные компьютерные технологии, которые позволяют нам работать с текстами так, как прежде было невозможно.

Благодаря Stylo (Maciej Eder, Jan Rybicki и Mike Kestemont) мы можем сопоставлять тексты по особенностям их лексического употребления.

Transkribus (P. Kahle, S. Colutto, G. Hackl и G. Mühlberger) позволяет нам автоматически транскрибировать старопечатные издания и рукописи с высокой степенью точности.

Кроме того, мы используем другие стилометрические и ИИ-методы для обработки и анализа текстов.

Панель стилометрической отчетности ETSO

TEXORO: тексты испанского Золотого века

Текстовый поиск по 3000 произведениям испанского Золотого века

TEXORO — это платформа текстового поиска, которая позволяет единообразно обращаться к большому корпусу произведений испанского Золотого века. Ресурс объединяет около 3000 текстов, более 38 миллионов проиндексированных слов и произведения более чем 400 авторов, предлагая разные способы изучать это литературное наследие по лексическим, текстовым и документальным критериям.

Поиск позволяет находить слова, точные фразы и шаблоны с подстановочными знаками, а также выполнять расширенные запросы с сочетанием терминов, условий близости и фильтров по названию, жанру, традиционной атрибуции, стилометрической атрибуции или состоянию текста. Так TEXORO поддерживает как точечный поиск, так и более сложные исследования присутствия, распределения и связей слов или выражений во всем корпусе.

BITESO

Цифровые тексты испанского Золотого века в открытом доступе

BITESO объединяет и предоставляет в открытом доступе широкую коллекцию цифровых текстов испанского Золотого века. Ресурс во многом основан на автоматических транскрипциях старопечатных изданий и рукописей, подготовленных для стилометрического анализа авторства, а также на материалах, проверенных, предоставленных или сопоставленных благодаря сотрудничеству со специалистами.

Тексты, включенные в BITESO, следует понимать как рабочие тексты: они не заменяют критические издания, могут содержать ошибки транскрипции и имеют неодинаковое текстологическое качество в зависимости от источника и степени проверки. В текущем виде они предлагаются без имен персонажей и сценических ремарок и содержат только основной очищенный текст каждого произведения.

Как мы можем вам помочь? Как вы можете помочь нам?

Мы можем помочь вам освоить ресурсы для изучения театра и литературы испанского Золотого века. В Examen de autorías можно ознакомиться со стилометрическими отчетами по произведениям корпуса и с признаками возможных авторских связей. TEXORO позволяет выполнять текстовый поиск примерно по 3000 произведениям и более чем 38 миллионам слов. BITESO предоставляет открытый доступ к цифровым текстам, многие из которых получены из автоматических транскрипций старопечатных изданий и рукописей. Автоматические аннотации дают первое представление о сюжете и содержании произведений, но служат только предварительной помощью и не заменяют чтение или филологический анализ.

Вы также можете сотрудничать с нами, присылая тексты испанского Золотого века, еще не включенные в наши ресурсы, библиографическую информацию, сведения об атрибуциях, данные о текстовых свидетелях или любые материалы, способные улучшить коллекцию. Ссылки на наши ресурсы в публикациях, научных работах или преподавании также помогают распространять проект и получать поддержку, необходимую для его поддержания и расширения.

ETSO — проект под руководством:

Изображение Álvaro Cuéllar

Álvaro Cuéllar

Universitat Autònoma de Barcelona

Изображение Germán Vega García-Luengos

Germán Vega García-Luengos

Universidad de Valladolid