
プロジェクト ETSO:スペイン黄金世紀演劇に応用した文体計量分析 研究者の興味から生じたもの Álvaro Cuéllar (バルセロナ自治大学)と教授 Germán Vega García-Luengos (バリャドリッド大学) 数々の問題に新しいコンピューターツールを適用 スペイン黄金時代の演劇を紹介する作家の作品。このポータルは、次のような分析を提供しようとしています。 これにより、耳介時代の膨大な演劇作品の帰属に光を当てることができます。 スタイロメトリーのおかげで、その最も便利な機能の 1 つで、どの作品がどのような影響を及ぼしているかを知ることができます。 利用可能なコーパス内で関心のあるテキストの語彙頻度に最も近い語彙頻度。 各作者が使用する言葉の割合が異なるため、作品は通常、関連性があります。 著者の役割。確かに、他の関係については常に注意しなければなりません。 文学のジャンル、テーマ、年代、起源、状態によって制作される テキストなどの
スタイロメトリーが伝統的な帰属を追認する例は、ここで参照できます。 en La dama boba, Don Gil de las calzas verdes o El médico de su honra, また、次のような、スタイロメトリーが予期せぬ、潜在的に啓発的な著者を示しているケースもあります。 La francesa Laura, La monja alférez o La puerta Macarena (primera parte). 新しいことを考慮する必要があります。 ここで示されている帰属は、コンピューターのプロセスによって特定の方法で表示される単なる著者の表示にすぎません。 自動。すべてのケースは、その問題点を考慮して、文献学から詳細に研究されなければなりません。 特別な複雑さ。
デジタル人文科学
スチロメトリー、人工知能、自動転写 (HTR)...
ETSO では、これまでにない方法でテキストを扱うことを可能にするさまざまなコンピューター技術を使用しています。 以前は可能でした。
おかげで Stylo (Maciej Eder, Jan Rybicki y Mike Kestemont) テキストをその用途によって関連付けることができます 辞書。
Transkribus (P. Kahle, S. Colutto, G. Hackl y G. Mühlberger) 転写と最新化が可能になります 古代の版画や写本を高精度で自動的に作成します。
さらに、他のスタイロメトリーまたは人工知能技術を使用してテキストを処理します。

TEXORO:スペイン黄金世紀のテキスト
スペイン黄金世紀の作品3000点におけるテキスト検索
TEXORO は、以下を可能にするテキスト検索プラットフォームです。 黄金時代の作品の大規模なコーパスを統一的な方法で参照する. このリソースには、3,800 万以上の索引付き単語と 400 人を超える著者の作品を含む 3,000 近くのテキストがまとめられており、語彙、テキスト、文書の基準から何世紀にもわたる文学遺産を探求するさまざまな可能性を提供します。
この検索エンジンでは、ワイルドカードを使用して単語、正確なフレーズ、パターンを検索できるだけでなく、用語、近接条件を組み合わせて高度なクエリを実行したり、タイトル、ジャンル、従来の帰属、スタイロメトリの帰属、またはテキストステータスによるフィルターを実行したりできます。 このようにして、TEXORO は両方を促進します。 特定の検索とより複雑な探索 コーパス全体における単語または表現の存在、分布、および関係。
BITESO
オープンアクセスの黄金時代のデジタルテキスト
BITESO は、黄金時代のデジタル テキストの幅広いコレクションをまとめてオープン アクセスを提供します。 このリソースの大部分は、著者性のスタイロメトリー分析のために実行される印刷物と原稿の自動転写から、また、さまざまな専門家の協力によりレビュー、提供、または対照された資料から生じます。 その目的は、多くの場合、扱うのも読むのも難しい古い文書に含まれていたテキストへの簡単なアクセス ポイントをコミュニティに提供することです。
BITESO に組み込まれているテキストは、重要な版に取って代わることを目指しているわけではなく、常に同じ風変わりな品質を示しているわけでもありません。 なお、現状では登場人物の名前や演出などは記載されておらず、各作品の清句のみが記されている。 しかし、それらは、何世紀にもわたる文学遺産の読書、相談、教育、文献学的研究、および計算による探求にとって有用な資料を構成します。 このリソースの目的は、これらの資料のオープンな流通を促進し、黄金時代の演劇と文学への新しい形式のアクセスを促進することです。
どのようにお手伝いできるでしょうか?どうやって私たちを助けてくれるでしょうか?
私たちは、黄金時代の演劇と文学の研究に利用できるさまざまなリソースを探索するお手伝いをします。 著者帰属判定では、コーパスに含まれる作品の文体計量レポートを参照し、著者関係の可能性を示す手がかりを確認できます。 TEXORO を使用すると、単語、フレーズ、パターン、用語の組み合わせ、近接関係を見つけるオプションを使用して、約 3,000 の作品と 3,800 万語以上の単語に対してテキスト検索を実行できます。 BITESO は、印刷物や原稿の自動転写から得られるデジタル テキストへのオープン アクセスを提供します。 さらに、自動要約により、読書や文献学的分析の代わりとしてではなく、常に最初の助けとして、作品のプロットと内容に関する最初の方向性を得ることができます。
また、私たちのリソースにまだ組み込まれていない黄金時代のテキスト、書誌情報、帰属に関するニュース、証言に関するデータ、またはセットを改善できる資料を送信して、私たちと協力することもできます。 利用可能な情報を継続的に拡張、レビュー、修正するには、研究者、教師、専門家の協力が不可欠です。 したがって、テキスト内の誤り、タイプミス、問題、自動要約の誤り、またはより適切に指定できるデータを見つけた場合は、修正提案をお送りいただければ幸いです。 出版物、学術著作、または教育活動で私たちのリソースを引用することは、プロジェクトを広め、プロジェクトを維持および拡大するために必要なサポートを得るのにも役立ちます。
