Atribuce autorství básnických textů
Authorship Attribution of Poetic Texts
dissertation thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/115525Identifiers
Study Information System: 168801
Collections
- Kvalifikační práce [23740]
Author
Advisor
Referee
Milička, Jiří
Mačutek, Ján
Faculty / Institute
Faculty of Arts
Discipline
Mathematical Linguistics
Department
Institute of the Czech National Corpus
Date of defense
21. 11. 2019
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Pass
Keywords (Czech)
atribuce autorství|stylometrie|versologie|strojové učení|korpusová lingvistikaKeywords (English)
authorship attribution|stylometry|versification|machine learning|corpus linguisticsNázev práce: Atribuce autorství básnických textů Autor: Mgr. Petr Plecháč, Ph.D. Katedra: Ústav českého národního korpusu Školitel: doc. Mgr. Václav Cvrček, Ph.D. ABSTRAKT Pro rozpoznávání autorství básnických textů nabízí současná stylometrie řadu metod za- ložených na analýze pestré škály textových rysů (např. frekvence slov, frekvence zna- kových n-gramů). Jeden podstatný aspekt těchto textů ovšem zůstává stranou, a to jejich stránka versologická. Tato práce proto na čtyřech korpusech básnických textů (českých, německých, španělských a anglických) analyzuje, do jaké míry lze versologické charakte- ristiky - jako např. četnosti rytmických konfigurací nebo četnosti různých typů rýmů - využít jako indikátor autorství básnického textu. Ukazujeme, že (1) úspěšnost versolo- gických modelů vysoce převyšuje hranici random baseline, (2) ojediněle převyšuje úspěšnost obvyklých lexikálních modelů a (3) kombinované versologicko-lexikální mode- ly vykazují téměř vždy vyšší úspěšnost než jednotlivé modely samy o sobě. V další části práce jsou versologické rysy využity pro atribuci dvou textů se sporným autorstvím: (1) veršované drama The Famous History of the Life of King Henry the Eigth poprvé otištěné pod jménem Williama Shakespeara, u nějž se ovšem před-pokládá i autorská účast Johna Fletchera, příp. dalších autorů...
Title: Authorship Attribution of Poetic Texts Author: Mgr. Petr Plecháč, Ph.D. Department: Institute of Czech National Corpus Supervisor: doc. Mgr. Václav Cvrček, Ph.D. ABSTRACT Contemporary stylometry offers a number of methods for authorship recognition of po- etic texts based on a variety of textual features (e.g. word frequencies, frequencies of character n-grams). However, it seems that one important aspect of these texts has been rather left aside - this aspect is versification. The thesis uses four corpora of poetic texts (Czech, German, Spanish, and English) in order to analyze to what extent versification features - such as frequencies of rhythmic patterns or frequencies of various types of rhymes - may be used as an indicator of authorship. We show that (1) versification-based models significantly outperform the random baseline, (2) in some cases versification- based models even outperform the traditionally used lexical models, (3) in most of the cases combination of both types of models outperforms the given models alone. Versifi- cation features are consequently employed for the purpose of attribution of two texts of doubted authorship: (1) the versified play The Famous History of the Life of King Henry the Eigth which was originally published under the name of William Shakespeare, but where...