dc.contributor.advisor | Cvrček, Václav | |
dc.creator | Plecháč, Petr | |
dc.date.accessioned | 2019-12-12T10:51:24Z | |
dc.date.available | 2019-12-12T10:51:24Z | |
dc.date.issued | 2019 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/115525 | |
dc.description.abstract | Název práce: Atribuce autorství básnických textů Autor: Mgr. Petr Plecháč, Ph.D. Katedra: Ústav českého národního korpusu Školitel: doc. Mgr. Václav Cvrček, Ph.D. ABSTRAKT Pro rozpoznávání autorství básnických textů nabízí současná stylometrie řadu metod za- ložených na analýze pestré škály textových rysů (např. frekvence slov, frekvence zna- kových n-gramů). Jeden podstatný aspekt těchto textů ovšem zůstává stranou, a to jejich stránka versologická. Tato práce proto na čtyřech korpusech básnických textů (českých, německých, španělských a anglických) analyzuje, do jaké míry lze versologické charakte- ristiky - jako např. četnosti rytmických konfigurací nebo četnosti různých typů rýmů - využít jako indikátor autorství básnického textu. Ukazujeme, že (1) úspěšnost versolo- gických modelů vysoce převyšuje hranici random baseline, (2) ojediněle převyšuje úspěšnost obvyklých lexikálních modelů a (3) kombinované versologicko-lexikální mode- ly vykazují téměř vždy vyšší úspěšnost než jednotlivé modely samy o sobě. V další části práce jsou versologické rysy využity pro atribuci dvou textů se sporným autorstvím: (1) veršované drama The Famous History of the Life of King Henry the Eigth poprvé otištěné pod jménem Williama Shakespeara, u nějž se ovšem před-pokládá i autorská účast Johna Fletchera, příp. dalších autorů... | cs_CZ |
dc.description.abstract | Title: Authorship Attribution of Poetic Texts Author: Mgr. Petr Plecháč, Ph.D. Department: Institute of Czech National Corpus Supervisor: doc. Mgr. Václav Cvrček, Ph.D. ABSTRACT Contemporary stylometry offers a number of methods for authorship recognition of po- etic texts based on a variety of textual features (e.g. word frequencies, frequencies of character n-grams). However, it seems that one important aspect of these texts has been rather left aside - this aspect is versification. The thesis uses four corpora of poetic texts (Czech, German, Spanish, and English) in order to analyze to what extent versification features - such as frequencies of rhythmic patterns or frequencies of various types of rhymes - may be used as an indicator of authorship. We show that (1) versification-based models significantly outperform the random baseline, (2) in some cases versification- based models even outperform the traditionally used lexical models, (3) in most of the cases combination of both types of models outperforms the given models alone. Versifi- cation features are consequently employed for the purpose of attribution of two texts of doubted authorship: (1) the versified play The Famous History of the Life of King Henry the Eigth which was originally published under the name of William Shakespeare, but where... | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Filozofická fakulta | cs_CZ |
dc.subject | authorship attribution|stylometry|versification|machine learning|corpus linguistics | en_US |
dc.subject | atribuce autorství|stylometrie|versologie|strojové učení|korpusová lingvistika | cs_CZ |
dc.title | Atribuce autorství básnických textů | cs_CZ |
dc.type | dizertační práce | cs_CZ |
dcterms.created | 2019 | |
dcterms.dateAccepted | 2019-11-21 | |
dc.description.department | Ústav českého národního korpusu | cs_CZ |
dc.description.department | Institute of the Czech National Corpus | en_US |
dc.description.faculty | Filozofická fakulta | cs_CZ |
dc.description.faculty | Faculty of Arts | en_US |
dc.identifier.repId | 168801 | |
dc.title.translated | Authorship Attribution of Poetic Texts | en_US |
dc.contributor.referee | Milička, Jiří | |
dc.contributor.referee | Mačutek, Ján | |
thesis.degree.name | Ph.D. | |
thesis.degree.level | doktorské | cs_CZ |
thesis.degree.discipline | Mathematical Linguistics | en_US |
thesis.degree.discipline | Matematická lingvistika | cs_CZ |
thesis.degree.program | Philology | en_US |
thesis.degree.program | Filologie | cs_CZ |
uk.thesis.type | dizertační práce | cs_CZ |
uk.taxonomy.organization-cs | Filozofická fakulta::Ústav českého národního korpusu | cs_CZ |
uk.taxonomy.organization-en | Faculty of Arts::Institute of the Czech National Corpus | en_US |
uk.faculty-name.cs | Filozofická fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Arts | en_US |
uk.faculty-abbr.cs | FF | cs_CZ |
uk.degree-discipline.cs | Matematická lingvistika | cs_CZ |
uk.degree-discipline.en | Mathematical Linguistics | en_US |
uk.degree-program.cs | Filologie | cs_CZ |
uk.degree-program.en | Philology | en_US |
thesis.grade.cs | Prospěl/a | cs_CZ |
thesis.grade.en | Pass | en_US |
uk.abstract.cs | Název práce: Atribuce autorství básnických textů Autor: Mgr. Petr Plecháč, Ph.D. Katedra: Ústav českého národního korpusu Školitel: doc. Mgr. Václav Cvrček, Ph.D. ABSTRAKT Pro rozpoznávání autorství básnických textů nabízí současná stylometrie řadu metod za- ložených na analýze pestré škály textových rysů (např. frekvence slov, frekvence zna- kových n-gramů). Jeden podstatný aspekt těchto textů ovšem zůstává stranou, a to jejich stránka versologická. Tato práce proto na čtyřech korpusech básnických textů (českých, německých, španělských a anglických) analyzuje, do jaké míry lze versologické charakte- ristiky - jako např. četnosti rytmických konfigurací nebo četnosti různých typů rýmů - využít jako indikátor autorství básnického textu. Ukazujeme, že (1) úspěšnost versolo- gických modelů vysoce převyšuje hranici random baseline, (2) ojediněle převyšuje úspěšnost obvyklých lexikálních modelů a (3) kombinované versologicko-lexikální mode- ly vykazují téměř vždy vyšší úspěšnost než jednotlivé modely samy o sobě. V další části práce jsou versologické rysy využity pro atribuci dvou textů se sporným autorstvím: (1) veršované drama The Famous History of the Life of King Henry the Eigth poprvé otištěné pod jménem Williama Shakespeara, u nějž se ovšem před-pokládá i autorská účast Johna Fletchera, příp. dalších autorů... | cs_CZ |
uk.abstract.en | Title: Authorship Attribution of Poetic Texts Author: Mgr. Petr Plecháč, Ph.D. Department: Institute of Czech National Corpus Supervisor: doc. Mgr. Václav Cvrček, Ph.D. ABSTRACT Contemporary stylometry offers a number of methods for authorship recognition of po- etic texts based on a variety of textual features (e.g. word frequencies, frequencies of character n-grams). However, it seems that one important aspect of these texts has been rather left aside - this aspect is versification. The thesis uses four corpora of poetic texts (Czech, German, Spanish, and English) in order to analyze to what extent versification features - such as frequencies of rhythmic patterns or frequencies of various types of rhymes - may be used as an indicator of authorship. We show that (1) versification-based models significantly outperform the random baseline, (2) in some cases versification- based models even outperform the traditionally used lexical models, (3) in most of the cases combination of both types of models outperforms the given models alone. Versifi- cation features are consequently employed for the purpose of attribution of two texts of doubted authorship: (1) the versified play The Famous History of the Life of King Henry the Eigth which was originally published under the name of William Shakespeare, but where... | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Filozofická fakulta, Ústav českého národního korpusu | cs_CZ |
thesis.grade.code | P | |
uk.publication-place | Praha | cs_CZ |