Alternativní vyjádření konektorů v češtině
Alternative Lexicalizations of Discourse Connectives in Czech
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/39951Identifiers
Study Information System: 115437
Collections
- Kvalifikační práce [23212]
Author
Advisor
Referee
Lehečková, Eva
Faculty / Institute
Faculty of Arts
Discipline
English and American Studies - Teacher Training for Czech Language and Literature
Department
Institute of Czech Language and Theory of Communication
Date of defense
18. 6. 2012
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
alternativní vyjádření konektorů (altlexy), diskurz, diskurzní vztahy, konektoryKeywords (English)
alternative lexicalization of discourse markers (AltLex), connectives, discourse, discourse relationsPráce se zabývá otázkou, jaké jazykové prostředky mohou být zahrnuty do anotace diskurzních vztahů Pražského závislostního korpusu (PDT). Jejím cílem je prozkoumat alternativní vyjádření diskurzních konektorů (tzv. altlexů) v češtině. Analýza vychází z anotovaných dat PDT, jejím předmětem je mimo jiné srovnání českých altlexů vyskytujících se v PDT a anglických altlexů z PDTB (anotovaného pensylvánského korpusu Penn Discourse Treebank). Práce přináší lexikálně-syntaktickou a sémantickou klasifikaci českých altlexů a analýzu jejich současné anotace v PDT. V současné době PDT obsahuje 306 vyjádření (v 43 955 větách), která byla anotátory označena jako altlexy. Jak ovšem tato práce dokládá, toto číslo není konečné. Předpokládáme, že počet altlexů se po důkladném zpracování podstatně zvýší, protože altlexy nejsou syntakticky ani lexikálně omezeny a některé z nich vykazují velký stupeň variability.
The paper concentrates on which language means may be included into the annotation of discourse relations in the Prague Dependency Treebank (PDT) and tries to examine the so called alternative lexicalizations of discourse markers (AltLex's) in Czech. The analysis proceeds from the annotated data of PDT and tries to draw a comparison between the Czech AltLex's from PDT and English AltLex's from PDTB (the Penn Discourse Treebank). The paper presents the lexico-syntactic and semantic characterization of the Czech AltLex's and comments on the current stage of their annotation in PDT. In the current version, PDT contains 306 expressions (out of the total 43,955 of sentences) that were labeled by annotators as being an AltLex. However, as the analysis demonstrates, this number is not final. We suppose that it will increase after the further elaboration, as AltLex's are not restricted to a limited set of syntactic classes and some of them exhibit a great degree of variation.