Alternativní vyjádření konektorů v češtině
Alternative Lexicalizations of Discourse Connectives in Czech
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/39951Identifikátory
SIS: 115437
Katalog UK: 990014922100106986
Kolekce
- Kvalifikační práce [24991]
Autor
Vedoucí práce
Oponent práce
Lehečková, Eva
Fakulta / součást
Filozofická fakulta
Obor
Anglistika - amerikanistika - Učitelství českého jazyka a literatury pro střední školy
Katedra / ústav / klinika
Ústav českého jazyka a teorie komunikace
Datum obhajoby
18. 6. 2012
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
alternativní vyjádření konektorů (altlexy), diskurz, diskurzní vztahy, konektoryKlíčová slova (anglicky)
alternative lexicalization of discourse markers (AltLex), connectives, discourse, discourse relationsPráce se zabývá otázkou, jaké jazykové prostředky mohou být zahrnuty do anotace diskurzních vztahů Pražského závislostního korpusu (PDT). Jejím cílem je prozkoumat alternativní vyjádření diskurzních konektorů (tzv. altlexů) v češtině. Analýza vychází z anotovaných dat PDT, jejím předmětem je mimo jiné srovnání českých altlexů vyskytujících se v PDT a anglických altlexů z PDTB (anotovaného pensylvánského korpusu Penn Discourse Treebank). Práce přináší lexikálně-syntaktickou a sémantickou klasifikaci českých altlexů a analýzu jejich současné anotace v PDT. V současné době PDT obsahuje 306 vyjádření (v 43 955 větách), která byla anotátory označena jako altlexy. Jak ovšem tato práce dokládá, toto číslo není konečné. Předpokládáme, že počet altlexů se po důkladném zpracování podstatně zvýší, protože altlexy nejsou syntakticky ani lexikálně omezeny a některé z nich vykazují velký stupeň variability.
The paper concentrates on which language means may be included into the annotation of discourse relations in the Prague Dependency Treebank (PDT) and tries to examine the so called alternative lexicalizations of discourse markers (AltLex's) in Czech. The analysis proceeds from the annotated data of PDT and tries to draw a comparison between the Czech AltLex's from PDT and English AltLex's from PDTB (the Penn Discourse Treebank). The paper presents the lexico-syntactic and semantic characterization of the Czech AltLex's and comments on the current stage of their annotation in PDT. In the current version, PDT contains 306 expressions (out of the total 43,955 of sentences) that were labeled by annotators as being an AltLex. However, as the analysis demonstrates, this number is not final. We suppose that it will increase after the further elaboration, as AltLex's are not restricted to a limited set of syntactic classes and some of them exhibit a great degree of variation.
