Od hloubkové struktury věty k diskurzním vztahům (diskurzní vztahy v češtině a jejich zachycení v anotovaném korpusu)
Discourse relations in Czech and their representation in an annotated corpus of texts
Zikánová, Šárka
Faculty of Arts
Czech Language and Literature - German Studies
Institute of Czech Language and Theory of Communication
23. 1. 2008
Univerzita Karlova, Filozofická fakulta
Tato práce je věnována problematice vzájemného vztahu syntaktické struktury věty a struktury diskurzu (textu). Syntaktická struktura věty se spolu s dalšími jevy podílí na koherenci a tedy srozumitelnosti diskurzu. Syntakticky motivované vztahy v diskurzu nazývá autorka vztahy konektivními. Tyto vztahy zahrnují jednak koordinační a některé závislostní vztahy v rámci věty ajednak připojování či navazování textových jednotek přes hranice věty. Explicitní prostředky vyjádření konektivních vztahů tvoří skupina tzv. diskurzních konektorů, což jsou slova nebo slovní spojení, která spojují či připojují textové jednotky a zároveň vyjadřují druh sémantického vztahu mezi nimi, tj. spojky, některé částicové a adverbiální výrazy a okrajově také další slovní druhy. Práce si klade za cíl popsat skupinu diskurzních konektorů v češtině na základě jazykového materiálu a syntaktické anotace Pražského závislostního korpusu a přispět tak ke vzniku korpusu s anotací diskurzních vztahů.
The present thesis is a contribution to the widely discussed issue of how the syntactic structure of a sentence and the structure of discourse (text) are related. The syntactic sentence structure along with other language phenomena participates in building a coherent, comprehensible discourse. The author calls the syntactically motivated relations in discourse connective relations. These relations include coordinating relations and some of the subordinating relations within a sentence and, secondly, adjoining of discourse units across the sentence boundary. The explicit means of expressing connective relations are called discourse connectives. It is a group of language expressions that connect or adjoin discourse units while indicating the type of semantic relation between them, i. e. conjunctions, some subjunctions, particles and adverbials, and marginally also some other parts-of-speech. The present thesis describes the semantic category of discourse connectives in Czech on the basis of language data and their syntactic annotation in the Prague Dependency Treebank, and thus aims to contribute to the design of a language corpus annotation scenario capturing the discourse relations in Czech.