Valenční rámce substantiv v češtině na základě korpusových dat

Čermáková, Anna

Valency frames of Czech nouns: corpus-driven study

dizertační práce (OBHÁJENO)

Zobrazit/otevřít

Trvalý odkaz

http://hdl.handle.net/20.500.11956/15176

Identifikátory

SIS: 108322

Katalog UK: 990010309510106986

Oponent práce

Panevová, Jarmila

Kopřivová, Marie

Fakulta / součást

Filozofická fakulta

Obor

Matematická lingvistika

Katedra / ústav / klinika

Ústav teoretické a komputační lingvistiky

Datum obhajoby

21. 5. 2008

Nakladatel

Univerzita Karlova, Filozofická fakulta

Jazyk

Čeština

Známka

Prospěl/a

Cílem práce je vytvo ení lexikologického rámce pro systematický popis valence eských substantiv na základ analýzy dat z eského národního korpusu (SYN2000). Valence je zde chápána jako systémová lexikologická vlastnost slov. Valence je abstraktním vztahem, který má konkrétní realizace, v této práci se pro zjednodušení pojem valence používá pro obojí. Pro ú ely analýzy je valence pojímána pom rn voln , protože není vhodné dop edu p edpokládat, že tu jsou všechny její aspekty jasné. P edpokládá se jako platná napravo od substantiva a analýza si všímá jev , které se zde systematicky (z hlediska frekvence výskytu) vyskytují. Práce nabízí korpusem ízený lingvistický popis, který se zam uje na slova v kontextu, ve kterém se obvykle nacházejí a vytvá ejí tak typické slovní vzorce. Základ analýzy tvo í náhodné vzorky 99 náhodn vybraných substantiv ze st edního frekven ního pásma. V p ípadech, kdy vzorky neposkytly dostate né množství dat, byla analýza rozší ena o hledání pomocí specializovaných dotaz do korpusu. U substantiv z vysokých frekven ních pásem p edpokládáme rozt íšt n jší valen ní profily, pro potvrzení této hypotézy bylo n kolik substantiv z vysokých frekven ních pásem podrobeno dodate né stru né analýze.

Abstrakt (anglicky)

This thesis aims at providing a lexicological framework for systematic description of valency of Czech nouns. Valency is seen here as a lexicological property of words. Valency is an abstract relation with concrete textual realizations and the term "valency" is used here for both: the abstract notion and the concrete valency exponents and realisations. The analysis is corpus-driven and as such it is based on a rather loose notion of valency, devoid of any pre-conceived ideas, concentrating on typical structural patterns of occurrence on the right side of the noun under investigation. For the analysis the corpus SYN2000, a part of the Czech National Corpus has been used. The analysis is based on random selections of concordance lines of randomly chosen 99 nouns from the middle frequency range. In some cases, where the data proved insufficient, we have carried out additional specialized corpus queries. For high frequency nouns we assume highly differentiated valency profiles; to confirm this hypothesis we have carried out additional brief analysis of several high frequency nouns. The most frequent valency of Czech nouns is genitive complementation, which we find as occurring with more than 90% of the analysed nouns. For some of the nouns, the genitive valency is a very dominant valency pattern (in some cases...

Citace dokumentu

Metadata

Zobrazit celý záznam