Valenční rámce substantiv v češtině na základě korpusových dat
Valency frames of Czech nouns: corpus-driven study
dizertační práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/15176Identifikátory
SIS: 108322
Katalog UK: 990010309510106986
Kolekce
- Kvalifikační práce [25007]
Autor
Vedoucí práce
Oponent práce
Panevová, Jarmila
Kopřivová, Marie
Fakulta / součást
Filozofická fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav teoretické a komputační lingvistiky
Datum obhajoby
21. 5. 2008
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Čeština
Známka
Prospěl/a
Cílem práce je vytvo ení lexikologického rámce pro systematický popis valence eských substantiv na základ analýzy dat z eského národního korpusu (SYN2000). Valence je zde chápána jako systémová lexikologická vlastnost slov. Valence je abstraktním vztahem, který má konkrétní realizace, v této práci se pro zjednodušení pojem valence používá pro obojí. Pro ú ely analýzy je valence pojímána pom rn voln , protože není vhodné dop edu p edpokládat, že tu jsou všechny její aspekty jasné. P edpokládá se jako platná napravo od substantiva a analýza si všímá jev , které se zde systematicky (z hlediska frekvence výskytu) vyskytují. Práce nabízí korpusem ízený lingvistický popis, který se zam uje na slova v kontextu, ve kterém se obvykle nacházejí a vytvá ejí tak typické slovní vzorce. Základ analýzy tvo í náhodné vzorky 99 náhodn vybraných substantiv ze st edního frekven ního pásma. V p ípadech, kdy vzorky neposkytly dostate né množství dat, byla analýza rozší ena o hledání pomocí specializovaných dotaz do korpusu. U substantiv z vysokých frekven ních pásem p edpokládáme rozt íšt n jší valen ní profily, pro potvrzení této hypotézy bylo n kolik substantiv z vysokých frekven ních pásem podrobeno dodate né stru né analýze.
This thesis aims at providing a lexicological framework for systematic description of valency of Czech nouns. Valency is seen here as a lexicological property of words. Valency is an abstract relation with concrete textual realizations and the term "valency" is used here for both: the abstract notion and the concrete valency exponents and realisations. The analysis is corpus-driven and as such it is based on a rather loose notion of valency, devoid of any pre-conceived ideas, concentrating on typical structural patterns of occurrence on the right side of the noun under investigation. For the analysis the corpus SYN2000, a part of the Czech National Corpus has been used. The analysis is based on random selections of concordance lines of randomly chosen 99 nouns from the middle frequency range. In some cases, where the data proved insufficient, we have carried out additional specialized corpus queries. For high frequency nouns we assume highly differentiated valency profiles; to confirm this hypothesis we have carried out additional brief analysis of several high frequency nouns. The most frequent valency of Czech nouns is genitive complementation, which we find as occurring with more than 90% of the analysed nouns. For some of the nouns, the genitive valency is a very dominant valency pattern (in some cases...
