Identifikace a analýza českých ekvivalentů německých kompozit
dc.contributor.advisorŠevčíková, Magda
dc.creatorNeumannová, Kristýna
dc.description.abstractTato bakalářská práce se zabývá automatickou identifikací českých ekvivalentů německých substantivních kompozit. Skládání slov je doloženo v obou jazycích, ačkoliv v němčině je více produktivní než v češtině, kde převládá odvozování. V první části práce jsme se věnovali identifikaci českých protějšků německých kom- pozit za pomoci paralelních korpusů a nástrojů na statistický strojový překlad založený na frázích. Poté jsme rozdělili české protějšky na jednoslovné, dvouslovné a víceslovné. České ekvivalenty byly analyzovány podle jejich slovnědruhového zařazení. Více než polovina německých substantivních kompozit odpovídá sekvenci dvou nebo více slov v češtině, většina sekvencí je tvořena přídavným a podstatným jménem. U jednoslovných ekviva- lentů byla zkoumána jejich morfologická struktura a byla mezi nimi rozlišena kompozita a odvozená slova, kde druhá část německého kompozita odpovídá příponě v českém pro- tějšku. 1cs_CZ
dc.description.abstractThis bachelor thesis deals with automatic identification of Czech equivalents of Ger- man nominal compounds and their linguistic analysis. Compounding is a word formation process which is exploited in both languages, however, in German it is much more pro- ductive than in Czech, where the derivation word formation process predominates. The first part of the thesis copes with identification of Czech counterparts of Ger- man compounds with the help of parallel corpora and tools for phrase-based statistical machine translation. After the identification, one-word, two-word and multi-word Czech equivalents were distinguished. The Czech equivalents were analysed according to their part-of-speech tags. Over a half of the German nominal compounds correspond to a se- quence of two or more words in Czech, most of the sequences are made up of an adjective and a noun. Morphological structure of one-word equivalents was studied and these equivalents were distinguished into compounds and derivatives, in which the second part of the German compound corresponds to a suffix in the Czech counterpart. 1en_US
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectslovotvorba|skládání slov|odvozování|morfologie|syntax|zpracování přirozeného jazyka|paralelní korpus|zarovnánícs_CZ
dc.subjectword formation|composition|derivation|morphology|syntax|natural language processing|parallel corpus|alignmenten_US
dc.titleIdentification and analysis of Czech equivalents of German compoundsen_US
dc.typebakalářská prácecs_CZ
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.title.translatedIdentifikace a analýza českých ekvivalentů německých kompozitcs_CZ
dc.contributor.refereeZeman, Daniel
thesis.degree.disciplineGeneral Computer Scienceen_US
thesis.degree.disciplineObecná informatikacs_CZ
thesis.degree.programComputer Scienceen_US
uk.thesis.typebakalářská prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.degree-discipline.csObecná informatikacs_CZ
uk.degree-discipline.enGeneral Computer Scienceen_US
uk.degree-program.enComputer Scienceen_US
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ
dc.contributor.consultantŽabokrtský, Zdeněk

