dc.creator | Doležalová, Drahomíra | |
dc.date.accessioned | 2021-05-19T16:13:11Z | |
dc.date.available | 2021-05-19T16:13:11Z | |
dc.date.issued | 2006 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/3234 | |
dc.description.abstract | We have studied selected stylistic and grammatic problems of Czech (e. g. attraction, degrees of comparison, compound adverbs, conjunction nebo meaning determination, crossing of government, vocalization of prepositions). Theoretical part of our work consists of (mostly original) detailed analyses of all the phenomena studied; these analyses focus on the possibilities of the formal description of the phenonema and their automatic detection. We consider the results connected with an analysis of attraction the most valuable asset of this part. The implementation part of the work contains several rules written in the Language for grammatical Rules - LanGR. They are able to find some problematic constructions in morphologically annotated (in principle condisambiguated) text. We performed tests on the Prague Dependency Tree corpus (PDT) (1 500 000 manually disambiguated words), where we succeeded in finding 59 style mistakes keeping absolute precision. The implementation contains also a Perl script for vocalization of prepositions in Czech. | en_US |
dc.description.abstract | Veěujeme se vybraným problémům na pomezí stylistiky a gramatiky (například atrakce, stupňování, příslovečné spřežky, rozlišení významu spojky nebo, kontaminace, vokalizace předložek). Teoretická část práce obsahuje podrobný rozbor všech zkoumaných jevů, z větší části původní, zejména s ohledem na možnost formálního popisu těchto jevů a na jejich automatickou odhalitelnost. Za nejcennější výsledek této části práce považujeme rozbor atrakcí. Praktická část obsahuje implementaci v jazyce LanGR. Zformulovali a implementovali jsme pravidla, která vyhledávají některé ze zkoumaných jevů v morfologicky označkovaném (obecně nedisambiguovaném) textu. Provedli jsme testování na PDT (1,5 milionu ručně disambiguovaných slov), kde jsme při zachování 100% přesnosti odhalili 59 stylistických chyb. Implementace dále zahrnuje skript pro vokalizaci předložek napsaný v programovacím jazyce Perl. | cs_CZ |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.title | Počítačový modul stylistického korektoru češtiny | cs_CZ |
dc.type | rigorózní práce | cs_CZ |
dcterms.created | 2006 | |
dcterms.dateAccepted | 2006-02-09 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 43919 | |
dc.title.translated | A Style Checker for Czech | en_US |
dc.identifier.aleph | 001445257 | |
thesis.degree.name | RNDr. | |
thesis.degree.level | rigorózní řízení | cs_CZ |
thesis.degree.discipline | Computational and Formal Linguistics | en_US |
thesis.degree.discipline | Počítačová a formální lingvistika | cs_CZ |
thesis.degree.program | Informatics | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | rigorózní práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Počítačová a formální lingvistika | cs_CZ |
uk.degree-discipline.en | Computational and Formal Linguistics | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Informatics | en_US |
thesis.grade.cs | Uznáno | cs_CZ |
thesis.grade.en | Recognized | en_US |
uk.abstract.cs | Veěujeme se vybraným problémům na pomezí stylistiky a gramatiky (například atrakce, stupňování, příslovečné spřežky, rozlišení významu spojky nebo, kontaminace, vokalizace předložek). Teoretická část práce obsahuje podrobný rozbor všech zkoumaných jevů, z větší části původní, zejména s ohledem na možnost formálního popisu těchto jevů a na jejich automatickou odhalitelnost. Za nejcennější výsledek této části práce považujeme rozbor atrakcí. Praktická část obsahuje implementaci v jazyce LanGR. Zformulovali a implementovali jsme pravidla, která vyhledávají některé ze zkoumaných jevů v morfologicky označkovaném (obecně nedisambiguovaném) textu. Provedli jsme testování na PDT (1,5 milionu ručně disambiguovaných slov), kde jsme při zachování 100% přesnosti odhalili 59 stylistických chyb. Implementace dále zahrnuje skript pro vokalizaci předložek napsaný v programovacím jazyce Perl. | cs_CZ |
uk.abstract.en | We have studied selected stylistic and grammatic problems of Czech (e. g. attraction, degrees of comparison, compound adverbs, conjunction nebo meaning determination, crossing of government, vocalization of prepositions). Theoretical part of our work consists of (mostly original) detailed analyses of all the phenomena studied; these analyses focus on the possibilities of the formal description of the phenonema and their automatic detection. We consider the results connected with an analysis of attraction the most valuable asset of this part. The implementation part of the work contains several rules written in the Language for grammatical Rules - LanGR. They are able to find some problematic constructions in morphologically annotated (in principle condisambiguated) text. We performed tests on the Prague Dependency Tree corpus (PDT) (1 500 000 manually disambiguated words), where we succeeded in finding 59 style mistakes keeping absolute precision. The implementation contains also a Perl script for vocalization of prepositions in Czech. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | U | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | U | |
dc.identifier.lisID | 990014452570106986 | |