Show simple item record

A Style Checker for Czech
dc.creatorDoležalová, Drahomíra
dc.date.accessioned2021-05-19T16:13:11Z
dc.date.available2021-05-19T16:13:11Z
dc.date.issued2006
dc.identifier.urihttp://hdl.handle.net/20.500.11956/3234
dc.description.abstractWe have studied selected stylistic and grammatic problems of Czech (e. g. attraction, degrees of comparison, compound adverbs, conjunction nebo meaning determination, crossing of government, vocalization of prepositions). Theoretical part of our work consists of (mostly original) detailed analyses of all the phenomena studied; these analyses focus on the possibilities of the formal description of the phenonema and their automatic detection. We consider the results connected with an analysis of attraction the most valuable asset of this part. The implementation part of the work contains several rules written in the Language for grammatical Rules - LanGR. They are able to find some problematic constructions in morphologically annotated (in principle condisambiguated) text. We performed tests on the Prague Dependency Tree corpus (PDT) (1 500 000 manually disambiguated words), where we succeeded in finding 59 style mistakes keeping absolute precision. The implementation contains also a Perl script for vocalization of prepositions in Czech.en_US
dc.description.abstractVeěujeme se vybraným problémům na pomezí stylistiky a gramatiky (například atrakce, stupňování, příslovečné spřežky, rozlišení významu spojky nebo, kontaminace, vokalizace předložek). Teoretická část práce obsahuje podrobný rozbor všech zkoumaných jevů, z větší části původní, zejména s ohledem na možnost formálního popisu těchto jevů a na jejich automatickou odhalitelnost. Za nejcennější výsledek této části práce považujeme rozbor atrakcí. Praktická část obsahuje implementaci v jazyce LanGR. Zformulovali a implementovali jsme pravidla, která vyhledávají některé ze zkoumaných jevů v morfologicky označkovaném (obecně nedisambiguovaném) textu. Provedli jsme testování na PDT (1,5 milionu ručně disambiguovaných slov), kde jsme při zachování 100% přesnosti odhalili 59 stylistických chyb. Implementace dále zahrnuje skript pro vokalizaci předložek napsaný v programovacím jazyce Perl.cs_CZ
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.titlePočítačový modul stylistického korektoru češtinycs_CZ
dc.typerigorózní prácecs_CZ
dcterms.created2006
dcterms.dateAccepted2006-02-09
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId43919
dc.title.translatedA Style Checker for Czechen_US
dc.identifier.aleph001445257
thesis.degree.nameRNDr.
thesis.degree.levelrigorózní řízenícs_CZ
thesis.degree.disciplineComputational and Formal Linguisticsen_US
thesis.degree.disciplinePočítačová a formální lingvistikacs_CZ
thesis.degree.programInformaticsen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typerigorózní prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csPočítačová a formální lingvistikacs_CZ
uk.degree-discipline.enComputational and Formal Linguisticsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enInformaticsen_US
thesis.grade.csUznánocs_CZ
thesis.grade.enRecognizeden_US
uk.abstract.csVeěujeme se vybraným problémům na pomezí stylistiky a gramatiky (například atrakce, stupňování, příslovečné spřežky, rozlišení významu spojky nebo, kontaminace, vokalizace předložek). Teoretická část práce obsahuje podrobný rozbor všech zkoumaných jevů, z větší části původní, zejména s ohledem na možnost formálního popisu těchto jevů a na jejich automatickou odhalitelnost. Za nejcennější výsledek této části práce považujeme rozbor atrakcí. Praktická část obsahuje implementaci v jazyce LanGR. Zformulovali a implementovali jsme pravidla, která vyhledávají některé ze zkoumaných jevů v morfologicky označkovaném (obecně nedisambiguovaném) textu. Provedli jsme testování na PDT (1,5 milionu ručně disambiguovaných slov), kde jsme při zachování 100% přesnosti odhalili 59 stylistických chyb. Implementace dále zahrnuje skript pro vokalizaci předložek napsaný v programovacím jazyce Perl.cs_CZ
uk.abstract.enWe have studied selected stylistic and grammatic problems of Czech (e. g. attraction, degrees of comparison, compound adverbs, conjunction nebo meaning determination, crossing of government, vocalization of prepositions). Theoretical part of our work consists of (mostly original) detailed analyses of all the phenomena studied; these analyses focus on the possibilities of the formal description of the phenonema and their automatic detection. We consider the results connected with an analysis of attraction the most valuable asset of this part. The implementation part of the work contains several rules written in the Language for grammatical Rules - LanGR. They are able to find some problematic constructions in morphologically annotated (in principle condisambiguated) text. We performed tests on the Prague Dependency Tree corpus (PDT) (1 500 000 manually disambiguated words), where we succeeded in finding 59 style mistakes keeping absolute precision. The implementation contains also a Perl script for vocalization of prepositions in Czech.en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ
thesis.grade.codeU
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusU
dc.identifier.lisID990014452570106986


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV