Možnosti chybové anotace češtiny nerodilých mluvčích
Possibilities of Error Annotation of Non-Native Speakers' Czech
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/54708Collections
- Kvalifikační práce [19389]
Author
Advisor
Referee
Pierścieniak, Piotr Paweł
Faculty / Institute
Faculty of Arts
Discipline
Czech Language and Literature
Department
Institute of Czech Language and Theory of Communication
Date of defense
9. 9. 2013
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
korpus, žákovský korpus, chybová anotace, distanční anotace, vícerovinná anotace, CZESL, FALKO
Keywords (English)
corpora, leaner corpora, error annotation, stand-off markup, multi-level annotation, CZESL, FALKO
Bakalářská práce "Možnosti chybové anotace češtiny nerodilých mluvčích" srovnává anotační systémy vybraných žákovských korpusů z pohledu chybové anotace. Pro srovnání byly zvoleny dva žákovské korpusy - český CZESL a německý FALKO. Oba korpusy používají distanční vícerovinný anotační model. Práce je rozdělena na dvě části: teoretickou a praktickou. V teoretické části jsou podrobně popsány oba vybrané korpusy a jejich anotační modely. Praktická část zpracovává anotaci žákovského textu v prostředí anotačních modelů obou korpusů. Cílem práce je zdůraznit možná pozitiva i negativa vybraných anotačních formátů.
Bachelor thesis "Possibilities of Error Annotation of Non-Native Speakers' Czech" compares annotation systems of selected learners corpora from the perspective of error annotation. For the comparison, two learner corpora were chosen - Czech CZESL and German FALKO. Both corporas use stand-off multi-level annotation model. The paper is divided into two parts: theoretical and practical. In the theoretical part there is an in-depth description of both of selected corporas and their annotation models. The practical part presents annotation of pupil text processed in annotation models of both corporas. The aim of this paper is to highlight possible strengths and weaknesses of selected annotation formats.