Evaluace chybové anotace v žákovském korpusu češtiny
Evaluation of Error Mark-Up in a Learner Corpus of Czech
dissertation thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/35289Identifiers
Study Information System: 25046
Collections
- Kvalifikační práce [23774]
Author
Advisor
Referee
Petkevič, Vladimír
Šindelářová, Jaromíra
Faculty / Institute
Faculty of Arts
Discipline
Czech Language
Department
Institute of Czech Language and Theory of Communication
Date of defense
30. 6. 2011
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Pass
Název práce: Evaluace chybové anotace v žákovském korpusu češtiny Autor: Barbora Štindlová Ústav: Ústav českého jazyka a teorie komunikace, Filozofická fakulta, Univerzita Karlova Vedoucí disertační práce: prof. PhDr. Karel Šebesta, CSc. Abstrakt: Předkládaná práce se obecně týká tématu češtiny jako cizího jazyka a částečně zasahuje do oblasti korpusové lingvistiky, neboť se věnuje problematice žákovských korpusů, především pak otázkám jejich chybového značkování a možnostem evaluace anotačních schémat. Ţákovské korpusy se staly významným zdrojem pro poznání žákovského mezijazyka a významným stimulem pro různé oblasti studia a výuky cizího, resp. druhého jazyka. Jsou využívány zejména pro kontrastivní srovnávání jazyka rodilých a nerodilých mluvčích, resp. srovnávání žákovských mezijazyků a pro tzv. počítačem podporovanou chybovou analýzu žákovského jazyka. Pro tento typ analýzy má zcela zásadní důležitost tzv. chybové značkování. Chybové značkování je u každého korpusu, pokud jej používá, založeno na chybové typologii, jejíž vymezení je v mnoha teoretických aspektech problematické. Z toho důvodu je důležitým krokem při výstavbě žákovského korpusu zhodnocení spolehlivosti a validity navrženého anotačního schématu. Disertační práce se zaměřuje především na technické aspekty a specifické problémy při...
Title: Evaluation of Error Mark-Up in a Learner Corpus of Czech Author: Barbora Štindlová Department: Institute of Czech Language and Theory of Communication, Faculty of Arts, Charles University in Prague Supervisor: prof. PhDr. Karel Šebesta, CSc. Abstract: The thesis deals with the topic of Czech as a second language, while introducing methods of corpus linguistics as applied to texts produced by language learners. The context is the process of building and exploiting a learner corpus, with a focus on its error mark-up and options for evaluating the annotation scheme. Learner corpora have become a major resource for investigating a learner interlanguage and a significant incentive for many different types of research and teaching of second/foreign languages. They are used mainly for contrastive studies of native and non-native speakers, i.e. for contrastive interlanguage analysis, and for computer-aided error analysis of the learner language. This kind of analysis is crucially dependent on the type and quality of the error mark-up. In every error-annotated corpus the error annotation is based on an error typology, which is necessarily problematic from a number of theoretical aspects. Evaluation of the reliability and validity of the annotation scheme design is therefore an important step in the build-up...