Evaluace chybové anotace v žákovském korpusu češtiny
Evaluation of Error Mark-Up in a Learner Corpus of Czech
dizertační práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/35289Identifikátory
SIS: 25046
Kolekce
- Kvalifikační práce [23201]
Autor
Vedoucí práce
Oponent práce
Petkevič, Vladimír
Šindelářová, Jaromíra
Fakulta / součást
Filozofická fakulta
Obor
Český jazyk
Katedra / ústav / klinika
Ústav českého jazyka a teorie komunikace
Datum obhajoby
30. 6. 2011
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Čeština
Známka
Prospěl/a
Název práce: Evaluace chybové anotace v žákovském korpusu češtiny Autor: Barbora Štindlová Ústav: Ústav českého jazyka a teorie komunikace, Filozofická fakulta, Univerzita Karlova Vedoucí disertační práce: prof. PhDr. Karel Šebesta, CSc. Abstrakt: Předkládaná práce se obecně týká tématu češtiny jako cizího jazyka a částečně zasahuje do oblasti korpusové lingvistiky, neboť se věnuje problematice žákovských korpusů, především pak otázkám jejich chybového značkování a možnostem evaluace anotačních schémat. Ţákovské korpusy se staly významným zdrojem pro poznání žákovského mezijazyka a významným stimulem pro různé oblasti studia a výuky cizího, resp. druhého jazyka. Jsou využívány zejména pro kontrastivní srovnávání jazyka rodilých a nerodilých mluvčích, resp. srovnávání žákovských mezijazyků a pro tzv. počítačem podporovanou chybovou analýzu žákovského jazyka. Pro tento typ analýzy má zcela zásadní důležitost tzv. chybové značkování. Chybové značkování je u každého korpusu, pokud jej používá, založeno na chybové typologii, jejíž vymezení je v mnoha teoretických aspektech problematické. Z toho důvodu je důležitým krokem při výstavbě žákovského korpusu zhodnocení spolehlivosti a validity navrženého anotačního schématu. Disertační práce se zaměřuje především na technické aspekty a specifické problémy při...
Title: Evaluation of Error Mark-Up in a Learner Corpus of Czech Author: Barbora Štindlová Department: Institute of Czech Language and Theory of Communication, Faculty of Arts, Charles University in Prague Supervisor: prof. PhDr. Karel Šebesta, CSc. Abstract: The thesis deals with the topic of Czech as a second language, while introducing methods of corpus linguistics as applied to texts produced by language learners. The context is the process of building and exploiting a learner corpus, with a focus on its error mark-up and options for evaluating the annotation scheme. Learner corpora have become a major resource for investigating a learner interlanguage and a significant incentive for many different types of research and teaching of second/foreign languages. They are used mainly for contrastive studies of native and non-native speakers, i.e. for contrastive interlanguage analysis, and for computer-aided error analysis of the learner language. This kind of analysis is crucially dependent on the type and quality of the error mark-up. In every error-annotated corpus the error annotation is based on an error typology, which is necessarily problematic from a number of theoretical aspects. Evaluation of the reliability and validity of the annotation scheme design is therefore an important step in the build-up...