dc.contributor.advisor | Vidová Hladká, Barbora | |
dc.creator | Konárová, Marie | |
dc.date.accessioned | 2017-05-07T22:26:39Z | |
dc.date.available | 2017-05-07T22:26:39Z | |
dc.date.issued | 2012 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/46673 | |
dc.description.abstract | Cílem práce je prozkoumat možnosti využití dat ze školních větných roz- borů pro značkování slov v jazykových korpusech. Za účelem ověření této hy- potézy byla vybrána množina vět, které byly předloženy žákům základních a středních škol k větnému rozboru. Sběr dat probíhal s využitím funkčního prototypu editoru větných rozborů Čapek. Editor je stále vyvíjen, mimo jiné i na základě zpětné vazby získané při jeho používání žáky i učiteli. Na základě nasbíraných dat byla odvozena transformační pravidla pro konverzi údajů ze školních větných rozborů do datových struktur využívaných Pražským závis- lostním korpusem. Byla testována jak úspěšnost konverze pomocí navržených pravidel, tak přesnost žáků při provádění větných rozborů. 1 | cs_CZ |
dc.description.abstract | The aim of this thesis is to explore the possibilities of using data from the school sentence analyses for tagging words in the language corpora. For testing of this hypothesis, a set of sentences has been selected from a common czech language textbook. Students of selected primary and secondary schools were asked to perform the syntactical analysis of these sentences. The data collection was carried out using a prototype sentence analysis editor Capek. The editor is still being developed, also based on feedback gained from the students and teachers who used it during the data collecting process. Several transformation rules for converting data from the school sentence analyses into the data structures used within the Prague Dependency corpus were developed. The accuracy of the conversion using the proposed rules was tested together with the accuracy of students' results. | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | větný rozbor | cs_CZ |
dc.subject | syntaktická analýza | cs_CZ |
dc.subject | závislostní korpusy | cs_CZ |
dc.subject | a school analysis | en_US |
dc.subject | syntactical analysis | en_US |
dc.subject | treebanks | en_US |
dc.title | Školní větné rozbory jako možný zdroj závislostních korpusů (?) | cs_CZ |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2012 | |
dcterms.dateAccepted | 2012-01-30 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 95674 | |
dc.title.translated | A school analysis as a possible source of treebanks (?) | en_US |
dc.contributor.referee | Zeman, Daniel | |
dc.identifier.aleph | 001428390 | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Computational Linguistics | en_US |
thesis.degree.discipline | Matematická lingvistika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Matematická lingvistika | cs_CZ |
uk.degree-discipline.en | Computational Linguistics | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Dobře | cs_CZ |
thesis.grade.en | Good | en_US |
uk.abstract.cs | Cílem práce je prozkoumat možnosti využití dat ze školních větných roz- borů pro značkování slov v jazykových korpusech. Za účelem ověření této hy- potézy byla vybrána množina vět, které byly předloženy žákům základních a středních škol k větnému rozboru. Sběr dat probíhal s využitím funkčního prototypu editoru větných rozborů Čapek. Editor je stále vyvíjen, mimo jiné i na základě zpětné vazby získané při jeho používání žáky i učiteli. Na základě nasbíraných dat byla odvozena transformační pravidla pro konverzi údajů ze školních větných rozborů do datových struktur využívaných Pražským závis- lostním korpusem. Byla testována jak úspěšnost konverze pomocí navržených pravidel, tak přesnost žáků při provádění větných rozborů. 1 | cs_CZ |
uk.abstract.en | The aim of this thesis is to explore the possibilities of using data from the school sentence analyses for tagging words in the language corpora. For testing of this hypothesis, a set of sentences has been selected from a common czech language textbook. Students of selected primary and secondary schools were asked to perform the syntactical analysis of these sentences. The data collection was carried out using a prototype sentence analysis editor Capek. The editor is still being developed, also based on feedback gained from the students and teachers who used it during the data collecting process. Several transformation rules for converting data from the school sentence analyses into the data structures used within the Prague Dependency corpus were developed. The accuracy of the conversion using the proposed rules was tested together with the accuracy of students' results. | en_US |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
dc.identifier.lisID | 990014283900106986 | |