dc.contributor.advisor | Pecina, Pavel | |
dc.creator | Burešová, Karolína | |
dc.date.accessioned | 2017-06-28T10:01:53Z | |
dc.date.available | 2017-06-28T10:01:53Z | |
dc.date.issued | 2017 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/85646 | |
dc.description.abstract | Práce se zabývá zjednodušováním textu v češtině, zejména lexikálním zjednodušováním, tedy na- hrazováním složitých slov za jednodušší. V práci je implementováno a vyhodnoceno několik různých způsobů určování složitých slov, generování náhrad a hodnocení náhrad. Generování náhrad je testováno jak za pomoci slovníků, tak za pomoci slovních embeddingů. Práce dále představuje několik pokusů s lidmi. Tyto pokusy mají za cíl pomoci získat náhled do problematiky vnímané složitosti a faktorů, které ji ovlivňují. Provedené a vyhodnocené experimenty zahrnují porovnávání dvojic vět a ruční zjednodu- šování textu. V práci je uvedeno jak vyhodnocení jednotlivých způsobů řešení problému, tak výstupy provedených experimentů s lidmi; a jsou doporučeny i navazující směry práce. 1 | cs_CZ |
dc.description.abstract | This thesis deals with text simplification in Czech, in particular with lexical simplification. Several strategies of complex word identification, substitution generation and substitution ranking are implemented and evaluated. Substitution generation is attempted both in a dictionary-based manner and in an embedding- based manner. Some experiments involving people are also presented, the experiments aim at gaining an in- sight into perceived simplicity/complexity and its factors. The experiments conducted and evaluated include sentence pair comparison and manual text simplification. Both the evaluation results of various strategies and the outcomes of experiments involving humans are described and some future work is suggested. 1 | en_US |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | zjednodušování textu | cs_CZ |
dc.subject | lexikální zjednodušování | cs_CZ |
dc.subject | čtivost | cs_CZ |
dc.subject | srozumitelnost | cs_CZ |
dc.subject | text simplification | en_US |
dc.subject | lexical simplification | en_US |
dc.subject | readability | en_US |
dc.subject | understandability | en_US |
dc.title | Text simplification in Czech | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2017 | |
dcterms.dateAccepted | 2017-06-07 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 187012 | |
dc.title.translated | Zjednodušování textu v češtině | cs_CZ |
dc.contributor.referee | Bejček, Eduard | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Matematická lingvistika | cs_CZ |
thesis.degree.discipline | Computational Linguistics | en_US |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Matematická lingvistika | cs_CZ |
uk.degree-discipline.en | Computational Linguistics | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Práce se zabývá zjednodušováním textu v češtině, zejména lexikálním zjednodušováním, tedy na- hrazováním složitých slov za jednodušší. V práci je implementováno a vyhodnoceno několik různých způsobů určování složitých slov, generování náhrad a hodnocení náhrad. Generování náhrad je testováno jak za pomoci slovníků, tak za pomoci slovních embeddingů. Práce dále představuje několik pokusů s lidmi. Tyto pokusy mají za cíl pomoci získat náhled do problematiky vnímané složitosti a faktorů, které ji ovlivňují. Provedené a vyhodnocené experimenty zahrnují porovnávání dvojic vět a ruční zjednodu- šování textu. V práci je uvedeno jak vyhodnocení jednotlivých způsobů řešení problému, tak výstupy provedených experimentů s lidmi; a jsou doporučeny i navazující směry práce. 1 | cs_CZ |
uk.abstract.en | This thesis deals with text simplification in Czech, in particular with lexical simplification. Several strategies of complex word identification, substitution generation and substitution ranking are implemented and evaluated. Substitution generation is attempted both in a dictionary-based manner and in an embedding- based manner. Some experiments involving people are also presented, the experiments aim at gaining an in- sight into perceived simplicity/complexity and its factors. The experiments conducted and evaluated include sentence pair comparison and manual text simplification. Both the evaluation results of various strategies and the outcomes of experiments involving humans are described and some future work is suggested. 1 | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |