Presentation of simultaneous speech translation
Prezentování výstupu simultánního strojového překladu mluvené řeči
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/147964Identifiers
Study Information System: 235440
Collections
- Kvalifikační práce [11325]
Author
Advisor
Referee
Žabokrtský, Zdeněk
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computational Linguistics
Department
Institute of Formal and Applied Linguistics
Date of defense
8. 9. 2021
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
simultánní překlad mluvené řeči|automatické titulkování|uživatelské vyhodnocováníKeywords (English)
simultaneous speech translation|automatic subtitling|user evaluationCieľom diplomovej práce je preskúmať metódy prezentovania výstupov systémov si- multánneho prekladu reči užívateľom. V porovnaní s ručne upravenými titulkami vo fil- moch súčasné prekladové systémy dosahujú nižšiu kvalitu automatického generovania ti- tuliek z dôvodu nárokov na rýchlosť čítania a priestorových obmedzení. Táto práca preto skúma možnosti zmiernenia týchto obmedzení a dosiahnutia zlepšenia celkovej kvality pre- zentácie prekladu reči. Práca sa opiera o existujúce systémy prekladu a rozpoznávania reči a navrhuje metódy iba na užívateľské hodnotenie prezentácie. Poskytuje dôkladnú ana- lýzu výberu najlepšieho rozloženia z radu možností prezentácie a odporúča jeho použitie s ohľadom na dostupné zdroje. Experimentovanie sa vykonáva pomocou nami navrhnutého rozhrania pre titulkovanie a testovanie. Výsledky navyše prinášajú nový pohľad na vzťah medzi metódami hodnotenia, čo vedie k návrhu časovo menej náročného hodnotenia pre špecifické prípady použitia v budúcich experimentoch. 1
The goal of the thesis is to examine methods for presenting the outputs of simul- taneous speech translation systems to users. Compared to manually edited subtitles in movies, current translation systems achieve lower quality in automatic subtitling due to limitations of reading speed and space constraints. Therefore, this thesis examines possibilities of relaxing these constraints, achieving an improvement in overall quality of translated speech presentation. The work relies on existing translation and speech recognition systems, proposing methods solely for user evaluation of the presentation. It provides a thorough analysis of selecting the best layout from a number of presenta- tion options, recommending its usage given available resources. The experimenting is performed given our proposed interface for subtitling and testing. Additionally, the re- sults bring new insights to the relation between the evaluation methods, suggesting less time-consuming evaluation for specific usecases in future experiments. 1