Aplikace pro ruční word alignment
Application for manual word alignment
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/13015Identifiers
Study Information System: 45230
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Raab, Jan
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Administration of computer systems
Department
Institute of Formal and Applied Linguistics
Date of defense
11. 9. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Cílem této práce bylo navrhnou a implementovat na platformě nezávislé, rychlé, flexibilní a přívětivé uživatelské rozhraní pro ruční párovaní (alignment)dvoujazyčných textů. Nové rozhraní nemá nedostatky existujících nástrojů na párování a proces ručního párování zefektivňuje. Jde např. o poloautomatické párování jednoduchých vět, skupinové operace s párováním, párování frází, možnost posunu jedné z párovaných vět podél řádku vůči druhé větě pro zlepšení přehlednosti, mají-li párované věty různou délku, přehledné zobrazování předchozího a navazujícího kontextu párovaných vět v obou jazycích a v neposlední řadě i statistika postupu párování. Vedle obvyklého řádkového pohledu - zobrazení párovaných textů ve dvou řádcích nad sebou, kdy se páruje propojením odpovídajících si slov čarou, byl realizován i pohled maticový - kdy slova věty v jednom jazyce odpovídají popisu řádků matice, slova v druhém jazyce odpovídají popisu sloupců matice a páruje se zvýrazněním průsečíku sloupce a řádku, které mají odpovídající si popisy. Mezi oběma pohledy lze během práce libovolně přepínat.
The aim of this work was to design and implement platform-independent fast, flexible and user friendly interface for manual word alignment of bilingual texts. The new interface does not have the imperfections of existing similar tools and improves the performance of manual alignment process. It provides eg. half automatic alignment of simple texts, group operations with alignments, alignment of phrases, enables to shift one sentences along the line to improve the transparency of the alignment process in case that the length of aligned sentences differs substantially. The preceding and succeeding context of currently aligned sentences is shown in both the languages. Last but not least the tool provides the alignment performance statistics. Along with usual "row view", where the two sentences are shown in parallel in two rows, one above the other, being aligned by connections of corresponding words, there were introduced also a "matrix view", where the words in one language stand in for matrix line descriptors, the words in other language stand in for column descriptors and the alignment of two corresponding words is expressed by highlighting of the point of intersection of row and column with corresponding descriptors. It is possible to switch between the both views anytime during the alignment process.