Rekonstrukce pořadí slov ve větách
Word order reconstruction
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/38441Identifikátory
SIS: 95127
Katalog UK: 990013709930106986
Kolekce
- Kvalifikační práce [11979]
Autor
Vedoucí práce
Oponent práce
Mírovský, Jiří
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
20. 6. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
morfologická analýza, syntaktická analýza, korpusy, pořadí slov ve větěKlíčová slova (anglicky)
morphological analysis, syntactical analysis, corpora, word orderRekonstrukcí původního pořadí slov věty je v této práci myšleno přerovnání slov věty takovým způsobem, aby vznikla gramaticky korektní věta v daném jazyce. Rekonstrukce původního pořadí slov ve větách je velice užitečná část au- tomatického zpracování přirozeného jazyka počítačem, která může nalézt široké uplatnění. Především velice důležitou roli hraje při automatickém překladu přirozeného jazyka, rozpoznávání řeči nebo při konstrukci umělých komunikačních partnerů. Řešení této úlohy je korpusově orientované a při řešení jsou použity dva přístupy: morfologický a syntaktický. Každý přístup využívá výstup externího modulu, který poskytuje požadované morfologické či syntaktické informace. Re- konstrukční procedura je navržena tak, aby byla jazykove nezávislá. Cílovými jazyky jsou čeština a angličtina. 1
A word order reconstruction is a re-arrangement of words to get a gramma- tically correct sentence. It is a very useful task for the applications of natural language processing, machine translation, speech recognition or construction artificial communication partners. We present a corpus-based approach to the task of word order reconstruction. We use two methods: morfological and syntactical method. Both methods use output from the external module. This approach is designed independently on the application where the word order reconstruction can help improve overall performance. Czech and English will be used as the object language. 1
