Hledání odpovědi v odpovědích
Finding the answer in the answers
Hledání odpovědi v odpovědích
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/37199Identifikátory
SIS: 79459
Kolekce
- Kvalifikační práce [11242]
Autor
Vedoucí práce
Oponent práce
Bojar, Ondřej
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
20. 6. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Slovenština
Známka
Výborně
Klíčová slova (česky)
dialógový systém, tf x idf váhy, frekvenčná analýza, morfologická analýza, syntaktická analýza, tool_chain, Václav Havel, korpusKlíčová slova (anglicky)
dialogue system, tf x idf weights, frequency analysis, morphological analysis, syntactical analysis, tool_chain, Václav Havel, corpusNázov práce : Hľadanie odpovedí v odpovediach Autor : Jakub Záhumenský Kontakt : zahumensky.jakub@gmail.com Katedra : Ústav formalní a aplikované lingvistiky Vedúca práce : Mgr. Barbora Vidová Hladká, Ph.D. Kontakt : hladka@ufal.mff.cuni.cz Abstrakt : Témou tejto práce je navrhnúť a implementovať dialógový systém, ktorý bude simulovať rozhovor uživateľa s reálnou osobnosťou. Využívať budeme korpus reálnych rozhovorov zozbieraných z webových stránok. V implementácii budeme používať prístup vyhľadávania najpodobnejšej otázky v korpuse s otázkou uživateľa. Odpoveďou na uživateľovu otázku bude následne odpoveď na nájdenú najpodobnejšiu otázku z korpusu. V práci budeme využívať morfologickú a syntaktickú rovinu jazyka, rovnako ako frekvenčnú analýzu pomocou tf-idf váh, na určenie najpodobnejšej otázky. Otázky budú zozbierané v korpuse, ktorého vytvorenie je súčasťou tejto práce. Konkrétne v tejto práci budeme zbierať rozhovory s významnou českou osobnosťou, Václavom Havlom. Aplikácia bude pracovať s textami v českom jazyku.
Title : Searching for the answer in answers Author : Jakub Záhumenský Contact : zahumensky.jakub@gmail.com Department : Institute of Formal and Applied Linguistics Supervisor : Mgr. Barbora Vidová Hladká, Ph.D. Contact on supervisor : hladka@ufal.mff.cuni.cz Abstract : We design a question-answering system Interviewer that enables users to fictionally (virtually) interview this person by asking questions as similar as possible to questions that journalists have already asked. The interviews with a given person posted on the web are being collected as a corpus of (question, answer) pairs. The user asks his/her question and the Interviewer system searches questions in the corpus to provide the answer that belongs to the most similar question. Matching questions is based on the frequency analysis and on the applications coming from natural language processing, namely tagging and parsing. We work with the interviews with Vaclav Havel posted on his personal page.