NA2Dsearch: a fast and easy tool for secondary structure searches through databases of nucleic acids in parallel
NA2Dsearch: rychlý a snadný nástroj pro vyhledávání sekundárních struktur v databázích nukleových kyselin v paralelním režimu
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/31408Identifiers
Study Information System: 50957
Collections
- Kvalifikační práce [20130]
Author
Advisor
Referee
Novotný, Marian
Faculty / Institute
Faculty of Science
Discipline
Genetics, Molecular Biology and Virology
Department
Department of Genetics and Microbiology
Date of defense
20. 9. 2010
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
program sekundární struktury nukleových kyselinKeywords (English)
program secondary structure nucleic acidDiplomová práce se zabývá prohledáváním sekundárních struktur nukleových kyselin. Byla vytvořena aplikace NA2Dsearch, která umožňuje vyhledávat strukturní motiv v databázích sekundárních struktur. Aplikace nabízí uživatelsky přívětivé grafické rozhraní pomocí kterého je možné pohodlné vytváření dotazu (hledaného motivu) za použití přetahování vizuálních komponent myší. Struktury nalezených výsledků i struktury z databází je možné procházet a vizualizovat. Pro aplikaci byly vytvořeny původní algoritmy na interaktivní vizualizování struktur a na prohledávání struktur. Vyhledávací algoritmus umí vyhledávat strukturní motiv v databázích struktur (na rozdíl od existujících programů, které vyhledávají strukturní motiv v databázích sekvencí). Vyhledávání motivu funguje tak, že uživatel vytvoří dotaz který popisuje strukturu motivu a definuje variability (např. délku smyčky vlásenky) které budou akceptovány. Výsledky hledání jsou seřazeny podle skóre jež vyjadřuje podobnost nalezené struktury a dotazu. NA2Dsearch také umožňuje prohledávání sekvencí, za použití externích programů pro predikci struktur. Vyhledávání bylo demonstrováno na několika experimentech se strukturami HCV IRES a tRNA. Byly provedeny tři vyhledávání struktury HCV IRES: vyhledávání struktury HCV IRES v databázi obsahující více než tisících...
The diploma thesis is dealing with searching in secondary structures of nucleic acids. The NA2Dsearch application was developed that allows to search databases of secondary structures for a structural motif. The application offers user-friendly graphical user interface where a query motif can be constructed in comfortable visual way using drag&drop, database and result structures can be browsed and visualized. The application contains original interactive nucleic acid structure visualization algorithm and novel search algorithm. The search algorithm can perform a motif search on structural data (unlike existing programs that can perform a motif search on sequence data). The motif search means that a query is created that describes the structure of motif of our interest with variabilities (e.g. the length of hairpin loop) that can be tolerated. Search results are ordered by the score computed according to the resemblance of hit and the query. The NA2Dsearch also supports searching in sequence data which are folded by external folding program. Searching capabilities are demonstrated on several search experiments involving HCV IRES and tRNA. Three searches for HCV IRES were performed: a search for HCV IRES structure in database of more than thousand of HCV genomic sequences, a folding analysis of HCV IRES...