Using tree edit distance to model structural similarity of RNA molecules
Aplikace stromové editační vzdálenosti pro modelování strukturní podobnosti RNA molekul
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/85666Identifiers
Study Information System: 179123
Collections
- Kvalifikační práce [11325]
Author
Advisor
Referee
Škoda, Petr
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Artificial Intelligence
Department
Department of Software Engineering
Date of defense
7. 6. 2017
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
bioinformatika, struktura RNA, similarityKeywords (English)
bioinformatics, RNA structure, similarityVýzkum v oblasti ribonukleových kyselin (RNA) získává na popularitě s postupujícím rozšiřováním našich znalostí o jejich funkcích. Nicméně, abychom mohli správně prozkoumávat nové struktury, potřebujeme robustní výpočetní nástroje odhalující různé vlastnosti. Jeden z takových nástrojů je strukturní superpozice, metoda sloužící k zarovnání dvou struktur a ohodnocení jejich podobnosti. Superpozice struktur se dá použít na terciální RNA struktury pro vizuální porovnání, shlukování či určení jejich funkcí. Cílem této práce je prezentovat nový přístup k získávání superpozice RNA struktur za použití sekundárních RNA struktur a jejich vazeb na stromy. Algoritmy pro stromovou editační vzdálenost jsou použity a je ukázán souhrn metod pro generování superpozice z vypočítaných stromových podobností. Tato metoda je zarovnána do kontextu existujících prací a její přesnost je porovnána s nejlepšími aktuálními metodami pro strukturní superpozici. Implementace je přístupná na https://github.com/gyfis/rawted.
Research about ribonucleic acid (RNA) is gaining popularity as we widen our knowledge about its function. But to properly examine new structures, we need robust computational tools to analyse different properties. One of such tools is structural superposition, which is a method to align two structures over each other and quantify their similarity. This tool can be used on tertiary RNA structures for visual comparison, clustering or the assessment of their function. The aim of this thesis is to present a novel approach for achieving RNA superposition using information about secondary RNA structure and its link to trees. Tree edit distance algorithms are used to compare the trees, and a multitude of methods for generating the structural superposition from the calculated tree similarities is presented. The new method is aligned in the context of existing works, and its accuracy is compared to the best current approaches for structural superposition. The implementation can be accessed at https://github.com/gyfis/rawted.