Using tree edit distance to model structural similarity of RNA molecules
Aplikace stromové editační vzdálenosti pro modelování strukturní podobnosti RNA molekul
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/85666Identifikátory
SIS: 179123
Kolekce
- Kvalifikační práce [11217]
Autor
Vedoucí práce
Oponent práce
Škoda, Petr
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
7. 6. 2017
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
bioinformatika, struktura RNA, similarityKlíčová slova (anglicky)
bioinformatics, RNA structure, similarityVýzkum v oblasti ribonukleových kyselin (RNA) získává na popularitě s postupujícím rozšiřováním našich znalostí o jejich funkcích. Nicméně, abychom mohli správně prozkoumávat nové struktury, potřebujeme robustní výpočetní nástroje odhalující různé vlastnosti. Jeden z takových nástrojů je strukturní superpozice, metoda sloužící k zarovnání dvou struktur a ohodnocení jejich podobnosti. Superpozice struktur se dá použít na terciální RNA struktury pro vizuální porovnání, shlukování či určení jejich funkcí. Cílem této práce je prezentovat nový přístup k získávání superpozice RNA struktur za použití sekundárních RNA struktur a jejich vazeb na stromy. Algoritmy pro stromovou editační vzdálenost jsou použity a je ukázán souhrn metod pro generování superpozice z vypočítaných stromových podobností. Tato metoda je zarovnána do kontextu existujících prací a její přesnost je porovnána s nejlepšími aktuálními metodami pro strukturní superpozici. Implementace je přístupná na https://github.com/gyfis/rawted.
Research about ribonucleic acid (RNA) is gaining popularity as we widen our knowledge about its function. But to properly examine new structures, we need robust computational tools to analyse different properties. One of such tools is structural superposition, which is a method to align two structures over each other and quantify their similarity. This tool can be used on tertiary RNA structures for visual comparison, clustering or the assessment of their function. The aim of this thesis is to present a novel approach for achieving RNA superposition using information about secondary RNA structure and its link to trees. Tree edit distance algorithms are used to compare the trees, and a multitude of methods for generating the structural superposition from the calculated tree similarities is presented. The new method is aligned in the context of existing works, and its accuracy is compared to the best current approaches for structural superposition. The implementation can be accessed at https://github.com/gyfis/rawted.