Variant calling using local reference-helped assemblies
Určování genetických variant z masivně paralelních sekvenačních dat pomocí lokálních reassembly
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/90478Identifikátory
SIS: 174114
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Hoksza, David
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
6. 9. 2017
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
high-throughput sequencing, variant calling, local assembly, De Bruijn grafyKlíčová slova (anglicky)
high-throughput sequencing, variant calling, local assembly, De Bruijn graphsI přes aktivní vývoj v posledních letech čtení genomu organismů stále patří mez- i těžké problémy. S dostupnými technologiemi nejsme schopni přečíst zadaný genom jako celek. Obvyklý postup spočívá v jeho rozbití na velké množství malých částí, které dokážeme jednotlivě přečíst. Následuje bolestivý proces je- jich opětovného skládání do podoby výsledného genomu. Tato práce prezentuje algoritmus pro skládání genomu založený na principu de Bruijnových grafů a porovnává jeho výsledky s již existujícími řešeními. Algorit- mus se zaměřuje na krátké úseky genomu a využívá znalosti referenční sekvence. 1
Despite active development during past years, the task of sequencing a genome still remains a challenge. Our current technologies are not able to read the whole genome in one piece. Instead, we shatter the target genome into a large amounts of small pieces that are then sequenced separately. The process of assembling these small pieces together, in order to obtain sequence of the whole genome, is painful and rsource-consuming. Multiple algorithms to solve the assembly problem were developed. This thesis presents yet another assembly algorithm, based on the usage of de Bruijn graphs, and focusing on sequencing short genome regions. The algorithm is compared to well-known solutions in the field. 1
