Variant calling using local reference-helped assemblies
Určování genetických variant z masivně paralelních sekvenačních dat pomocí lokálních reassembly
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/90478Identifiers
Study Information System: 174114
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Hoksza, David
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
6. 9. 2017
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
high-throughput sequencing, variant calling, local assembly, De Bruijn grafyKeywords (English)
high-throughput sequencing, variant calling, local assembly, De Bruijn graphsI přes aktivní vývoj v posledních letech čtení genomu organismů stále patří mez- i těžké problémy. S dostupnými technologiemi nejsme schopni přečíst zadaný genom jako celek. Obvyklý postup spočívá v jeho rozbití na velké množství malých částí, které dokážeme jednotlivě přečíst. Následuje bolestivý proces je- jich opětovného skládání do podoby výsledného genomu. Tato práce prezentuje algoritmus pro skládání genomu založený na principu de Bruijnových grafů a porovnává jeho výsledky s již existujícími řešeními. Algorit- mus se zaměřuje na krátké úseky genomu a využívá znalosti referenční sekvence. 1
Despite active development during past years, the task of sequencing a genome still remains a challenge. Our current technologies are not able to read the whole genome in one piece. Instead, we shatter the target genome into a large amounts of small pieces that are then sequenced separately. The process of assembling these small pieces together, in order to obtain sequence of the whole genome, is painful and rsource-consuming. Multiple algorithms to solve the assembly problem were developed. This thesis presents yet another assembly algorithm, based on the usage of de Bruijn graphs, and focusing on sequencing short genome regions. The algorithm is compared to well-known solutions in the field. 1