Tvorba a hodnocení kvality genomových assembly
Construction and quality assessment of the genome assemblies
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/119458Identifiers
Study Information System: 219207
Collections
- Kvalifikační práce [20134]
Author
Advisor
Referee
Vorel, Jiří
Faculty / Institute
Faculty of Science
Discipline
Bioinformatics
Department
Department of Cell Biology
Date of defense
8. 7. 2020
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
genomika, genomové assembly, bioinformatika, masivně paralelní sekvenování, kvalita assembly, algoritmusKeywords (English)
genomics, genome assembly, bioinformatics, High throughput sequencing, quality assembly, algorithmDetailní znalost genetické informace studovaného organismu je stěžejní pro mnohá odvětví moderního výzkumu. Současné sekvenační technologie neumožňují přečíst celou molekulu DNA vcelku, proto jsou získávány pouze úseky genomové sekvence, které samotné nejsou dostatečně informativní. Cílem genomicko-bioinformatického přístupu je složit tyto úseky do původní genomové sekvence - genomové assembly. Jedná se o náročný proces, ke kterému je potřeba výkonná počítačová infrastruktura, specializované softwary a expertní personál. Existuje celá řada softwarů (assemblerů), jejichž cílem je zrekonstruovat původní genetickou informaci daného organismu, které se liší ve velikosti skládaného genomu a druhu organismu. Výsledná kvalita genomové assembly je závislá na typu assembleru a nastavení jeho parametrů. Je tedy vhodné vytvořit několik assembly a jejich kvalitu následně vyhodnotit na základě technických a biologických metrik. Tato práce popisuje základní metody masivně paralelního sekvenování, dále se zabývá algoritmy skládání genomových assembly a popisuje metriky, pomocí kterých se vyhodnocuje kvalita výsledných genomových assembly. Praktická část je zaměřena na tvorbu assembly ptačí motolice Trichobilharzia szidati pomocí dvou programů a následné zhodnocení kvality obou assembly.
Detailed information of the genome of the studied organism is crucial for many fields of modern research. Actual sequencing technologies are not able to read the whole DNA molecule at once therefore only fragments of the genetic information are obtained, which are not sufficiently informative on their own. The goal of the genomic-bioinformatic approach is to assemble these fragments into complete original information - genome assembly. The process of the genome assembly is demanding in terms of computational power, software equipment and expert staff. Many assemblers - programs for genome assembly are available differing in performance, size of the analyzed genome or target organism. The quality of final assembly is fully dependent on assembler and setting of inner parameters. In practice, multiple assemblies are constructed and their quality evaluated according to the technical and biological parameters. The presented thesis describes current high throughput sequencing technologies, different approaches and algorithms for genome assembly and methodology for their quality assessment. The practical part is focused on assembly and its quality assessment using Illumina data of the bird fluke Trichobilharzia szidati.
Citace dokumentu
Metadata
Show full item recordRelated items
Showing items related by title, author, creator and subject.
-
Podgorická skupština 1918, její příčiny a následky
Defence status: DEFENDEDZajíc, Petr (Univerzita Karlova, Právnická fakulta, 2013)Date of defense: 25. 3. 20131 Abstrakt Podgorická skupština 1918, její příčiny a následky Tato disertační práce věnující se problematice Podgorické skupštiny 1918, jejím příčinám a následkům, je přirozeným pokračováním mé práce rigorózní s názvem ... -
Současné přístupy celogenomového sekvenování a de novo sestavení genomu
Defence status: DEFENDEDHalenková, Zuzana (Univerzita Karlova, Přírodovědecká fakulta, 2018)Date of defense: 12. 6. 2018Během uplynulých deseti let klesla díky vývoji sekvenátorů druhé a třetí generace cena sekvenování téměř desettisíckrát. Osekvenování a sestavení celogenomové sekvence organismu je tak čím dál tím dostupnějším nástrojem a ... -
Analysis of single-cell genomic data of Saccinobaculus sp.
Defence status: DEFENDEDGajdošová, Petra (Univerzita Karlova, Přírodovědecká fakulta, 2023)Date of defense: 7. 2. 2023Pokrok v metodách jednobuněčné genomiky a metagenomiky nám umožňuje prozk- oumat nekultivovatelné organizmy mnohem podrobněji. V této práci se zaměřujeme na sestavení genomu a genetický kód druhu Saccinobaculus ambloaxostylus ...