dc.contributor.advisor | Leontovyč, Roman | |
dc.creator | Korená, Lucie | |
dc.date.accessioned | 2020-07-29T09:46:33Z | |
dc.date.available | 2020-07-29T09:46:33Z | |
dc.date.issued | 2020 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/119458 | |
dc.description.abstract | Detailed information of the genome of the studied organism is crucial for many fields of modern research. Actual sequencing technologies are not able to read the whole DNA molecule at once therefore only fragments of the genetic information are obtained, which are not sufficiently informative on their own. The goal of the genomic-bioinformatic approach is to assemble these fragments into complete original information - genome assembly. The process of the genome assembly is demanding in terms of computational power, software equipment and expert staff. Many assemblers - programs for genome assembly are available differing in performance, size of the analyzed genome or target organism. The quality of final assembly is fully dependent on assembler and setting of inner parameters. In practice, multiple assemblies are constructed and their quality evaluated according to the technical and biological parameters. The presented thesis describes current high throughput sequencing technologies, different approaches and algorithms for genome assembly and methodology for their quality assessment. The practical part is focused on assembly and its quality assessment using Illumina data of the bird fluke Trichobilharzia szidati. | en_US |
dc.description.abstract | Detailní znalost genetické informace studovaného organismu je stěžejní pro mnohá odvětví moderního výzkumu. Současné sekvenační technologie neumožňují přečíst celou molekulu DNA vcelku, proto jsou získávány pouze úseky genomové sekvence, které samotné nejsou dostatečně informativní. Cílem genomicko-bioinformatického přístupu je složit tyto úseky do původní genomové sekvence - genomové assembly. Jedná se o náročný proces, ke kterému je potřeba výkonná počítačová infrastruktura, specializované softwary a expertní personál. Existuje celá řada softwarů (assemblerů), jejichž cílem je zrekonstruovat původní genetickou informaci daného organismu, které se liší ve velikosti skládaného genomu a druhu organismu. Výsledná kvalita genomové assembly je závislá na typu assembleru a nastavení jeho parametrů. Je tedy vhodné vytvořit několik assembly a jejich kvalitu následně vyhodnotit na základě technických a biologických metrik. Tato práce popisuje základní metody masivně paralelního sekvenování, dále se zabývá algoritmy skládání genomových assembly a popisuje metriky, pomocí kterých se vyhodnocuje kvalita výsledných genomových assembly. Praktická část je zaměřena na tvorbu assembly ptačí motolice Trichobilharzia szidati pomocí dvou programů a následné zhodnocení kvality obou assembly. | cs_CZ |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Přírodovědecká fakulta | cs_CZ |
dc.subject | genomics | en_US |
dc.subject | genome assembly | en_US |
dc.subject | bioinformatics | en_US |
dc.subject | High throughput sequencing | en_US |
dc.subject | quality assembly | en_US |
dc.subject | algorithm | en_US |
dc.subject | genomika | cs_CZ |
dc.subject | genomové assembly | cs_CZ |
dc.subject | bioinformatika | cs_CZ |
dc.subject | masivně paralelní sekvenování | cs_CZ |
dc.subject | kvalita assembly | cs_CZ |
dc.subject | algoritmus | cs_CZ |
dc.title | Tvorba a hodnocení kvality genomových assembly | cs_CZ |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2020 | |
dcterms.dateAccepted | 2020-07-08 | |
dc.description.department | Department of Cell Biology | en_US |
dc.description.department | Katedra buněčné biologie | cs_CZ |
dc.description.faculty | Přírodovědecká fakulta | cs_CZ |
dc.description.faculty | Faculty of Science | en_US |
dc.identifier.repId | 219207 | |
dc.title.translated | Construction and quality assessment of the genome assemblies | en_US |
dc.contributor.referee | Vorel, Jiří | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Bioinformatika | cs_CZ |
thesis.degree.discipline | Bioinformatics | en_US |
thesis.degree.program | Bioinformatics | en_US |
thesis.degree.program | Bioinformatika | cs_CZ |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Přírodovědecká fakulta::Katedra buněčné biologie | cs_CZ |
uk.taxonomy.organization-en | Faculty of Science::Department of Cell Biology | en_US |
uk.faculty-name.cs | Přírodovědecká fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Science | en_US |
uk.faculty-abbr.cs | PřF | cs_CZ |
uk.degree-discipline.cs | Bioinformatika | cs_CZ |
uk.degree-discipline.en | Bioinformatics | en_US |
uk.degree-program.cs | Bioinformatika | cs_CZ |
uk.degree-program.en | Bioinformatics | en_US |
thesis.grade.cs | Velmi dobře | cs_CZ |
thesis.grade.en | Very good | en_US |
uk.abstract.cs | Detailní znalost genetické informace studovaného organismu je stěžejní pro mnohá odvětví moderního výzkumu. Současné sekvenační technologie neumožňují přečíst celou molekulu DNA vcelku, proto jsou získávány pouze úseky genomové sekvence, které samotné nejsou dostatečně informativní. Cílem genomicko-bioinformatického přístupu je složit tyto úseky do původní genomové sekvence - genomové assembly. Jedná se o náročný proces, ke kterému je potřeba výkonná počítačová infrastruktura, specializované softwary a expertní personál. Existuje celá řada softwarů (assemblerů), jejichž cílem je zrekonstruovat původní genetickou informaci daného organismu, které se liší ve velikosti skládaného genomu a druhu organismu. Výsledná kvalita genomové assembly je závislá na typu assembleru a nastavení jeho parametrů. Je tedy vhodné vytvořit několik assembly a jejich kvalitu následně vyhodnotit na základě technických a biologických metrik. Tato práce popisuje základní metody masivně paralelního sekvenování, dále se zabývá algoritmy skládání genomových assembly a popisuje metriky, pomocí kterých se vyhodnocuje kvalita výsledných genomových assembly. Praktická část je zaměřena na tvorbu assembly ptačí motolice Trichobilharzia szidati pomocí dvou programů a následné zhodnocení kvality obou assembly. | cs_CZ |
uk.abstract.en | Detailed information of the genome of the studied organism is crucial for many fields of modern research. Actual sequencing technologies are not able to read the whole DNA molecule at once therefore only fragments of the genetic information are obtained, which are not sufficiently informative on their own. The goal of the genomic-bioinformatic approach is to assemble these fragments into complete original information - genome assembly. The process of the genome assembly is demanding in terms of computational power, software equipment and expert staff. Many assemblers - programs for genome assembly are available differing in performance, size of the analyzed genome or target organism. The quality of final assembly is fully dependent on assembler and setting of inner parameters. In practice, multiple assemblies are constructed and their quality evaluated according to the technical and biological parameters. The presented thesis describes current high throughput sequencing technologies, different approaches and algorithms for genome assembly and methodology for their quality assessment. The practical part is focused on assembly and its quality assessment using Illumina data of the bird fluke Trichobilharzia szidati. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Přírodovědecká fakulta, Katedra buněčné biologie | cs_CZ |
thesis.grade.code | 2 | |
uk.publication-place | Praha | cs_CZ |