Limitations of variant consequence predictors

Břicháčková, Kateřina

Omezení predikčních programů pro určování důsledků genomických variant

bakalářská práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (151.2Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/101416

Identifikátory

SIS: 200276

Oponent práce

Kolář, Michal

Fakulta / součást

Přírodovědecká fakulta

Obor

Bioinformatika

Katedra / ústav / klinika

Katedra buněčné biologie

Datum obhajoby

10. 9. 2018

Nakladatel

Univerzita Karlova, Přírodovědecká fakulta

Jazyk

Angličtina

Známka

Výborně

Klíčová slova (česky)

programy pro určovánı́ důsledků variant, funkčnı́ anotace, ANNO- VAR, VEP, Haplosaurus, BCFTools, csq, SnpEff, srovnánı́ programů

Klíčová slova (anglicky)

variant consequence predictors, functional annotation, ANNOVAR, VEP, Haplosaurus, BCFtools, csq, SnpEff, predictors comparison

Díky mnohým rozsáhlým sekvenačním projektům se množství nalezených genomických variant stále zvyšuje. Klíčovým krokem v analýze těchto dat je jejich funkční ano- tace, jež pomáhá varianty kategorizovat, filtrovat a prioritizovat pro další výzkum. Tato práce seznamuje s pěti běžně používanými programy pro určování důsledků vari- ant, poskytuje rady, jak je používat, a stručně představuje algoritmy, které používají. Mimo to jsou zde popsány různé datové formáty, genomové anotace a lidský referenční genom. Správnost reference je velice důležitá, neboť na ní spoléhají všechny programy. Práce upozorňuje na určité situace, ve kterých se výsledky z různých programů mohou navzájem lišit. Pro všechny testy byla použita Ensembl genová anotace (release 92) a referenční genom GRCh38.

Abstrakt (anglicky)

Thanks to numerous large-scale sequencing projects, the number of discovered genomic variants is increasing. The key step in analyzing the variant data is the functional annotation, since it helps researchers and clinicians to categorize, filter and prioritize the variants for further research. This thesis discusses five commonly-used variant consequence predictors, offers advice on how to use them and briefly goes through the algorithms they employ. Moreover, various data formats as well as the human reference genome and different genome annotations are described in the thesis. The correctness of the reference is of great importance as all the predictors rely on it. This thesis highlights some situations in which the results given by different predictors can vary. All the tests were made using the Ensembl gene annotation (release 92) and the GRCh38 reference assembly.

Citace dokumentu

Metadata

Zobrazit celý záznam