Bioinformatický nástroj pro analýzu genových okolí
Bioinformatics Tool for the Analysis of Gene Neighbourhoods
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/176798Identifiers
Study Information System: 246998
Collections
- Kvalifikační práce [20088]
Author
Advisor
Referee
Větrovský, Tomáš
Faculty / Institute
Faculty of Science
Discipline
Microbiology
Department
Department of Genetics and Microbiology
Date of defense
13. 9. 2022
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
Czech
Grade
Excellent
Vyhledávání nových klastrů biosyntetických genů (BGC), zejména v Aktinobakteriích, je klíčové pro vývoj nových antimikrobiálních látek i dalších biologicky aktivních sloučenin odvozených od specializovaných metabolitů bakterií. Softwary pro vyhledávání BGC, které nejsou závislé na databázích publikovaných BGC, jsou v současnosti velmi limitovány. Tento typ softwarů však poskytuje výhody oproti přístupům, které těchto databází využívají. V této práci prezentuji bioinformatický nástroj, který sjednocuje funkce z několika dalších databáze-nevyužívajících bioinformatických nástrojů do jednoho. Tento software poskytuje plně interaktivní grafické rozhraní. Software využívá výstupu NCBI BLASTu k nalezení kódujících sekvencí homologů proteinů, podle kterých lze daný BGC identifikovat. Software následně zobrazuje výsledky v rámci uživatelského rozhraní, které uživateli umožňuje data dále analyzovat. Spolehlivost softwaru byla testována vyhledáváním subklastrů, kódujících biosyntézu 4-alkyl-L-prolinových prekurzorů odvozených od L-tyrosinu nebo L-leucinu. Během testování byl software schopen najít 120 ze 121ti ručně-nalezených subklastrů L-tyrosinové dráhy a 131 předpokládaných subklastrů L-leucinové dráhy, čímž byla potvrzena jeho spolehlivost. Většina z nalezených subklastrů L-leucinové i L- tyrosinové...
The discovery of novel biosynthetic gene clusters (BGCs), particularly in Actinobacteria, is key for the development of new antimicrobials and other bioactive compounds derived from bacterial specialized metabolites. BGC database-independent BGC-finding software represents a largely-unexplored avenue of research capable of finding BGCs missed by mainstream software due to its dependence on databases of published BGCs. In this work, a bioinformatics tool is presented, which seeks to unite the fragmented functions of database-independent BGC-finding software into a single comprehensive package and make it accessible to non-expert users through an easy-to-use graphical user interface. The software utilizes the output of NCBI BLAST containing user-selected marker proteins to identify points of co-localization, and then displays the results through a fully- interactive graphical interface which allows users to further analyse the data. The software's capabilities and limitations have been tested on L-tyrosine-derived and L-leucine-derived 4-alkyl-L- proline biosynthetic gene subclusters. The software was able to find 120 out of 121 manually-found biosynthetic gene subclusters, showcasing the reliability of the core algorithm. In addition, a further 131 putative L-leucine-derived 4-alkyl-L-proline...