Mining novel terpene synthases from large-scale repositories
Mining nových terpen syntáz z rozsáhlých databází
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/190195Identifiers
Study Information System: 253476
Collections
- Kvalifikační práce [21733]
Author
Advisor
Referee
Štáfková, Jitka
Faculty / Institute
Faculty of Science
Discipline
Bioinformatics
Department
Department of Cell Biology
Date of defense
4. 6. 2024
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
terpen syntáza, mining, databáze, Pfam, Supfam, doména, terpenKeywords (English)
terpene synthase, mining, database, Pfam, Supfam, domain, terpeneTerpeny a terpenoidy představují největší a strukturně nejrozmanitější skupinu přírodních látek s využitím v mnoha oborech, včetně farmaceutického průmyslu. Tyto molekuly jsou v přírodě syntetizovány enzymy známými jako terpen syntázy. V této práci byla provedena bioinformatická analýza kurátorované databáze obsahující všech 1125 experimentálně charakterizovaných terpen syntáz se zaměřením na identifikaci vzorců v délkách sekvencí a doménových architekturách těchto enzymů napříč různými říšemi života. Na základě poznatků této analýzy byl proveden sekvenčně založený mining s cílem identifikovat možné nové terpen syntázy. S využitím téměř 5,5 miliard proteinových sekvencí z různých rozsáhlých sekvenčních databází vedl mining k identifikaci více než 600 tisíc potenciálních terpen syntáz. Tyto potenciální terpen syntázy pocházejí převážně z bakterií a metagenomů, tedy ze zdrojů, které byly historicky méně zkoumány. Výsledný dataset, doplněný fylogenetickým stromem, sítí sekvenční podobnosti a dvěma skóre prioritizace, nabízí cenný zdroj pro objevování nových terpenů. Klíčová slova: terpen syntáza, TPS, mining, Pfam, SUPERFAMILY, doména, terpen
Terpenes and terpenoids represent the largest and most structurally diverse group of natural products, with applications across many fields, including the pharmaceutical industry. These molecules are synthesized in nature by enzymes known as terpene synthases. This thesis conducted a bioinformatic analysis of a curated database containing all 1125 experimentally characterized terpene synthases, focusing on identifying patterns in sequence lengths and domain architectures of these enzymes across different kingdoms of life. Based on this analysis's knowledge, sequence-guided mining was conducted to identify possible new terpene synthases. Using nearly 5.5 billion protein sequences from various large-scale sequence repositories, the mining resulted in the identification of more than 600 thousand putative terpene synthases. These putative terpene synthases mainly originate from Bacteria and metagenomes, sources that had historically been less explored. The resulting dataset, accompanied by a phylogenetic tree, sequence similarity network, and two prioritization scores, offers a valuable resource for the discovery of novel terpenes. Keywords: terpene synthase, TPS, mining, Pfam, SUPERFAMILY, domain, terpene
Citace dokumentu
Metadata
Show full item recordRelated items
Showing items related by title, author, creator and subject.
-
Terpene discovery combining in silico and molecular biology approaches
Defence status: DEFENDEDSmrčková, Helena (Univerzita Karlova, Přírodovědecká fakulta, 2023)Date of defense: 6. 6. 2023Terpenoids are the largest class of natural products with remarkable chemical and structural diversity, making them a significant source of compounds for drug discovery. Terpenoids are used as food flavours, therapeutics, ... -
Exploring novel terpene scaffolds synthesised by artificially expressed terpene synthases
Defence status: DEFENDEDSvoboda, Tomáš (Univerzita Karlova, Přírodovědecká fakulta, 2024)Date of defense: 9. 9. 2024Terpenoidy tvoří rozsáhlou třídu přírodních sloučenin s různými biologickými funkcemi, převážně využívané organismy pro obranu a reprodukci. Terpenoidy poměrně často vykazují biologické aktivity, které se využívají jako ... -
Enzymatické oxidace alkoholů v biosyntéze feromonů čmelaků
Defence status: DEFENDEDBártová, Adéla (Univerzita Karlova, Přírodovědecká fakulta, 2016)Date of defense: 6. 6. 2016Sekret labiální žlázy samce velmi rozšířeného čmeláka zemního (Bombus terrestris) obsahuje směs terpenových alkoholů, alifatických alkoholů, esterů a alkanů s malým množstvím aldehydů potenciálně odvozených od majoritních ...
