Vizualizace funkcí podobných proteinů
Visualization of the functions of similar proteins
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/194230Identifiers
Study Information System: 267303
Collections
- Kvalifikační práce [20870]
Author
Advisor
Referee
Novotný, Marian
Faculty / Institute
Faculty of Science
Discipline
Bioinformatics
Department
Department of Physical and Macromolecular Chemistry
Date of defense
11. 9. 2024
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
funkční anotace proteinů, Gene Ontology, podobnost proteinů, vizualizaceKeywords (English)
functional annotation of proteins, Gene Ontology, protein similarity, visualizationDůležitou úlohou v molekulární biologii je hledání nových proteinů a sta- novení jejich funkce. Přestože experimentální výzkum proteinů je stále ne- nahraditelný, výpočetní techniky umožnují získávat nové poznatky mnohem rychleji. Proto se čím dál častěji k predikcím 3D struktur a biologických funkcí využívají počítačové metody. V této práci jsou diskutovány různé metody predikce funkčních anotací, včetně moderních metod využívajících hluboké strojové učení. Zároveň je představen nový program GOLizard, určený k vizualizaci funkcí podobných proteinů, které jsou získány pomocí programů BLAST a FoldSeek. K vi- zualizaci využívá hierarchické uspořádání Gene Ontology termínů pomocí orientovaného grafu, který zobrazuje vztahy mezi jednotlivými termíny.
An important task in molecular biology is the search for new proteins and the determination of their functions. Although experimental research on pro- teins remains irreplaceable, computational techniques allow us to obtain new insights much faster. Therefore, computer calculations are increasingly being used for predicting 3D structures and biological functions. In this work, various methods for predicting functional annotations are dis- cussed, including modern methods based on deep machine learning. Ad- ditionally, a new program called GOLizard is introduced, which can be used to visualize functions of similar proteins obtained through the BLAST and FoldSeek programs. It uses a hierarchical arrangement of Gene Ontol- ogy terms via a directed graph, showing the relationships between individual terms.