Detection of protein-ligand binding sites using graph neural networks
Využití grafových neuronových sítí pro detekci protein-ligand vazebných míst
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/175666Identifikátory
SIS: 240947
Kolekce
- Kvalifikační práce [10932]
Autor
Vedoucí práce
Oponent práce
Pilát, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Computer Science - Artificial Intelligence
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
7. 9. 2022
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
bioinformatika|grafové neuronové sítě|protein|strukturaKlíčová slova (anglicky)
binding sites|protein-ligand binding sites|binding sites prediction|Graph Neural Networks|Graph Convolutional Networks|residue-level prediction|node features|protein|structureFunkce většiny biologických systémů je realizována interakcí proteinů s jinými bi- ologickými molekulami. Vazba protein-ligand je jedním z nejdůležitějších druhů interakcí, které, pokud jsou dobře prostudovány, mohou odhalit mnoho skrytých kauzálních vzorců za biologickými funkcemi a mohou přispět k rychlému rozvo- ji výzkumu léčiv. Detekce vazebných míst protein-ligand je jedním z aspektů interakcí protein-ligand, kde je cílem vyvinout výpočetní metody, které mo- hou používat ligand i strukturu proteinu, případně spolu s jeho sekvenčními údaji, k predikci oblastí proteinu, které se mohou vázat na potenciál. ligandy. Významný nárůst databází proteinových struktur, jako je Protein Data Bank (PDB) a sekvenčních databází, jako je Universal Protein Resource (UniProt), vedl k vývoji různých přístupů strojového učení a hlubokého učení, které využívají toto obrovské množství biologických data k řešení tohoto úkolu. V této práci zk- oumáme metodu hlubokého učení založenou na nedávné modelové architektuře zvané Graph Convolutional Networks (GCN), která kombinuje tradiční architek- turu konvolučních neuronových sítí (CNN) a novější architekturu Graph Neu- ral Network (GNN), která byla úspěšní...
The function of most biological systems is realized by the interaction of proteins with other biological molecules. Protein-ligand binding is one of the most im- portant kind of interactions which, if studied well, can reveal a lot of hidden causal patterns behind biological functions, and can contribute to the rapid de- velopment of drug research. Protein-ligand binding sites detection is one aspect of the general study of protein-ligand interactions, where the goal is to develop computational methods that can use ligand as well as protein structure, possibly together with its sequence data, to predict regions of the protein that can bind to potential ligands. The significant growth of protein structure databases, such as, Protein Data Bank (PDB) and sequence databases like Universal Protein Re- source (UniProt), has led to the development of different machine learning and deep learning approaches that make use of this huge amount of biological data to solve this task. In this thesis, we examine a deep learning method based on a recent model architecture called Graph Convolutional Networks (GCN), which combines the traditional Convolutional Neural Network (CNN) architecture, and the more recent Graph Neural Network (GNN) architecture which has been suc- cessful in solving various chemoinformatics...