Structural identification of protein-DNA interactions using machine learning
Strukturní identifikace protein-DNA interakcí pomocí strojového učení
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/123079Identifiers
Study Information System: 211215
Collections
- Kvalifikační práce [19113]
Author
Advisor
Referee
Feidakis, Christos
Faculty / Institute
Faculty of Science
Discipline
Bioinformatics
Department
Department of Cell Biology
Date of defense
15. 9. 2020
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
bioinformatika, strukturní bioinoformatika, strojové učeníKeywords (English)
bioinformatics, structural bioinformatics, machine learningInterakcie DNA a proteínov sú dôležitou súčasťou bunky a bunečného cyklu. Aby sme mohli predikovať ich interakcie mali by sme poznať štruktúru DNA a proteínov. Pre predikciu interakcií sme zvolili strojové učenie, ktoré má adekvátne výsledky v oblasti biologickej predikcie. V tejto práci používame a upravujeme P2Rank pre predikciu DNA väzobných miest na povrchu proteínu. P2rank bol pôvodne navrhnutý pre predikciu väzobných miest ligandov. Rovnako sme pripravili popis existujúcich metód pre predikciu DNA väzobných miest. Návrhy nových vlastností pre predikciu väzobných miest je súčasťou popisu P2Rank.
DNA-protein interactions are essential parts of cell life and cell cycle. Prediction of these interactions requires knowledge of DNA and a protein structure. Because machine learning approaches show adequate results in biological predictions, we chose to use it for the prediction of protein-DNA interactions. In this thesis, we use the machine learning tool P2Rank that was originally designed for prediction of ligand-binding sites and adapt it to predict DNA-binding sites. Apart of that, the thesis serves as a summary of existing prediction tools/methods and includes suggestions for further modifications of P2Rank.