Predicting novel drug-target interactions via deep learning techniques
Predikování nových drug-target interakcí pomocí deep learningu
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/116611Identifiers
Study Information System: 201269
Collections
- Kvalifikační práce [11322]
Author
Advisor
Referee
Kratochvíl, Miroslav
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Artificial Intelligence
Department
Department of Software Engineering
Date of defense
3. 2. 2020
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
drug-target interakce, deep learning, denoising autoencoders, word2vecKeywords (English)
drug-target interactions, deep learning, denoising autoencoders, word2vecAdam Frey Záměrem této práce bylo vyvinout model strojového učenı́ pro predikci in- terakcı́ mezi léky a bı́lkovinami v těle. Inspirována předchozı́mi metodami zaměřila se práce hlavně na metody typu "collaborative filtering" a hlubokého učenı́. Cı́lem bylo překonánı́ předchozı́ch modelů. Tento cı́l byl dosažen po- mocı́ série vylepšenı́ základnı́ho algoritmu faktorizace latentnich matic na rele- vantnı́m datasetu. Malé množstvı́ dat se aktuálně jevı́ jako bariéra pro využitı́ vı́ce sofistikovaných metod hlubokého učenı́. Hybridnı́ přistupy doporučovacı́ch systémů kombinujı́cı́ vı́cero typů dat se zdajı́ jako logický dalšı́ krok.
Adam Frey Aim of this work was to develop a machine-learning model for a prediction of drug-target interactions. Inspired by previous state-of-the-art approaches, the work focuses on collaborative filtering methods and deep learning neural network models. The goal of improving upon the previous work was achieved using a series of improvements of a basic latent matrix factorization algorithm on the relevant dataset. The small amount of data currently seems like the bottleneck for utilizing more sophisticated deep learning methods. As such hybrid approaches for recommendation systems can prove to be interesting next step due to their effective utilization of multiple data sources.