Predicting novel drug-target interactions via deep learning techniques
Predikování nových drug-target interakcí pomocí deep learningu
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/116611Identifikátory
SIS: 201269
Kolekce
- Kvalifikační práce [11211]
Autor
Vedoucí práce
Oponent práce
Kratochvíl, Miroslav
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
3. 2. 2020
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
drug-target interakce, deep learning, denoising autoencoders, word2vecKlíčová slova (anglicky)
drug-target interactions, deep learning, denoising autoencoders, word2vecAdam Frey Záměrem této práce bylo vyvinout model strojového učenı́ pro predikci in- terakcı́ mezi léky a bı́lkovinami v těle. Inspirována předchozı́mi metodami zaměřila se práce hlavně na metody typu "collaborative filtering" a hlubokého učenı́. Cı́lem bylo překonánı́ předchozı́ch modelů. Tento cı́l byl dosažen po- mocı́ série vylepšenı́ základnı́ho algoritmu faktorizace latentnich matic na rele- vantnı́m datasetu. Malé množstvı́ dat se aktuálně jevı́ jako bariéra pro využitı́ vı́ce sofistikovaných metod hlubokého učenı́. Hybridnı́ přistupy doporučovacı́ch systémů kombinujı́cı́ vı́cero typů dat se zdajı́ jako logický dalšı́ krok.
Adam Frey Aim of this work was to develop a machine-learning model for a prediction of drug-target interactions. Inspired by previous state-of-the-art approaches, the work focuses on collaborative filtering methods and deep learning neural network models. The goal of improving upon the previous work was achieved using a series of improvements of a basic latent matrix factorization algorithm on the relevant dataset. The small amount of data currently seems like the bottleneck for utilizing more sophisticated deep learning methods. As such hybrid approaches for recommendation systems can prove to be interesting next step due to their effective utilization of multiple data sources.