Grafová reprezentace molekul a její využití ve virtuálním screeningu
Graph-based molecular representation and its utilization in virtual screening
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/86166Identifiers
Study Information System: 189242
Collections
- Kvalifikační práce [10527]
Author
Advisor
Referee
Kopecký, Michal
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Department of Software Engineering
Date of defense
20. 6. 2017
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
graf, podobnost, chemická informatika, virtuální screeningKeywords (English)
graph, similarity, chemical informatics, virtual screeningGrafy jsou přirozeným způsobem reprezentace molekul. Přesto se grafové reprezentace a algoritmy běžně nepoužívají ke zjišťování podobnosti molekul ve virtuálním screeningu. V této práci testujeme grafové přístupy ve virtuálním screeningu založeném na ligandech. Podobnost molekulových grafů počítáme pomocí největšího společného podgrafu a grafové editační vzdálenosti. Používáme implementace fmcs z chemoinformatické knihovny RDKit pro určení největšího společného podgrafu a GraphMatchingToolkit od K. Riesena pro určení grafové editační vzdálenosti. Nalezli jsme vhodné kombinace parametrů pro aplikaci ve virtuálním screeningu. Výsledky ukazují, že grafové přístupy jsou kvalitativně srovnatelné se stávajícími metodami.
Graphs are natural way of representing molecules. However, graph representations and algorithms are not being used for finding similarity of molecules in virtual screening. In this work we test the graph-based methods in ligand-based virtual screening. The similarity of molecular graphs is determined by maximum common subgraph and graph edit distance. We use implementations fmcs from chemoinformatic library RDKit for maximum common subgraph and GraphMatchingToolkit from K.Riesen to determine graph edit distance. We have found suitable combinations of parameters for aplication in ligand-based virtual screening. The results suggest that performance of graph based methods is comparable to the state-of-the-art methods.