Výpočty vlastností komplexů přechodných kovů ve vztahu k protirakovinné léčbě metodami kvantové mechaniky s návazností na strojové učení.
Calculations of properties of transition metal complexes related to anticancer treatment by quantum mechanical methods in connection with machine learning.
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/200182Identifikátory
SIS: 258290
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Svozil, Daniel
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Fyzika
Katedra / ústav / klinika
Katedra chemické fyziky a optiky
Datum obhajoby
17. 6. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
kvantová mechanika molekul|léčba rakoviny|strojové učení|tvorba databázeKlíčová slova (anglicky)
quantum theory of molecules|anticancer treatment|machine learning|database formationPráce se zaměřila na využití metod kvantově-chemických výpočtů a strojového učení na predikci biologické aktivity komplexů platiny Pt(IV). Jako trénovací dataset byly použity komplexy z rešerše článků z let 2006 - 2010 se známou hodnotou cytotoxicity. Pomocí hybridního funkcionálu B3LYP s bázovým setem 6-31+G(d) v kombinaci s pseudopotenciály byly spočteny relevantní deskriptory. Korelace mezi deskriptory a biologickou aktivitou byla zkoumána prostřednictvím modelů strojového učení rozhodovací stromy a náhodné lesy. Na train-test split datasetu vykazovaly modely accuracy okolo 80 %. Metodika byla otestována na externím datasetu komplexů z rešerše literatury z roku 2023. Na novém datasetu měly rozhodovací stromy accuracy v průměru 70 % a náhodné lesy 80 %. Byly zjištěny relevance jednotlivých deskriptorů s největší důležitostí vazebné energie ligandu koordinovaného přes atom dusíku a následně objemu a povrchu kavity komplexu. 1
This study employed quantum-chemical calculations and machine-learning approaches to predict the biological activity of Pt(IV) platinum complexes. The training set contained complexes drawn from publications between 2006 and 2010 with known cytotoxicity values. Relevant descriptors were calculated using the hybrid functional B3LYP with the 6-31+G(d) basis set in combination with pseudopotentials. Correlations between descriptors and biological activity were investigated with decision-tree and random-forest machine learning models. Ona train-test split dataset, both models achieved accuracies of roughly 80 %. The methodology was then validated on an external dataset of complexes sourced from 2023 literature. On this new dataset, decision trees averaged 70 % accuracy, while random forests reached 80 %. Feature-importance analysis showed the binding energy of the ligand coordinated through a nitrogen atom to be the most influential descriptor, followed by the cavity volume and surface of the complex. 1
