Predicting local structural properties from antibody sequence
Predikce lokálních strukturních vlastností ze sekvence protilátek
diploma thesis (NOT DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/187978Identifiers
Study Information System: 243001
Collections
- Kvalifikační práce [22109]
Author
Advisor
Referee
Hoksza, David
Faculty / Institute
Faculty of Science
Discipline
Bioinformatics
Department
Department of Cell Biology
Date of defense
24. 1. 2024
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
English
Grade
Fail
Keywords (Czech)
protilátka, post-translační modifikace, relativní povrchová dostupnost pro rozpouštědla, strojové učení, lokální struktura, predikceKeywords (English)
antibody, post-translational modification, relative solvent accessibility, machine learning, local structure, predictionPredikce lokálních strukturních vlastností protilátek na reziduální úrovni je hodně důležitá pro detekci přítomnosti posttranslačních modifikací (PTM), které často indukují strukturální změny v protilátce, negativně ovlivňují její dlouhodobou skladovatelnost a vedou ke ztrátě jejího terapeutického potenciálu. V této práci predikujeme u jednotlivých reziduí relativní povrchovou dostupnost pro rozpouštědla (RSA). Tato vlastnost je spolu s typem dotyčné aminokyseliny klíčovým indikátorem přítomnosti oxidací methioninu a dalších typů PTM. Díky konzervovanosti struktury protilátek jsme zjistili, že různé třídy predikčních metod produkují téměř zaměnitelné výsledky - celková průměrná absolutní chyba (MAE) 5,64 procentních jednotek RSA pro nejvýkonnější z odzkoušených metod založených na strojovém učení, ve srovnání s hodnotou 5,96 naměřenou pro nejvýkonnější statistickou metodu. Výrazné zlepšení kvality predikce pozorované ve srovnání s metodou náhodné predikce s MAE 35,996 lze také připsat zachování struktury sekvence. V CDR oblastech je předpovědět hodnoty RSA obtížnější. Přestože metody a postupy, které v této práci používáme, zdaleka nejsou schopny poskytnout komplexní předpověď struktury, můžou se stát modulárním nástrojem s vysokou propustností pro návrh vhodných terapeutických protilátek. Klíčová slova:...
Predicting local structural properties of antibodies at residual level is vital for detecting the presence of post-translational modifications (PTMs), which often induce structural change in the antibody, negatively impact its shelf-life and possibly lead to the loss of the therapeutic potential. In this work, we predict relative solvent accessibility (RSA) of individual residues. This property is, alongside with the type of amino acid in question, the key indicator for presence of methionine oxidations and other types of PTMs. Due to the conservation of the antibody structure, we identified that different classes of prediction methods yield almost interchangeable results - total mean absolute error (MAE) of 5.64 RSA percentage units measured for the best performing machine learning pipeline compared to the 5.96 measured for the best performing statistical pipeline. The significant prediction quality improvement observed within comparison to the random prediction method with MAE of 35.996 may be as well attributed to the sequence conservancy. In CDR regions, RSA values are harder to predict. Although the range of methods and procedures employed throughout this work is by far not able to yield complex structure predictions, it might constitute a modular, high-throughput tool to support one's choices when...
