Predicting local structural properties from antibody sequence
Predikce lokálních strukturních vlastností ze sekvence protilátek
diplomová práce (NEOBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/187978Identifikátory
SIS: 243001
Kolekce
- Kvalifikační práce [21495]
Autor
Vedoucí práce
Oponent práce
Hoksza, David
Fakulta / součást
Přírodovědecká fakulta
Obor
Bioinformatika
Katedra / ústav / klinika
Katedra buněčné biologie
Datum obhajoby
24. 1. 2024
Nakladatel
Univerzita Karlova, Přírodovědecká fakultaJazyk
Angličtina
Známka
Neprospěl/a
Klíčová slova (česky)
protilátka, post-translační modifikace, relativní povrchová dostupnost pro rozpouštědla, strojové učení, lokální struktura, predikceKlíčová slova (anglicky)
antibody, post-translational modification, relative solvent accessibility, machine learning, local structure, predictionPredikce lokálních strukturních vlastností protilátek na reziduální úrovni je hodně důležitá pro detekci přítomnosti posttranslačních modifikací (PTM), které často indukují strukturální změny v protilátce, negativně ovlivňují její dlouhodobou skladovatelnost a vedou ke ztrátě jejího terapeutického potenciálu. V této práci predikujeme u jednotlivých reziduí relativní povrchovou dostupnost pro rozpouštědla (RSA). Tato vlastnost je spolu s typem dotyčné aminokyseliny klíčovým indikátorem přítomnosti oxidací methioninu a dalších typů PTM. Díky konzervovanosti struktury protilátek jsme zjistili, že různé třídy predikčních metod produkují téměř zaměnitelné výsledky - celková průměrná absolutní chyba (MAE) 5,64 procentních jednotek RSA pro nejvýkonnější z odzkoušených metod založených na strojovém učení, ve srovnání s hodnotou 5,96 naměřenou pro nejvýkonnější statistickou metodu. Výrazné zlepšení kvality predikce pozorované ve srovnání s metodou náhodné predikce s MAE 35,996 lze také připsat zachování struktury sekvence. V CDR oblastech je předpovědět hodnoty RSA obtížnější. Přestože metody a postupy, které v této práci používáme, zdaleka nejsou schopny poskytnout komplexní předpověď struktury, můžou se stát modulárním nástrojem s vysokou propustností pro návrh vhodných terapeutických protilátek. Klíčová slova:...
Predicting local structural properties of antibodies at residual level is vital for detecting the presence of post-translational modifications (PTMs), which often induce structural change in the antibody, negatively impact its shelf-life and possibly lead to the loss of the therapeutic potential. In this work, we predict relative solvent accessibility (RSA) of individual residues. This property is, alongside with the type of amino acid in question, the key indicator for presence of methionine oxidations and other types of PTMs. Due to the conservation of the antibody structure, we identified that different classes of prediction methods yield almost interchangeable results - total mean absolute error (MAE) of 5.64 RSA percentage units measured for the best performing machine learning pipeline compared to the 5.96 measured for the best performing statistical pipeline. The significant prediction quality improvement observed within comparison to the random prediction method with MAE of 35.996 may be as well attributed to the sequence conservancy. In CDR regions, RSA values are harder to predict. Although the range of methods and procedures employed throughout this work is by far not able to yield complex structure predictions, it might constitute a modular, high-throughput tool to support one's choices when...
