Predicting residue-level surface exposure from antibody sequence
Predikce dostupnosti povrchu aminokyselin ze sekvence protilátek
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/194062Identifikátory
SIS: 272847
Kolekce
- Kvalifikační práce [21493]
Autor
Vedoucí práce
Oponent práce
Novotný, Marian
Fakulta / součást
Přírodovědecká fakulta
Obor
Bioinformatika
Katedra / ústav / klinika
Katedra buněčné biologie
Datum obhajoby
9. 9. 2024
Nakladatel
Univerzita Karlova, Přírodovědecká fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
protilátky, predikce, sekvence, povrch aminokyselinKlíčová slova (anglicky)
antibody, prediction, sequence, surface exposurePredikce lokálních strukturních vlastností protilátek na reziduální úrovni je velmi důležitá pro detekci přítomnosti posttranslačních modifikací (anglická zkratka PTM), které často indukují strukturální změny v protilátce, negativně ovlivňují její dlouhodobou skladovatelnost a vedou ke ztrátě jejího terapeutického potenciálu. V této práci prediku- jeme u jednotlivých reziduí relativní povrchovou dostupnost pro rozpouštědla (RSA). Tato vlastnost je spolu s typem dotyčné aminokyseliny klíčovým indikátorem přítom- nosti oxidací methioninu a dalších typů PTM. Na datové sadě obsahující struktury protilátek nahraných do databáze SAbDab v letech 2020-2022 byla pro nejvýkonnější z našich metod založených na strojovém učení naměřena celková průměrná absolutní chyba (anglická zkratka MAE) 5,82 procentních jednotek RSA, ve srovnání s hodno- tou 6,12 naměřenou pro nejlépe výkonnou z našich statistických metod. Na novější dátové sadě struktur protilátek nahraných v letech 2022-2024 jsou hodnoty průměrné absolutní chyby vyšší, konkrétně 10,81 a 10,98. ImmuneBuilder, nejmodernější nástroj pro predikci protilátek využívající hluboké učení, dosáhl na novější datové sadě MAE 8,41, nicméně doba jeho predikce byla několikatisícnásobně delší. Náhodný prediktor zaznamenal na těchto dvou datových sadách MAE 35,87 a...
Predicting local structural properties of antibodies at residue level is vital for detecting the presence of post-translational modifications (PTMs), which often induce structural change in the antibody, negatively impact its shelf-life and possibly lead to the loss of the therapeutic potential. In this work, we predict relative solvent accessibility (RSA) of individual residues. This property is, alongside with the type of amino acid in question, the key indicator for presence of methionine oxidations and other types of PTMs. Due to the conservation of the antibody structure, we identified that different classes of prediction methods yield almost interchangeable results. On a dataset containing antibody structures uploaded to the SAbDab database in years 2020-2022, the total mean absolute error (MAE) of 5.82 RSA percentage units was measured for our best performing machine-learning pipeline, compared to the value of 6.12, measured for our best performing statistical pipeline. On a newer dataset of antibody structures uploaded in years 2022-2024, the MAE values are higher, 10.81 and 10.98, respectively. ImmuneBuilder, the state-of-the-art deep-learning antibody prediction tool, achieved MAE of 8.41 on the newer dataset, however, its execution times were several thousand times higher. Random...
