Show simple item record

Optimalizace enzymů ze sekvenční homologie za pomoci strojového učení
dc.contributor.advisorPříhoda, David
dc.creatorNeitzert, Gesa-Maret
dc.date.accessioned2022-10-04T16:55:46Z
dc.date.available2022-10-04T16:55:46Z
dc.date.issued2022
dc.identifier.urihttp://hdl.handle.net/20.500.11956/175718
dc.description.abstractIn pharmaceutical research and development, enzymes play an important role in the synthesis of drugs and drug-related molecules. For higher efficiency and increased production, it is important to optimize the yield of these enzymes, a task often addressed by protein engineering and design. This process of enzyme optimization however can become tedious with the vast options of mutations for each single protein. To improve the process of enzyme optimization, sequence homology and machine learning methods can be used. These greatly reduce the manual effort of protein redesign and can assist in finding the most fit enzyme for the given task, increasing the efficiency of the overall drug development pipeline. With this aim in mind this thesis summarizes a selection of existing methods and their possible application to enzyme optimization. Testing two predictive models with varying complexity on 4 datasets in an attempt to optimize absorption, enantioselectivity, or thermostability found only a modest correlation between actual target values and their predicted values: mean Pearson's R 0.20775 and 0.5188. Comparing probability patterns of protein sequence embeddings led to a 0.815 correlation score with the BLOSUM62 substitution matrix, confirming the language model's intuition about natural frequency of...en_US
dc.description.abstractVe farmaceutickém výzkumu a vývoji hrají enzymy důležitou roli při syntéze léků a molekul souvisejících s léky. Pro vyšší účinnost a zvýšenou produkci je důležité optimalizovat výtěžek těchto enzymů, což je úkol často řešený proteinovým inženýrstvím a designem. Tento proces optimalizace enzymu se však může stát zdlouhavým s obrovskými možnostmi mutací pro každý jednotlivý protein. Ke zlepšení procesu optimalizace enzymů lze použít sekvenční homologii a metody strojového učení. Ty výrazně snižují manuální úsilí při přepracování proteinů a mohou pomoci při hledání nejvhodnějšího enzymu pro daný úkol, čímž se zvyšuje efektivita celého procesu vývoje léčiv. S ohledem na tento cíl tato práce shrnuje výběr existujících metod a jejich možné aplikace při optimalizaci enzymů. Testování dvou prediktivních modelů s různou složitostí na 4 souborech dat ve snaze optimalizovat absorpci, enantioselektivitu, nebo teplotní stabilitu zjistilo pouze mírnou korelaci mezi skutečnými cílovými hodnotami a jejich předpokládanými hodnotami: průměr Pearsonova R 0,20775 a 0,5188. Porovnání pravděpodobnostních vzorů vložení proteinových sekvencí vedlo ke korelačnímu skóre 0,815 se substituční maticí BLOSUM62, což potvrzuje intuici jazykového modelu o přirozené frekvenci různých typů mutací. Zatímco výsledky prediktivních...cs_CZ
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Přírodovědecká fakultacs_CZ
dc.titleEnzyme optimization using sequence homology and machine learningen_US
dc.typediplomová prácecs_CZ
dcterms.created2022
dcterms.dateAccepted2022-09-07
dc.description.departmentDepartment of Cell Biologyen_US
dc.description.departmentKatedra buněčné biologiecs_CZ
dc.description.facultyPřírodovědecká fakultacs_CZ
dc.description.facultyFaculty of Scienceen_US
dc.identifier.repId243002
dc.title.translatedOptimalizace enzymů ze sekvenční homologie za pomoci strojového učenícs_CZ
dc.contributor.refereeHoksza, David
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineBioinformaticsen_US
thesis.degree.disciplineBioinformatikacs_CZ
thesis.degree.programBioinformaticsen_US
thesis.degree.programBioinformatikacs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csPřírodovědecká fakulta::Katedra buněčné biologiecs_CZ
uk.taxonomy.organization-enFaculty of Science::Department of Cell Biologyen_US
uk.faculty-name.csPřírodovědecká fakultacs_CZ
uk.faculty-name.enFaculty of Scienceen_US
uk.faculty-abbr.csPřFcs_CZ
uk.degree-discipline.csBioinformatikacs_CZ
uk.degree-discipline.enBioinformaticsen_US
uk.degree-program.csBioinformatikacs_CZ
uk.degree-program.enBioinformaticsen_US
thesis.grade.csDobřecs_CZ
thesis.grade.enGooden_US
uk.abstract.csVe farmaceutickém výzkumu a vývoji hrají enzymy důležitou roli při syntéze léků a molekul souvisejících s léky. Pro vyšší účinnost a zvýšenou produkci je důležité optimalizovat výtěžek těchto enzymů, což je úkol často řešený proteinovým inženýrstvím a designem. Tento proces optimalizace enzymu se však může stát zdlouhavým s obrovskými možnostmi mutací pro každý jednotlivý protein. Ke zlepšení procesu optimalizace enzymů lze použít sekvenční homologii a metody strojového učení. Ty výrazně snižují manuální úsilí při přepracování proteinů a mohou pomoci při hledání nejvhodnějšího enzymu pro daný úkol, čímž se zvyšuje efektivita celého procesu vývoje léčiv. S ohledem na tento cíl tato práce shrnuje výběr existujících metod a jejich možné aplikace při optimalizaci enzymů. Testování dvou prediktivních modelů s různou složitostí na 4 souborech dat ve snaze optimalizovat absorpci, enantioselektivitu, nebo teplotní stabilitu zjistilo pouze mírnou korelaci mezi skutečnými cílovými hodnotami a jejich předpokládanými hodnotami: průměr Pearsonova R 0,20775 a 0,5188. Porovnání pravděpodobnostních vzorů vložení proteinových sekvencí vedlo ke korelačnímu skóre 0,815 se substituční maticí BLOSUM62, což potvrzuje intuici jazykového modelu o přirozené frekvenci různých typů mutací. Zatímco výsledky prediktivních...cs_CZ
uk.abstract.enIn pharmaceutical research and development, enzymes play an important role in the synthesis of drugs and drug-related molecules. For higher efficiency and increased production, it is important to optimize the yield of these enzymes, a task often addressed by protein engineering and design. This process of enzyme optimization however can become tedious with the vast options of mutations for each single protein. To improve the process of enzyme optimization, sequence homology and machine learning methods can be used. These greatly reduce the manual effort of protein redesign and can assist in finding the most fit enzyme for the given task, increasing the efficiency of the overall drug development pipeline. With this aim in mind this thesis summarizes a selection of existing methods and their possible application to enzyme optimization. Testing two predictive models with varying complexity on 4 datasets in an attempt to optimize absorption, enantioselectivity, or thermostability found only a modest correlation between actual target values and their predicted values: mean Pearson's R 0.20775 and 0.5188. Comparing probability patterns of protein sequence embeddings led to a 0.815 correlation score with the BLOSUM62 substitution matrix, confirming the language model's intuition about natural frequency of...en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Přírodovědecká fakulta, Katedra buněčné biologiecs_CZ
thesis.grade.code3
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV