Podobnost proteinových struktur s využitím genetického programování
Protein Structure Similarity Using Genetic Programming
Podobnost proteinových struktur s využitím genetického programování
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/58091Identifiers
Study Information System: 86193
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Mráz, František
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Programming
Department
Department of Software Engineering
Date of defense
24. 1. 2013
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Slovak
Grade
Good
Keywords (Czech)
proteinová struktura, podobnost, genetické programováníKeywords (English)
protein structure, similarity, genetic programmingDôležitý aspekt bioinformatiky, ktorému sa práca venuje, je porovnávanie proteínových štruktúr. Vzhľadom na exponenciálny nárast databáz proteínových štruktúr za posledné roky bol potrebný vývoj efektívnejších metód. Riešenie daného problému nám ponúkajú evolučné výpočtové techniky. Predstavujú významný princíp, kedy počítač môže vyriešiť daný problém bez toho, aby ho človek preň explicitne naprogramoval. Zameriame sa na jednu paradigmu evolučných výpočtových techník - genetické programovanie. Vďaka stromovej reprezentácii má táto paradigma oproti zvyšným výhodu. Cieľom práce je preskúmanie možností využitia genetického programovania pri porovnávaní proteínových štruktúr. Navrhneme novú metódu - nazvanú ProSSiGen. Jej výsledky preukázali nedostatočnú presnosť klasifikácie a tiež to, že tento evolučný prístup rozhodne netreba zatratiť, len ho ďalej rozširovať a testovať. Tým budeme môcť vyvodiť záver, či je genetické programovanie pre túto úlohu vhodné.
The thesis deals with the protein structure similarity problem which is an important aspect of bioinformatics. Due to exponential growth of protein structures in databases, the development of more effective methods is required. Principles of evolutionary computation offer a way to solve the similarity problem. We focus on one of the evolutionary paradigms - genetic programming. The main advantage of genetic programming is a tree representation. We propose new method called ProSSiGen using genetic programming. ProSSiGen is evaluated by automatic protein classification. Obtained results signify that the efficiency of our method is insufficient. Regardless of the inefficiency, there are many reasons to continue to research. One of the reasons is the capability of genetic programming.