Podobnost proteinových struktur s využitím genetického programování
Protein Structure Similarity Using Genetic Programming
Podobnost proteinových struktur s využitím genetického programování
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/58091Identifikátory
SIS: 86193
Katalog UK: 990015575790106986
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Mráz, František
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Programování
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
24. 1. 2013
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Slovenština
Známka
Dobře
Klíčová slova (česky)
proteinová struktura, podobnost, genetické programováníKlíčová slova (anglicky)
protein structure, similarity, genetic programmingDôležitý aspekt bioinformatiky, ktorému sa práca venuje, je porovnávanie proteínových štruktúr. Vzhľadom na exponenciálny nárast databáz proteínových štruktúr za posledné roky bol potrebný vývoj efektívnejších metód. Riešenie daného problému nám ponúkajú evolučné výpočtové techniky. Predstavujú významný princíp, kedy počítač môže vyriešiť daný problém bez toho, aby ho človek preň explicitne naprogramoval. Zameriame sa na jednu paradigmu evolučných výpočtových techník - genetické programovanie. Vďaka stromovej reprezentácii má táto paradigma oproti zvyšným výhodu. Cieľom práce je preskúmanie možností využitia genetického programovania pri porovnávaní proteínových štruktúr. Navrhneme novú metódu - nazvanú ProSSiGen. Jej výsledky preukázali nedostatočnú presnosť klasifikácie a tiež to, že tento evolučný prístup rozhodne netreba zatratiť, len ho ďalej rozširovať a testovať. Tým budeme môcť vyvodiť záver, či je genetické programovanie pre túto úlohu vhodné.
The thesis deals with the protein structure similarity problem which is an important aspect of bioinformatics. Due to exponential growth of protein structures in databases, the development of more effective methods is required. Principles of evolutionary computation offer a way to solve the similarity problem. We focus on one of the evolutionary paradigms - genetic programming. The main advantage of genetic programming is a tree representation. We propose new method called ProSSiGen using genetic programming. ProSSiGen is evaluated by automatic protein classification. Obtained results signify that the efficiency of our method is insufficient. Regardless of the inefficiency, there are many reasons to continue to research. One of the reasons is the capability of genetic programming.
