Zobrazit minimální záznam

Adaptable heuristic for source code similarity measuring.
dc.contributor.advisorHolan, Tomáš
dc.creatorVodsloň, František
dc.date.accessioned2017-04-21T06:12:00Z
dc.date.available2017-04-21T06:12:00Z
dc.date.issued2010
dc.identifier.urihttp://hdl.handle.net/20.500.11956/30601
dc.description.abstractPrincip fungování většiny existujících systémů pro vyhledávání plagiátů v zadané množině zdrojových textů spočívá v postupném porovnávání každého textu s ostatními texty v množině. Ve většině případů vyjde spočítaná míra podobnosti natolik malá, že se dále není třeba danou dvojicí souborů zabývat (můžeme s jistotou na základě dosažené míry podobnosti prohlásit, že se nejedná o plagiáty). Cílem této práce je navrhnout algoritmus pro předvýběr dvojic souborů určených k porovnání. Heuristický algoritmus by měl efektivně odhadovat výsledky složitějšího porovnávacího programu a na základě tohoto odhadu rozhodovat, zda připustit dvojici zdrojových textů k porovnání. Algoritmus by měl být adaptabilní v tom smyslu, že by měnil svoje odhady v závislosti na spektru zdrojových textů obsažených v systému.cs_CZ
dc.description.abstractMost of systems for plagiarism detection within a set of source codes is based on sequential comparing of each source code with all other source codes in the set. Computed similarity is in most cases so low, that we can deduce compared codes are not plagiarized. Purpose of this work is to create a heuristic algorithm for pre-selection of source code pairs for comparing. Heuristic algortihm should effectively aproximate results of the main comparing program, which is more complicated and slower. The plagiarism detection system will then decide, based on the result of heuristic algorithm, whether the source code pair will be compared using main comparing program or not. Algorithm should be self-adapting - it should be able to improve itself depending on the set of source codes saved in system.en_US
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.titleAdaptabilní heuristika pro vyhodnocování podobnosti zdrojových textůcs_CZ
dc.typediplomová prácecs_CZ
dcterms.created2010
dcterms.dateAccepted2010-02-02
dc.description.departmentDepartment of Software and Computer Science Educationen_US
dc.description.departmentKatedra softwaru a výuky informatikycs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId49853
dc.title.translatedAdaptable heuristic for source code similarity measuring.en_US
dc.contributor.refereeKopecký, Michal
dc.identifier.aleph001196804
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineSoftwarové systémycs_CZ
thesis.degree.disciplineSoftware Systemsen_US
thesis.degree.programInformatikacs_CZ
thesis.degree.programComputer Scienceen_US
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwaru a výuky informatikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software and Computer Science Educationen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csSoftwarové systémycs_CZ
uk.degree-discipline.enSoftware Systemsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csPrincip fungování většiny existujících systémů pro vyhledávání plagiátů v zadané množině zdrojových textů spočívá v postupném porovnávání každého textu s ostatními texty v množině. Ve většině případů vyjde spočítaná míra podobnosti natolik malá, že se dále není třeba danou dvojicí souborů zabývat (můžeme s jistotou na základě dosažené míry podobnosti prohlásit, že se nejedná o plagiáty). Cílem této práce je navrhnout algoritmus pro předvýběr dvojic souborů určených k porovnání. Heuristický algoritmus by měl efektivně odhadovat výsledky složitějšího porovnávacího programu a na základě tohoto odhadu rozhodovat, zda připustit dvojici zdrojových textů k porovnání. Algoritmus by měl být adaptabilní v tom smyslu, že by měnil svoje odhady v závislosti na spektru zdrojových textů obsažených v systému.cs_CZ
uk.abstract.enMost of systems for plagiarism detection within a set of source codes is based on sequential comparing of each source code with all other source codes in the set. Computed similarity is in most cases so low, that we can deduce compared codes are not plagiarized. Purpose of this work is to create a heuristic algorithm for pre-selection of source code pairs for comparing. Heuristic algortihm should effectively aproximate results of the main comparing program, which is more complicated and slower. The plagiarism detection system will then decide, based on the result of heuristic algorithm, whether the source code pair will be compared using main comparing program or not. Algorithm should be self-adapting - it should be able to improve itself depending on the set of source codes saved in system.en_US
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwaru a výuky informatikycs_CZ
dc.identifier.lisID990011968040106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV