Show simple item record

Training and validation dataset optimization for Earth observation classification accuracy improvement
dc.contributor.advisorKupková, Lucie
dc.creatorPotočná, Barbora
dc.date.accessioned2021-03-25T17:23:39Z
dc.date.available2021-03-25T17:23:39Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/20.500.11956/109663
dc.description.abstractDiplomová práce se zabývá optimalizací trénovacího a validačního datasetu pro řízenou klasifikaci dat v DPZ. V rámci řešení práce jsou v území lesně-luční krajiny v Podkrkonoší prováděny pro dva klasifikační algoritmy (Maximum Likelihood - MLC a Support Vector Machine - SVM) experimenty s trénovacími a validačními daty. Práce vychází z předpokladu, že pro dosažení maximální přesnosti klasifikace je ideální podíl 1/3 trénovacích a 2/3 validačních dat (Foody, 2009). Další hypotézou práce byl předpoklad, že v případě klasifikace pomocí algoritmu SVM je pro dosažení stejné/podobné přesnosti klasifikace potřeba nižší počet trénovacích bodů než v případě klasifikačního algoritmu Maximum Likelihood (Foody, 2004). Cílem práce bylo testovat vliv podílu/množství trénovacích a validačních dat na přesnost klasifikace multispektrálních dat senzoru Sentinel-2A s využitím algoritmu Maximum Likelihood. Nejvyšší celkové přesnosti při využití klasifikačního algoritmu Maximum Likelihood bylo dosaženo pro podíl 375 trénovacích a 625 validačních bodů. Celková přesnost pro tento podíl byla 72,88 %. Teorie Foodyho (2009), že pro dosažení nejvyšší přesnosti klasifikace je ideální podíl 1/3 trénovacích a 2/3 validačních dat potvrzují výsledky hodnocení celkové přesnosti a Kappa koeficientu pro Maximum Likelihood. Avšak...cs_CZ
dc.description.abstractThis thesis deals with training dataset and validation dataset for Earth observation classification accuracy improvement. Experiments with training data and validation data for two classification algorithms (Maximum Likelihood - MLC and Support Vector Machine - SVM) are carried out from the forest-meadow landscape located in the foothill of the Giant Mountains (Podkrkonoší). The thesis is base on the assumption that 1/3 of training data and 2/3 of validation data is an ideal ratio to achieve maximal classification accuracy (Foody, 2009). Another hypothesis was that in a case of SVM classification, a lower number of training point is required to achieve the same or similar accuracy of classification, as in the case of the MLC algorithm (Foody, 2004). The main goal of the thesis was to test the influence of proportion / amount of training and validation data on the classification accuracy of Sentinel - 2A multispectral data using the MLC algorithm. The highest overal accuracy using the MLC classification algorithm was achieved for 375 training and 625 validation points. The overal accuracy for this ratio was 72,88 %. The theory of Foody (2009) that 1/3 of training data and 2/3 of validation data is an ideal ratio to achieve the highest classification accuracy, was confirmed by the overal accuracy and...en_US
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Přírodovědecká fakultacs_CZ
dc.subjecttraining dataseten_US
dc.subjectvalidation dataseten_US
dc.subjectclassification accuracy improvementen_US
dc.subjectMaximum Likelihooden_US
dc.subjectSupport Vector Machineen_US
dc.subjecttrénovací datasetcs_CZ
dc.subjectvalidační datasetcs_CZ
dc.subjecthodnocení přesnosti klasifikace. Maximum Likelihoodcs_CZ
dc.subjectSupport Vector Machinecs_CZ
dc.titleOptimalizace tvorby trénovacího a validačního datasetu pro zvýšení přesnosti klasifikace v dálkovém průzkumu Zeměcs_CZ
dc.typediplomová prácecs_CZ
dcterms.created2019
dcterms.dateAccepted2019-09-09
dc.description.departmentKatedra aplikované geoinformatiky a kartografiecs_CZ
dc.description.departmentDepartment of Applied Geoinformatics and Cartographyen_US
dc.description.facultyPřírodovědecká fakultacs_CZ
dc.description.facultyFaculty of Scienceen_US
dc.identifier.repId186583
dc.title.translatedTraining and validation dataset optimization for Earth observation classification accuracy improvementen_US
dc.contributor.refereePotůčková, Markéta
dc.identifier.aleph002293946
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineCartography and Geoinformaticsen_US
thesis.degree.disciplineKartografie a geoinformatikacs_CZ
thesis.degree.programGeografiecs_CZ
thesis.degree.programGeographyen_US
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csPřírodovědecká fakulta::Katedra aplikované geoinformatiky a kartografiecs_CZ
uk.taxonomy.organization-enFaculty of Science::Department of Applied Geoinformatics and Cartographyen_US
uk.faculty-name.csPřírodovědecká fakultacs_CZ
uk.faculty-name.enFaculty of Scienceen_US
uk.faculty-abbr.csPřFcs_CZ
uk.degree-discipline.csKartografie a geoinformatikacs_CZ
uk.degree-discipline.enCartography and Geoinformaticsen_US
uk.degree-program.csGeografiecs_CZ
uk.degree-program.enGeographyen_US
thesis.grade.csVelmi dobřecs_CZ
thesis.grade.enVery gooden_US
uk.abstract.csDiplomová práce se zabývá optimalizací trénovacího a validačního datasetu pro řízenou klasifikaci dat v DPZ. V rámci řešení práce jsou v území lesně-luční krajiny v Podkrkonoší prováděny pro dva klasifikační algoritmy (Maximum Likelihood - MLC a Support Vector Machine - SVM) experimenty s trénovacími a validačními daty. Práce vychází z předpokladu, že pro dosažení maximální přesnosti klasifikace je ideální podíl 1/3 trénovacích a 2/3 validačních dat (Foody, 2009). Další hypotézou práce byl předpoklad, že v případě klasifikace pomocí algoritmu SVM je pro dosažení stejné/podobné přesnosti klasifikace potřeba nižší počet trénovacích bodů než v případě klasifikačního algoritmu Maximum Likelihood (Foody, 2004). Cílem práce bylo testovat vliv podílu/množství trénovacích a validačních dat na přesnost klasifikace multispektrálních dat senzoru Sentinel-2A s využitím algoritmu Maximum Likelihood. Nejvyšší celkové přesnosti při využití klasifikačního algoritmu Maximum Likelihood bylo dosaženo pro podíl 375 trénovacích a 625 validačních bodů. Celková přesnost pro tento podíl byla 72,88 %. Teorie Foodyho (2009), že pro dosažení nejvyšší přesnosti klasifikace je ideální podíl 1/3 trénovacích a 2/3 validačních dat potvrzují výsledky hodnocení celkové přesnosti a Kappa koeficientu pro Maximum Likelihood. Avšak...cs_CZ
uk.abstract.enThis thesis deals with training dataset and validation dataset for Earth observation classification accuracy improvement. Experiments with training data and validation data for two classification algorithms (Maximum Likelihood - MLC and Support Vector Machine - SVM) are carried out from the forest-meadow landscape located in the foothill of the Giant Mountains (Podkrkonoší). The thesis is base on the assumption that 1/3 of training data and 2/3 of validation data is an ideal ratio to achieve maximal classification accuracy (Foody, 2009). Another hypothesis was that in a case of SVM classification, a lower number of training point is required to achieve the same or similar accuracy of classification, as in the case of the MLC algorithm (Foody, 2004). The main goal of the thesis was to test the influence of proportion / amount of training and validation data on the classification accuracy of Sentinel - 2A multispectral data using the MLC algorithm. The highest overal accuracy using the MLC classification algorithm was achieved for 375 training and 625 validation points. The overal accuracy for this ratio was 72,88 %. The theory of Foody (2009) that 1/3 of training data and 2/3 of validation data is an ideal ratio to achieve the highest classification accuracy, was confirmed by the overal accuracy and...en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Přírodovědecká fakulta, Katedra aplikované geoinformatiky a kartografiecs_CZ
thesis.grade.code2
dc.contributor.consultantLysák, Jakub
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO
dc.identifier.lisID990022939460106986


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV