Geographical Random Forest model evaluation in agricultural drought assessment
Evaluace geografickeho Random Forest algoritmu v posouzení sucha
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/150992Identifikátory
SIS: 221833
Kolekce
- Kvalifikační práce [21483]
Autor
Vedoucí práce
Oponent práce
Brůha, Lukáš
Fakulta / součást
Přírodovědecká fakulta
Obor
Kartografie a geoinformatika
Katedra / ústav / klinika
Katedra aplikované geoinformatiky a kartografie
Datum obhajoby
15. 9. 2021
Nakladatel
Univerzita Karlova, Přírodovědecká fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
sucho, posouzení zranitelnosti, Geographical Random ForestKlíčová slova (anglicky)
drought, vulnerability assessment, Geographical Random ForestSucho je přírodní katastrofa, která negativně ovlivňuje miliony lidí a způsobuje obrovské ekonomické ztráty. Tato práce zkoumá zemědělské sucho v Česku pomocí algoritmů strojového učení. Použité statistické modely byly Random Forest (RF), Geographic Random Forest (GRF) a Locally Tuned Geographic Random Forest (LT GRF). GRF se skládá z několika RF modelů vytréno- vaných na podmnožinu původních dat. Konečná predikce je váženým součtem predikce lokálního a globálního modelu. Velikost podmnožiny je určena laditel- ným parametrem. LT GRF řeší prostorovou variabilitu velikosti podmnožiny a lokální váhu. Během procesu ladění jsou pro každé místo nalezeny optimální parametry a poté interpolovány pro neznámé oblasti. Tato práce si klade za cíl vyhodnotit přesnost každého modelu a porovnat výstup důležitosti faktorů GRF s globálním modelem. K vytvoření mapy zranitelnosti vůči suchu v Česku se využije důležitost meteorologických faktorů. Vytvořené hodnocení je porovnáno se stávajícími projekty zranitelnosti suchem. 1
Drought is a natural disaster, which negatively affects millions of people and causes huge economic losses. This thesis investigates agricultural drought in Czechia using machine learning algorithms. The statistical models utilised were Random Forest (RF), Geographical Random Forest (GRF) and Locally Tuned Geographical Random Forest (LT GRF). GRF consists of several RF models trained on a subset of original data. The final prediction is a weighted sum of the prediction of a local and global model. The size of the subset is determined by the tunable parameter. LT GRF addresses spatial variability of subset size and local weight. During the tuning process, optimal parameters are found for every location and then interpolated for unknown regions. The thesis aims to evaluate the performance of each model and compare GRF feature importance output with the global model. The best model features meteorological impor- tances are used to create a drought vulnerability map of Czechia. Produced assessment is compared to existing drought vulnerability projects. 1
