Parallel Processing of Huge Astronomical Data
Paralelní zpracování velkých objemů astronomických dat
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/83094Identifikátory
SIS: 134750
Kolekce
- Kvalifikační práce [10690]
Autor
Vedoucí práce
Oponent práce
Kruliš, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
5. 9. 2016
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Dobře
Klíčová slova (česky)
strojové učení, náhodné lesy, dolování z dat, paralelní programováníKlíčová slova (anglicky)
machine learning, random forests, data mining, parallel programmingDiplomová práce se zabývá analýzou a implementací algoritmu náhodných lesů. Náhodné lesy jsou algoritmem strojového učení pro klasifikaci dat. Cílem práce je implementace náhodných lesů pomocí technologií paralelního programování pro CPU a GPGU a referenční sériové implementace pro CPU. Dále pak porovnání a vyhodnocení výkonnosti a přesnosti těchto implementací na různých hardwarových platformách. Pro porovnání implementací budou použity různé datové soubory, důraz bude kladen na reálná astronomická data získaná z pozorování stelárních spekter. Bude posouzena vhodnost užití algoritmů náhodných lesů pro klasifikaci stelárních spekter jak z funkčního tak výkonnostního hlediska. Powered by TCPDF (www.tcpdf.org)
This master thesis focuses on the Random Forests algorithm analysis and implementation. The Random Forests is a machine learning algorithm targeting data classification. The goal of the thesis is an implementation of the Random Forests algorithm using techniques and technologies of parallel programming for CPU and GPGPU and also a reference serial implementation for CPU. A comparison and evaluation of functional and performance attributes of these implementations will be performed. For the comparison of these implementations various data sets will be used but an emphasis will be given to real world data obtained from astronomical observations of stellar spectra. Usefulness of these implementations for stellar spectra classification from the functional and performance view will be performed. Powered by TCPDF (www.tcpdf.org)