Parallel Processing of Huge Astronomical Data
Paralelní zpracování velkých objemů astronomických dat
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/83094Identifiers
Study Information System: 134750
Collections
- Kvalifikační práce [11325]
Author
Advisor
Referee
Kruliš, Martin
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
5. 9. 2016
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Good
Keywords (Czech)
strojové učení, náhodné lesy, dolování z dat, paralelní programováníKeywords (English)
machine learning, random forests, data mining, parallel programmingDiplomová práce se zabývá analýzou a implementací algoritmu náhodných lesů. Náhodné lesy jsou algoritmem strojového učení pro klasifikaci dat. Cílem práce je implementace náhodných lesů pomocí technologií paralelního programování pro CPU a GPGU a referenční sériové implementace pro CPU. Dále pak porovnání a vyhodnocení výkonnosti a přesnosti těchto implementací na různých hardwarových platformách. Pro porovnání implementací budou použity různé datové soubory, důraz bude kladen na reálná astronomická data získaná z pozorování stelárních spekter. Bude posouzena vhodnost užití algoritmů náhodných lesů pro klasifikaci stelárních spekter jak z funkčního tak výkonnostního hlediska. Powered by TCPDF (www.tcpdf.org)
This master thesis focuses on the Random Forests algorithm analysis and implementation. The Random Forests is a machine learning algorithm targeting data classification. The goal of the thesis is an implementation of the Random Forests algorithm using techniques and technologies of parallel programming for CPU and GPGPU and also a reference serial implementation for CPU. A comparison and evaluation of functional and performance attributes of these implementations will be performed. For the comparison of these implementations various data sets will be used but an emphasis will be given to real world data obtained from astronomical observations of stellar spectra. Usefulness of these implementations for stellar spectra classification from the functional and performance view will be performed. Powered by TCPDF (www.tcpdf.org)