Implementace vybraných databázových operací v paralelním prostředí
Implementation of selected database operations in parallel environment
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/55316Identifiers
Study Information System: 97039
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Lokoč, Jakub
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
27. 5. 2013
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Název práce: Implementace vybraných databázových operací v paralelním pro- středí Autor: Bc. Ján Majdan Katedra: Katedra softwarového inženýrství Vedoucí diplomové práce: RNDr. David Bednárek, Ph.D. Abstrakt: Předložená diplomová práce se zabývá možnostmi implementace da- tabázových operací v paralelním prostředí Bobox. Popisuje potřebné teore- tické znalosti z oblasti databází, a též algoritmy potřebné pro implementaci da- tabázových operací v hlavní paměti počítače. V textu jsou popsané možnosti pa- ralelní realizace databázových operací pomocí hašovacích tabulek. Představené jsou principy založené na sdílení hašovací tabulky, a taky předzpracování dat (lokální hašovací tabulka). Součástí diplomové práce je i paralelní implementace vybraných operací, která je založená na postupech představených v textu práce. Realizace zahrnuje taky měření výkonnosti implementace při různých stupních paralelizace. Naměřené výsledky jsou přehledně prezentované a analyzované z po- hledu škálovatelnosti paralelizace v prostředí Bobox. Klíčová slova: databázové operace, Bobox, paralelizace, hašování, předspracování dat 1
Title: Implementation of selected database operations in parallel environment Author: Bc. Ján Majdan Department: Department of Software Engineering Supervisor: RNDr. David Bednárek, Ph.D. Abstract: This thesis describes several design possibilities of database operations in a parallel environment called Bobox. First, the thesis covers theory of da- tabases as well as algorithms needed to implement database operations in main memory. Next part discusses the usage of hash tables to implement parallel data- base operations. The key principles discussed contain hashing approaches based on a shared hash table, as well as principles of data preprocessing (local hash Table). The thesis then describes practical usage of selected database operations, which were implemented based on the principles described in the first theory sec- tions. The implementation also involves performance measurement at different levels of parallelism. Finally, acquired results are analyzed and discussed in terms of scalability of parallelism and performance in the Bobox environment. Keywords: database operations, Bobox, parallelism, hashing, data preprocessing 1