Sběratel informací o výkonu dotazování v multi-modelových databázových systémech
Collector of information about query performance in multi-model database systems
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/202335Identifiers
Study Information System: 254993
Collections
- Kvalifikační práce [11981]
Author
Advisor
Referee
Bártík, Jáchym
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science with specialisation in Databases and Web
Department
Department of Software Engineering
Date of defense
4. 9. 2025
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Good
Keywords (Czech)
Databázové metriky|Mutli-modelová data|Výkon dotazů|Relační databáze|Grafové databáze|Dokumentové databáze|Datová sadaKeywords (English)
Database metrics|Mutli-model data|Query performance|Relational databases|Graph databases|Document databases|DatasetVe světě se můžeme potkat s množstvím optimalizačních technik pro dotazování se nad relačními daty, ale neexistuje alternativa pro data multi-modelová. Pro vytvoření takového nástroje je ovšem potřebné sehnat adekvátní datovou sadu, nad níž by bylo možné model natrénovat. Jako je tomu u samotného modelu, vhodná datová sada zatím nebyla vytvořena. V této práci se tedy zaměříme na tvorbu nástroje, pomocí kterého bude možné vytvořit datovou sadu, která by umožnila tvorbu optimalizačního nástroje založeném na strojovém učení. Nejprve provedeme analýzu nástrojů, které jsou aktuálně dostupné a umožňují sběr statistických metadat z databázových systémů. Následně vybe- reme vhodné parametry, které by bylo dobré zahrnout do výsledné datové sady. Nakonec vytvoříme a popíšeme nástroj, jenž celý proces tvorby datové sady automatizuje. 1
In the world we can encounter many optimization techniques for querying over rela- tional data, but none for multi-model data. To create one, we need to get an adequate dataset over which to train the model. As is the case with the model itself, a suitable dataset has not yet been created. Thus, in this thesis we will focus on creating a tool that can be used to create a dataset that would enable the creation of a machine learn- ing based optimization tool. First, we will analyze the tools that are currently available and allow the collection of statistical metadata from database systems. We then select suitable parameters that would be good to include in the resulting dataset. Finally, we create and describe a tool that automates the whole process of creating the dataset. 1
