Sběratel informací o výkonu dotazování v multi-modelových databázových systémech
Collector of information about query performance in multi-model database systems
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/202335Identifikátory
SIS: 254993
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Bártík, Jáchym
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Databáze a web
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
4. 9. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Dobře
Klíčová slova (česky)
Databázové metriky|Mutli-modelová data|Výkon dotazů|Relační databáze|Grafové databáze|Dokumentové databáze|Datová sadaKlíčová slova (anglicky)
Database metrics|Mutli-model data|Query performance|Relational databases|Graph databases|Document databases|DatasetVe světě se můžeme potkat s množstvím optimalizačních technik pro dotazování se nad relačními daty, ale neexistuje alternativa pro data multi-modelová. Pro vytvoření takového nástroje je ovšem potřebné sehnat adekvátní datovou sadu, nad níž by bylo možné model natrénovat. Jako je tomu u samotného modelu, vhodná datová sada zatím nebyla vytvořena. V této práci se tedy zaměříme na tvorbu nástroje, pomocí kterého bude možné vytvořit datovou sadu, která by umožnila tvorbu optimalizačního nástroje založeném na strojovém učení. Nejprve provedeme analýzu nástrojů, které jsou aktuálně dostupné a umožňují sběr statistických metadat z databázových systémů. Následně vybe- reme vhodné parametry, které by bylo dobré zahrnout do výsledné datové sady. Nakonec vytvoříme a popíšeme nástroj, jenž celý proces tvorby datové sady automatizuje. 1
In the world we can encounter many optimization techniques for querying over rela- tional data, but none for multi-model data. To create one, we need to get an adequate dataset over which to train the model. As is the case with the model itself, a suitable dataset has not yet been created. Thus, in this thesis we will focus on creating a tool that can be used to create a dataset that would enable the creation of a machine learn- ing based optimization tool. First, we will analyze the tools that are currently available and allow the collection of statistical metadata from database systems. We then select suitable parameters that would be good to include in the resulting dataset. Finally, we create and describe a tool that automates the whole process of creating the dataset. 1
