Schema Inference for Multi-model Data
Odvozování schématu multi-model dat
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/173476Identifiers
Study Information System: 226926
Collections
- Kvalifikační práce [11363]
Author
Advisor
Consultant
Koupil, Pavel
Referee
Kopecký, Michal
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software and Data Engineering
Department
Department of Software Engineering
Date of defense
7. 6. 2022
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
Multi-model|Odvozování schématu|NoSQL databázeKeywords (English)
Multi-model|Schema inference|NoSQL databasesV posledných rokoch nabrali multimodelové databázy na popularite, pretože jed- notlivé modely lepšie vyhovujú rôznym doménam alebo prípadom použitia. NoSQL databázy sú neoddeliteľnou súčasťou multimodelového sveta veľkých a variabilných dá- tových sád. Aj keď je použitie týchto databáz relatívne jednoduché a praktické, v niek- torých prípadoch postrádame vhľad do štruktúry dát a informáciu o možnom prepojení medzi dátami v rôznych databázach a rôznych modeloch. Táto práca predstavuje nový prístup, ktorý generuje schému multimodelových dát, pričom sa berú do úvahy vzťahy medzi modelmi. Najprv analyzujeme existujúce prístupy navrhnuté pre samostatné mod- ely a poukážeme na ich hlavné nedostatky. Potom navrhneme univerzálny multimodelový prístup a implementujeme ho ako proof of concept, čiže overenie realizovateľnosti. 1
In recent years, multi-model databases have become very popular as the individual models better suit the different domains, use cases or scenarios. NoSQL databases are an integral part of the multi-model world of big and variable datasets. While the usage of these databases is relatively simple and functional, in some cases, we lack insight into the structure of the data and the possible interconnection between the data in various databases and different models. This thesis presents a novel approach that generates a schema of the multi-model data concerning the undeclared relationships between the models. Firstly we analyse the existing single-model approaches and point out the main flaws. We then propose the universal multi-model approach and implement it as a proof of concept. 1