Show simple item record

Vylepšení distribuovaného dotazovacího systému pro velká grafová data
dc.contributor.advisorYaghob, Jakub
dc.creatorFaltín, Tomáš
dc.date.accessioned2024-04-08T13:13:55Z
dc.date.available2024-04-08T13:13:55Z
dc.date.issued2023
dc.identifier.urihttp://hdl.handle.net/20.500.11956/188242
dc.description.abstractGraph pattern matching queries enable flexible graph exploration, similar to what SQL provides for relational databases. In this thesis, we design and improve key compo- nents of a distributed in-memory graph querying engine. First, we optimize a distributed depth-first search (DFS) asynchronous pattern matching algorithm by combining it with breadth-first search (BFS), thus improving the overall engine performance by leveraging strengths of both approaches: ability to strictly bound the consumed memory of DFS and better parallelization, locality, and load balancing of BFS. Second, we further ex- tend the distributed pattern matching with a novel solution for reachability regular path queries (RPQs) that supports variable-length patterns based on regular expressions. Our design retains the underlying runtime characteristics, allowing for efficient memory con- trol during path exploration with great performance and scalability. Third, we improve query planning, which is one of the most crucial aspects impacting the performance of any querying system. Choosing the "best" query plan is challenging due to the many aspects influencing the performance, especially in a distributed system. We present a lightweight mechanism for gathering runtime information, which can be used to select the most effective query plan...en_US
dc.description.abstractGrafové dotazy sloužící k vyhledávání vzorů v grafech dovolují flexibilní zkoumání grafů podobně jako SQL relačním datům. V této práci navrhujeme a vylepšujeme klíčové komponenty distribuovaného grafového dotazovacího systému běžícího pouze v hlavní paměti. Zaprvé jsme optimalizovali vyhledávání vzorů, které používá distribuované asyn- chronní vyhledávání do hloubky (DFS) za pomocí prohledávání do šířky (BFS). Chytrou kombinací obou přístupů jsme využili jejich předností. DFS umožňuje striktně omezit spotřebovanou paměť a BFS zase umožňuje dosahovat lepších výkonů díky lepší par- alelizovatelnosti, vyvažování zátěže a lepší lokalitě přístupů. Zadruhé jsme představili originální algoritmus pro distribuované vyhledávání dosažitelných cest za pomocí reg- ulárních výrazů (anglicky RPQ). Tyto dotazy dovolují vyhledávat cesty libovolné délky za pomocí syntaxe podobné regulárním jazykům. Náš návrh zachovává vlastnosti DFS algoritmu, nad kterým je algoritmus postaven. Dovoluje efektivně kontrolovat spotřebu paměti během vyhledávání, a taktéž dosahuje skvělého výkonu a škálovatelnosti. Zatřetí jsme vylepšili plánování dotazů, což je jedna z nejdůležitějších součástí každého dota- zovacího systému, jelikož velkou měrou ovlivňuje jeho výkon. Ovšem vybrat "nejlepší" plán je velmi složité, jelikož výkon systému,...cs_CZ
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectdistribuované grafové databáze|distribuované zpracování grafů|distribuované dotazování v grafechcs_CZ
dc.subjectdistributed graph databases|distributed graph processing|distributed graph queryingen_US
dc.titleDistributed Graph Query Engine Improvements for Big Data Graphsen_US
dc.typedizertační prácecs_CZ
dcterms.created2023
dcterms.dateAccepted2023-12-11
dc.description.departmentDepartment of Software Engineeringen_US
dc.description.departmentKatedra softwarového inženýrstvícs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId177493
dc.title.translatedVylepšení distribuovaného dotazovacího systému pro velká grafová datacs_CZ
dc.contributor.refereeTommasini, Riccardo
dc.contributor.refereeVora, Keval
thesis.degree.namePh.D.
thesis.degree.leveldoktorskécs_CZ
thesis.degree.disciplineComputer Science - Software Systemsen_US
thesis.degree.disciplineInformatika - Softwarové systémycs_CZ
thesis.degree.programComputer Science - Software Systemsen_US
thesis.degree.programInformatika - Softwarové systémycs_CZ
uk.thesis.typedizertační prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwarového inženýrstvícs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software Engineeringen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csInformatika - Softwarové systémycs_CZ
uk.degree-discipline.enComputer Science - Software Systemsen_US
uk.degree-program.csInformatika - Softwarové systémycs_CZ
uk.degree-program.enComputer Science - Software Systemsen_US
thesis.grade.csProspěl/acs_CZ
thesis.grade.enPassen_US
uk.abstract.csGrafové dotazy sloužící k vyhledávání vzorů v grafech dovolují flexibilní zkoumání grafů podobně jako SQL relačním datům. V této práci navrhujeme a vylepšujeme klíčové komponenty distribuovaného grafového dotazovacího systému běžícího pouze v hlavní paměti. Zaprvé jsme optimalizovali vyhledávání vzorů, které používá distribuované asyn- chronní vyhledávání do hloubky (DFS) za pomocí prohledávání do šířky (BFS). Chytrou kombinací obou přístupů jsme využili jejich předností. DFS umožňuje striktně omezit spotřebovanou paměť a BFS zase umožňuje dosahovat lepších výkonů díky lepší par- alelizovatelnosti, vyvažování zátěže a lepší lokalitě přístupů. Zadruhé jsme představili originální algoritmus pro distribuované vyhledávání dosažitelných cest za pomocí reg- ulárních výrazů (anglicky RPQ). Tyto dotazy dovolují vyhledávat cesty libovolné délky za pomocí syntaxe podobné regulárním jazykům. Náš návrh zachovává vlastnosti DFS algoritmu, nad kterým je algoritmus postaven. Dovoluje efektivně kontrolovat spotřebu paměti během vyhledávání, a taktéž dosahuje skvělého výkonu a škálovatelnosti. Zatřetí jsme vylepšili plánování dotazů, což je jedna z nejdůležitějších součástí každého dota- zovacího systému, jelikož velkou měrou ovlivňuje jeho výkon. Ovšem vybrat "nejlepší" plán je velmi složité, jelikož výkon systému,...cs_CZ
uk.abstract.enGraph pattern matching queries enable flexible graph exploration, similar to what SQL provides for relational databases. In this thesis, we design and improve key compo- nents of a distributed in-memory graph querying engine. First, we optimize a distributed depth-first search (DFS) asynchronous pattern matching algorithm by combining it with breadth-first search (BFS), thus improving the overall engine performance by leveraging strengths of both approaches: ability to strictly bound the consumed memory of DFS and better parallelization, locality, and load balancing of BFS. Second, we further ex- tend the distributed pattern matching with a novel solution for reachability regular path queries (RPQs) that supports variable-length patterns based on regular expressions. Our design retains the underlying runtime characteristics, allowing for efficient memory con- trol during path exploration with great performance and scalability. Third, we improve query planning, which is one of the most crucial aspects impacting the performance of any querying system. Choosing the "best" query plan is challenging due to the many aspects influencing the performance, especially in a distributed system. We present a lightweight mechanism for gathering runtime information, which can be used to select the most effective query plan...en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrstvícs_CZ
thesis.grade.codeP
dc.contributor.consultantLozi, Jean-Pierre
dc.contributor.consultantTrigonakis, Vasileios
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record


© 2025 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV