Methods for effective querying of RDF data
Nástroje pro efektivní dotazování nad RDF daty
dissertation thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/34985Identifiers
Study Information System: 44191
Collections
- Kvalifikační práce [10691]
Author
Advisor
Referee
Svátek, Vojtěch
Benczúr, András
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
3. 9. 2010
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Pass
RDF je jedním ze základních stavebních kamenů sémantického webu. Je to nízkoúrovňový formát, který lze pouít pro vývoj sémantických aplikací. Schopnost položit a efektivně vyhodnotit dotaz je při tvorbě těchto aplikací nezbytnou podmínkou. Tato práce přistupuje k problému dotazování nad RDF daty ze tří stran. Za prvé, popisuje nástroj pro vizualizaci RDF dat, který umožňuje vývojářům získat lepší představu o struktuře a obsahu dat. Za druhé, práce popisuje rozšíření jazyka XQuery, které nám umožnilo přidat do něj možnost zpracování RDF dat. Hlavní myšlenkou je zavedení záznamů jakožto nového druhu hodnot. Posledním aspektem zahrnutým v této práci je otázka efektivního vyhodnocení dotazů. Za tímto účelem jsme navrhli platformu Bobox, která výrazně zjednodušuje vývoj aplikací pro paralelní zpracování rozsáhlých dat a podporuje kódovou i datovou paralelizaci.
The RDF is one of the basic building blocks of the Semantic Web. It is a low-level data format intended to be used by software developers to create semantic-enabled applications. The ability to place and efficiently evaluate queries is key in this scenario. In this thesis, we approach the problem of RDF querying from three different angles. First, we present an RDF visualization tool, that the developer can use to get an idea about the structure and contents of the data. Second, we have designed extensions of the XQuery language that allow us to give it RDF handling capabilities. The main contribution is introduction of records into the language. Third, to cover query evaluation, we have designed the Bobox parallel framework, which can be used to simplify development of parallel data processing applications. It provides both task and data parallelism.