Analysis of Real-World XML Queries
Analýza reálných XML dotazů
diplomová práce (NEOBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/72151Identifikátory
SIS: 138108
Kolekce
- Kvalifikační práce [10678]
Autor
Vedoucí práce
Oponent práce
Klímek, Jakub
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
8. 9. 2014
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Neprospěl
Klíčová slova (česky)
analýza, reální XQuery, XQConverter, crawlerKlíčová slova (anglicky)
analysis, real-world XQuery, XQConverter, crawlerÚčelem této práce bylo shromáždit a analyzovat běžně používané XQuery programy. Ke sběru dat z internetu je nejčastěji využíván program zvaný crawler. Součástí této práce byla analýza různých crawlerů a výběr nejvhodnějšího z nich. Tento crawler byl následně upraven tak, aby nevytěžoval servery, sbíral správná data a bylo možné jeho činnost pozastavit. Před započetím sběru dat ještě zbývalo určit, kde bude vhodné začít a jak dlouho by celý proces měl trvat. Po skončení hlavní části pak ještě zbývalo data vyčistit a ověřit jejich validitu. Předmětem následných analýz bylo použití dotazovacího jazyka XQuery a výskyt jeho gramatických symbolů. K provedení těchto analýz byla použita kombinace XPath dotazovacích výrazů a XML reprezentace XQuery programů. Pro vytvoření zmíněných reprezentací byl použit nástroj XQConveror. Hlavní přínosem této práce jsou vlastní sběr dat a také první analýza běžně používaných XQuery programů.
The aim of this master thesis was to gather and analyze the real-world XQuery programs. The data gathering process is performed using the crawler. The thesis contains analysis of different crawlers and the most suitable crawler was chosen. The crawler was modified, so that it did not overload servers, gathered the right data and was able to pause. Before the data gathering we analyzed where to start gathering and how long should it took. When the data was gathered, they needed to be cleaned and validated. The subjects of the analyses were use of the XQuery language and occurrences of XQuery grammar symbols. Combination of the XML representation of XQuery programs and XPath expressions for querying this representation was used to perform these analyses. XQConveror was used to create this XML representation. The main contributions of this thesis are the gathered data and the first real-world XQuery programs analysis.