Automatic Generation of Synthetic XML Documents
Automatické generování umelých XML dokumentu
diploma thesis (NOT DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/62608Identifiers
Study Information System: 164833
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Klímek, Jakub
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
15. 6. 2015
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Fail
Keywords (Czech)
XML, generátor, testování, benchmark, umělá dataKeywords (English)
XML, generator, testing, benchmark, synthetic dataCílem této práce je prozkoumat možnosti a omezení v generování umelých XML dokumentu. První cást práce zkoumá vlastnosti nejpoužívanejších XML generátoru a porovnává je mezi sebou. Další cást práce popisuje návrh vlastního algoritmu na generování XML dat, který se zameruje na podmožinu hlavních charakteristik XML dat (pocet elementu, pocet atributu, fan-out, zmíšený obsah atd.). Hlavním cílem algoritmu je generování XML dokumentu použitím množiny jednoduchých nastavení. Poslední cást práce srovnává vlastní rešení s existujícími. Porovnání se zameruje na jednoduchost generování XML dokumentu, porovnání toho, jaké struktury je možné generátorem dosáhnout a nakonec porovnává vlastnosti podobných XML dat vytvorených ruznými XML generátory. Powered by TCPDF (www.tcpdf.org)
The aim of this thesis is to research the current possibilities and limitations of automatic generation of synthetic XML documents. The first part of the work discusses the properties of the most used XML data generators and compares them to each other. The next part of the thesis proposes an algorithm for XML data generation which focuses on subset of the main XML data characteristics (number of elements, number of attributes, fan-out, mixed contents etc.). The main target of the algorithm is to generate XML documents using a set of settings which are easy to understand. The last part of the work compares the proposed solution with the existing ones. The comparison focuses on how easy it is to generate XML documents, what structures can be created and finally it compares properties of the similar XML data created using different XML data generators. Powered by TCPDF (www.tcpdf.org)