Automatic Generation of Synthetic XML Documents
Automatické generování umelých XML dokumentu
diploma thesis (NOT DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/59048Identifiers
Study Information System: 57044
CU Caralogue: 990016223820106986
Collections
- Kvalifikační práce [11338]
Author
Advisor
Referee
Malý, Jakub
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
9. 9. 2013
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Fail
Keywords (Czech)
XML, generátor, testování, benchmark, umělá dataKeywords (English)
XML, generator, testing, benchmark, synthetic dataCílem této práce je prozkoumat možnosti a omezení v generování umělých XML dokumentů. První část práce zkoumá vlastnosti nejpoužívanějších XML generátorů a porovnává je mezi sebou. Další část práce popisuje návrh vlastního algoritmu na generování XML dat, který se zaměřuje na podmožinu hlavních charakteristik XML dat (počet elementů, počet atributů, fan-out, zmíšený obsah atd.). Hlavním cílem algoritmu je generování XML dokumentů použitím množiny jednoduchých nastavení. Poslední část práce srovnává vlastní řešení s existujícími. Porovnání se zaměřuje na jednoduchost generování XML dokumentů, porovnání toho, jaké struktury je možné generátorem dosáhnout a nakonec porovnává vlastnosti podobných XML dat vytvořených různými XML generátory. Powered by TCPDF (www.tcpdf.org)
The aim of this thesis is to research the current possibilities and limitations of automatic generation of synthetic XML documents. The first part of the work discusses the properties of the most used XML data generators and compares them to each other. The next part of the thesis proposes an algorithm for XML data generation which focuses on subset of the main XML data characteristics (number of elements, number of attributes, fan-out, mixed contents etc.). The main target of the algorithm is to generate XML documents using a set of settings which are easy to understand. The last part of the work compares the proposed solution with the existing ones. The comparison focuses on how easy it is to generate XML documents, what structures can be created and finally it compares properties of the similar XML data created using different XML data generators. Powered by TCPDF (www.tcpdf.org)