Inference of XML Integrity Constraints
Odvozování integritních omezení v XML
rigorous thesis (RECOGNIZED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/61278Identifiers
Study Information System: 145986
Collections
- Kvalifikační práce [10150]
Author
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software systems
Department
Department of Software Engineering
Date of defense
28. 2. 2014
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Recognized
Keywords (Czech)
XML, ID atributy, odvozováníKeywords (English)
XML, ID attributes, inferenceTato práce navazuje na dřívější pokusy odvodit (inferovat) schéma existujících XML dokumentů. Jelikož je odvozování struktury již relativně dobře popsáno, soustředíme se na integritní omezení. Několik jich popisujeme, pozornost pak soustředíme na ID/IDREF/IDREFS atributy z DTD. Na bázi článku od Barbosa a Menelzon (2003) stavíme heuristický přístup k problému hledání optimální sady ID atributů, jeho funkčnost a vhodnost pak ověřujeme na škále experimentů. Powered by TCPDF (www.tcpdf.org)
In this work we expand upon the previous efforts to infer schema information from existing XML documents. We find the inference of structure to be sufficiently researched and focus further on integrity constraints. After briefly introducing some of them we turn our attention to ID/IDREF/IDREFS attributes in DTD. Building on the research by Barbosa and Menelzon (2003) we introduce a heuristic approach to the problem of finding an optimal ID set. The approach is evaluated and tuned in a wide range of experiments. Powered by TCPDF (www.tcpdf.org)