Mining XML Integrity Constraints
Mining XML Integrity Constraints
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/33415Identifikátory
SIS: 76734
Kolekce
- Kvalifikační práce [10688]
Autor
Vedoucí práce
Konzultant práce
Holubová, Irena
Oponent práce
Svoboda, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
31. 1. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
XML, XML Schema, odvození schématu, integritní omezeníKlíčová slova (anglicky)
XML, XML Schema, schema inference, integrity constraintsNejduležitějšími integritními omezeními jsou v XML primární a cizí klíče. Obecně vzato jsou klíče základním kamenem k pochopení struktury a vlast- ností dat. Nabízejí nástroj, s jehož pomocí lze jednoznačně identifikovat jednotlivé řádky tabulky pomocí hodnot z dané množiny atributů. Z toho plyne, že klíče jsou důležité pro provádění základních databázových operací. Od té doby, kdy se XML stalo jedním z nejpoužívanějších jazyků pro výměnu informací na internetu, je všeobecně přijímáno jako model pro reprezentaci skutečných dat. Protože XML dokumenty mohou v podstatě mít jakoukoli semistrukturovanou formu, jsou mnohdy během procesu zpracování či mo- difikace dat vyžadována strukturální omezení (napřílad klíče). Tato omezení jsou definovaná ve schématu. I přes zjevné přínosy není bohužel přítomnost schématu povinná a k mnoha XML dokumentům není žádné schéma připo- jeno. Následkem toho nejsou pro tyto dokumenty specifikována ani žádná integritní omezení. Tato diplomová práce je zaměřená zejména na odvození primárních a cizích klíčů z XML dokumentů. 1
The most important integrity constraints in XML are primary keys and foreign keys. In general, keys are essential in understanding both the structure and properties of data. They provide an instrument by which va- lues from a given set of attributes uniquely identify tuples in a database. As a result, keys are important to main database operations. Since XML beco- mes lingua franca for data exchange on the web, it is widely accepted as a model of real world data. Because XML documents in general can appear in any semi-structured form, structural constraints (including keys) are often imposed on the data that are to be modified or processed These constra- ints are formally defined in a schema.Unfortunately, in spite of the obvious advantages, the presence of a schema is not mandatory and many XML do- cuments are not joined with any. Consequently, no integrity constratins are specified in those documents, neither. This thesis is mainly focused on the inference of primary and foreign keys from XML documents. 1