Linked Data Integration
Integrade Linked Data
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/52060Identifikátory
SIS: 135463
Kolekce
- Kvalifikační práce [11196]
Autor
Vedoucí práce
Konzultant práce
Nečaský, Martin
Oponent práce
Klímek, Jakub
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
9. 9. 2013
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
Linked Data, datová integrace, datová kvalita, datové konfliktyKlíčová slova (anglicky)
Linked Data, data integration, data quality, conflict resolution, data fusionLinked Data je úspěšná forma publikování strukturovaných dat, která by mohla znamenat pro data to samé, co dokázal web pro dokumenty. Silná stránka Linked Data je jejich vhodnost pro integraci dat z více zdrojů. Integrace Linked Data otevírá dveře novým příležitostem, ale zároveň přináší nové výzvy. Je třeba vyvinout nové algoritmy a nástroje pokrývající všechny kroky datové integrace. Tato práce se zabývá tradičním postupem integrace dat a jeho aplikací na Linked Data, se zaměřením na řešení konfliktů, které se mohou objevit. Práce navrhuje nový algoritmus pro řešení konfliktů, který zároveň podporuje důvěru s pomocí informací o původu a analýzy kvality. Navržené algoritmy jsou implementované v rámci frameworku ODCleanStore pro integraci Linked Data.
Linked Data have emerged as a successful publication format which could mean to structured data what Web meant to documents. The strength of Linked Data is in its fitness for integration of data from multiple sources. Linked Data integration opens door to new opportunities but also poses new challenges. New algorithms and tools need to be developed to cover all steps of data integration. This thesis examines the established data integration proceses and how they can be applied to Linked Data, with focus on data fusion and conflict resolution. Novel algorithms for Linked Data fusion are proposed and the task of supporting trust with provenance information and quality assessment of fused data is addressed. The proposed algorithms are implemented as part of a Linked Data integration framework ODCleanStore.