Dlouhodobé uchování webového obsahu
Long-term Preservation of Web Content
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/82967Identifikátory
SIS: 129352
Katalog UK: 990021066810106986
Kolekce
- Kvalifikační práce [24998]
Autor
Vedoucí práce
Oponent práce
Souček, Martin
Fakulta / součást
Filozofická fakulta
Obor
Studia nových médií
Katedra / ústav / klinika
Ústav informačních studií - studia nových médií
Datum obhajoby
14. 9. 2016
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
webová archivace, webový obsah, dlouhodobá archivace digitálních dokumentů, migrace, emulace, metadata, Národní knihovna České republikyKlíčová slova (anglicky)
web archiving, web content, long-term preservation of digital information, migration, emulation, metadata, National Library of the Czech RepublicTato práce řeší problematiku dlouhodobé ochrany digitálních dokumentů, konkrétně webových stránek. Cílem práce je tuto problematiku vysvětlit, vymezit rozdíly mezi různými přístupy k ní, popsat možnosti dlouhodobého uchování webového obsahu, jako je migrace a emulace nebo vysvětlit jaká jsou rizika a výzvy při zavádění těchto strategií. Na základě této práce je možné si udělat představu o tom, jaké nové problémy přináší snaha o dlouhodobou ochranu webového obsahu a jaká jejich řešení jsou v současné době dostupná. Zároveň práce přináší pohled, jakým způsobem k problematice přistupují některé významné zahraničních institucí. Hlavním výsledkem této práce je podrobná analýza strategie dlouhodobé digitální ochrany Národní knihovny České republiky, která je jedinou institucí zabývající se v takovém rozsahu ochranou českého webu. V práci je podrobně popsán proces přípravy dat, proces vytváření metadat a proces uložení do LTP úložiště NK ČR, včetně příkladů a jejich vysvětlení. V závěru práce je přiblíženo, jako další kroky český webový archiv čekají, aby byl schopný svá data dlouhodobě ochránit. Powered by TCPDF (www.tcpdf.org)
This work describes the long term preservation of digital documents, particularly websites. The aim of this work is to give an explanation of the long term preservation, to define the differences between various approaches and to describe long term preservation of web content possibilities such as migration or emulation. It also explains risks and challenges of these strategies. It discusses new problems which the long term preservation aim leads to. It also describes possible solutions as well as it describes the situation in selected significant foreign institutions. The main aim of this work is detailed analysis of long term preservation strategy in theNational Library of the Czech Republic, which is the only institution engaged in the preservation of Czech web. The process of data preparation, metadata creation and data storing in the long term repository of the Czech National Library is thoroughly described, including examples and their explanation. Future actions of long term preservation in the Czech Web Archive are articulated in the conclusion. Powered by TCPDF (www.tcpdf.org)
