Kompaktní popis adresářových stromů
Compact description of directory trees
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/101197Identifikátory
SIS: 200273
Kolekce
- Kvalifikační práce [11982]
Autor
Vedoucí práce
Oponent práce
Majerech, Vladan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra aplikované matematiky
Datum obhajoby
6. 9. 2018
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
hešování, adresářová struktura, konzistenceKlíčová slova (anglicky)
hashing, directory structure, consistencyNa světě existuje mnoho kopií dat uložených jako adresářové stromy, pro které je potřeba zajistit vzájemnou konzistenci. V této práci jsme vytvořili nový binární formát popisující adresářové stromy. Ten umožňuje zaznamenat názvy, zahešované obsahy souborů a další metadata. Na konzistenci dat se pak lze dotázat porovnáním dvou popisů. Tento formát byl navržen s důrazem na kompaktnost popisu a co nejvyšší rychlost jeho čtení. Dále byl napsán program, který tento popis umí pro daný adresářový strom sestavit a poté dva popisy porovnat. Pro co nejvyšší rychlost sestavení popisu využívá paralelizační techniky a stromové heše, přičemž bere ohled na vlastnosti pevných disků. 1
There exist many copies of data stored as directory trees whose consistency we need to verify. In this work we create a new binary format describing directory trees. It allows to record names, hashed contents, and other metadata of the files. In order to verify data consistency, we can compare two such descriptions. This format is designed with focus on its compactness and high read speed. We present a program which builds such description for a given tree and compares two descriptions. In order to maximize speed we use parallelization techniques and tree hashing, taking properties of hard disk drives into account. 1
