Verzovaná komprese textových dokumentů
Versioning compression of text documents.
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/10458Identifiers
Study Information System: 46404
Collections
- Kvalifikační práce [10150]
Author
Advisor
Referee
Lánský, Jan
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Department of Software Engineering
Date of defense
26. 6. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
V předložené práci studujeme efektivní správu různých verzí textových dokumentů. Výsledkem práce je aplikace pro řízení takového archivu. Aplikace umožňuje maximální využití podobnosti verzí soubor pro dosažení minimální redundance uložené informace. Aplikace využívá metody rozdílového porovnávání soubor (Diff ), obohacenou o rozlišování menších změn - oproti původnímu Diff u může efektivně zachytit i změny na úrovni slov či znaků. Citlivost diffu se dynamicky mění na různých úsecích textového dokumentu v závislosti na hustotě a charakteru provedených změn. To zajišťuje dostatečnou přesnost pro úspornou velikost archivu v kombinaci se stále velmi dobrou rychlostí aplikace. Pro další zmenšení velikosti archivu je využita komprese metodou zip pomocí volně šířitelné knihovny Info-ZIP.
In the work we study e ective management of di erent versions of text les. Outcome of the work is an application managing such archives. The application is able to maximally exploit a similarity between versions of les to avoid redundancy of stored information. Application uses the method of Diff erential File Comparision (diff ), improved by additional smaller dividing entities. Contrary to the the classical di it recogizes also word and character diff erences. Precision of the di vary along a text le according to density and character of differences. Due to that a smaller archive is made and moreover in shorter time. Extra reduction of the archive is achieved by the use of the zip compression method implemented by freeware library Info-ZIP.