Komprese bitových map pomocí Grayova kódu
Gray code based bitmap compression
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/38715Identifikátory
SIS: 76660
Kolekce
- Kvalifikační práce [10690]
Autor
Vedoucí práce
Oponent práce
Gregor, Petr
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra softwaru a výuky informatiky
Datum obhajoby
20. 6. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Klíčová slova (česky)
bitmapový index, komprese, Grayův kód, WAHKlíčová slova (anglicky)
bitmap index, data compression, Gray code, WAHPráce se zabývá kompresí bitmapových indexů. Ke zmenšení bitmapových indexů se často používají specializované algoritmy, které hledají dlouhé řetězce stejných bitů. Řádky indexu je pak výhodné vhodně přerozdělit, aby algoritmus poskytoval co nejlepší kompresní poměr. Nalezení optimálního přerozdělení je sice NP-těžký problém, existují však účinné heuristiky, které setřídí index v polynomiálním čase. V poslední době se objevily experimentální studie, které místo klasického lexikografického třídění využívají třídění podle Grayova kódu. V této práci nahrazujeme klasický Grayův kód novou konstrukcí, která generuje komprimovaný Grayův kód. Konstrukci podrobně popisujeme a na reálných i náhodně generovaných datech zkoumáme, zda je při kompresi algoritmem WAH tento kód účinnější než klasický.
This thesis deals with a compression of bitmap indexes. Bitmap indexes may be reduced through specialized algorithms which look for long runs of identical bits. To improve the compression ratio, it is useful to reorder the rows of the index. Even though the problem of optimal reordering is NP-hard, there are efficient heuristics which reorder the index in polynominal time. Recent results suggest that Gray code based sorting provides an effective alternative to the classical lexicographical sorting. In this thesis, we replace the classical Gray code with a novel construction which generates a compressed Gray code. We describe this construction in detail and use both real-life and randomly generated datasets to test whether the novel construction is more efficient than the classical one when used in the WAH compression scheme.