Komprese bitových map pomocí Grayova kódu

Škorvaga, David

Gray code based bitmap compression

bakalářská práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (56.72Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/38715

Identifikátory

SIS: 76660

Katalog UK: 990013748380106986

Oponent práce

Gregor, Petr

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Obecná informatika

Katedra / ústav / klinika

Katedra softwaru a výuky informatiky

Datum obhajoby

20. 6. 2011

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Čeština

Známka

Velmi dobře

Klíčová slova (česky)

bitmapový index, komprese, Grayův kód, WAH

Klíčová slova (anglicky)

bitmap index, data compression, Gray code, WAH

Práce se zabývá kompresí bitmapových indexů. Ke zmenšení bitmapových indexů se často používají specializované algoritmy, které hledají dlouhé řetězce stejných bitů. Řádky indexu je pak výhodné vhodně přerozdělit, aby algoritmus poskytoval co nejlepší kompresní poměr. Nalezení optimálního přerozdělení je sice NP-těžký problém, existují však účinné heuristiky, které setřídí index v polynomiálním čase. V poslední době se objevily experimentální studie, které místo klasického lexikografického třídění využívají třídění podle Grayova kódu. V této práci nahrazujeme klasický Grayův kód novou konstrukcí, která generuje komprimovaný Grayův kód. Konstrukci podrobně popisujeme a na reálných i náhodně generovaných datech zkoumáme, zda je při kompresi algoritmem WAH tento kód účinnější než klasický.

Abstrakt (anglicky)

This thesis deals with a compression of bitmap indexes. Bitmap indexes may be reduced through specialized algorithms which look for long runs of identical bits. To improve the compression ratio, it is useful to reorder the rows of the index. Even though the problem of optimal reordering is NP-hard, there are efficient heuristics which reorder the index in polynominal time. Recent results suggest that Gray code based sorting provides an effective alternative to the classical lexicographical sorting. In this thesis, we replace the classical Gray code with a novel construction which generates a compressed Gray code. We describe this construction in detail and use both real-life and randomly generated datasets to test whether the novel construction is more efficient than the classical one when used in the WAH compression scheme.

Citace dokumentu

Metadata

Zobrazit celý záznam