Kompaktní sufixový automat v posuvném okně
Compact directed acyclic word graph in a sliding window
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/38712Identifikátory
SIS: 76644
Kolekce
- Kvalifikační práce [10691]
Autor
Vedoucí práce
Oponent práce
Senft, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra softwaru a výuky informatiky
Datum obhajoby
20. 6. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Kompaktní sufixový automat (CDAWG) je prostorově šetrnější variantou datové struktury pro indexaci slov zvané sufixový strom. Cílem této práce je implementace algoritmů pro CDAWG v posuvném okně a porovnání jejich vlastností. Posuvné okno je výhodné v případech, kdy není možné v paměti udržovat indexovou strukuturu pro celá indexovaná data. Jeden přesný posun okna je možné provést v čase lineárním k délce okna. Rovněž existuje aproximativní algoritmus vyžadující pro posun okna pouze konstantní čas. Korektnost tohoto algoritmu ovšem byla v této práci vyvrácena.
Compact directed acyclic word graph (CDAWG) is the space-efficient version of a text-indexing data structure called suffix tree. The goal of this work is an implementation and comparison of algorithms constructing CDAWG for text in a sliding window. Sliding window is favorable in cases when the index structure cannot be kept in memory for the whole indexed data. One exact move of the sliding window may be performed in linear time with respect to the length of the window. An approximative algorithm requiring only amortized constant time per one move has been developed, too. However, in this thesis, the correctness of this algorithm has been disproved.