Extension of the video retrieval system PraK
Rozšíření systému PraK pro efektivní vyhledávání ve videu
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/202882Identifikátory
SIS: 284078
Kolekce
- Kvalifikační práce [11976]
Autor
Vedoucí práce
Oponent práce
Yaghob, Jakub
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika - Softwarové a datové inženýrství
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
9. 9. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
vyhledávání videí|výkon systému|CLIP|interaktivní vyhledáváníKlíčová slova (anglicky)
video retrieval|system performance|CLIP|interactive searchS rostoucí poptávkou po efektivním přístupu k video kolekcím nabývají na důležitosti interaktivní systémy pro vyhledávání ve videu. PraK, moderní interaktivní vyhledávací systém, je postaven na modulární architektuře, která kombinuje frontend umožňující efek- tivní dotazování a prohlížení s bezestavovým datovým modulem, jež efektivně zpracovává požadavky na předzpracovanou databázi videí. Tato diplomová práce rozšiřuje funkcio- nalitu systému ve čtyřech klíčových oblastech: Za prvé, s cílem zajistit odezvu i při zátěži byly vyvinuty různé architektonické varianty systému. Byly provedeny experimenty se si- mulacemi dotazování založenými na uživatelských záznamech a Markovových modelech. Ty ukázaly, že asynchronní zpracování a paralelní dotazování trvale dosahují nižší latence než dřívější návrhy. Za druhé proběhla uživatelská studie, která zkoumala vliv vizualizace výsledků - konkrétně jejich seskupení podle videí - na spokojenost a úspěšnost vyhledá- vání. Za třetí, vyhledávání bylo rozšířeno o podporu komplexních temporálních dotazů a byly testovány různé strategie pro kombinaci skóre jednotlivých sub-dotazů. Experi- menty ukázaly, že jednoduché sčítání poskytuje nejspolehlivější a nejstabilnější výsledky. Nakonec byl systém rozšířen o podporu vizuálních promptů a testován z hlediska jejich vlivu na...
With the increasing demand for efficient access to video collections, interactive video retrieval systems are gaining importance. PraK, a frontier of interactive retrieval sys- tems, builds upon a modular architecture that combines a frontend, allowing for efficient querying and browsing, with a stateless data service efficiently handling requests to a preprocessed video database. In this thesis, we extend the functionality of this retrieval pipeline in four key dimensions: First, to ensure responsiveness under load, several par- allelized architectural variants of the system were developed. Experiments established user log-based and Markov-based query simulations. They revealed that asynchronous processing and parallel service pipelines consistently achieve lower latency than earlier designs. Second, a user study was conducted to assess how result visualizations, specif- ically grouping by video, influence user satisfaction and search performance. Third, the retrieval engine was extended to support complex temporal queries, and various strate- gies for combining temporal subquery scores were tested. The experiments found that simple summation provided the most reliable and stable basis for ranking. Finally, the system was extended with support for visual prompts and evaluated for its ability to guide...
