| dc.contributor.advisor | Bednárek, David | |
| dc.creator | Kratochvíl, Miroslav | |
| dc.date.accessioned | 2023-12-16T07:26:58Z | |
| dc.date.available | 2023-12-16T07:26:58Z | |
| dc.date.issued | 2020 | |
| dc.identifier.uri | http://hdl.handle.net/20.500.11956/124231 | |
| dc.description.abstract | Tato práce studuje, implementuje a experimentuje se specifickými, aplikačně orien- tovanými přístupy pro prozkoumávání a dotazování multimediálních dat. První část práce zkoumá indexování komplexního prostoru chemických sloučenin a popisuje návrh vysoce výkonného systému pro dotazování v databázích malých molekul. Výsledný sys- tém je následně využit v širším kontextu federovaného vyhledávání v heterogenních dat- ech a metadatech souvisejících s chemickými informačními zdroji. V druhé části se práce zaměřuje na rychlou vizualizaci a prohledávání mnohadimenziálních dat pocháze- jících z jednobuněčné průtokové cytometrie. Ze samoorganizačních map odvozuje rychlé metody pro analýzu dat, a využívá je jako základ pro nový vizualizační algoritmus. Podobný přístup zpracování dat je nakonec využit pro vysoce interaktivní prohledávání multimediálních dat. Hlavní příspěvky a výsledky práce se sestávají z pokroku v opti- malizaci metod pro dotazování chemických dat implementovaných v databázi Sachem, federovaného rozhraní pro Sachem založeného na jazyce SPARQL které poskytuje pod- poru pro heterogenního dotazování, algoritmu EmbedSOM pro redukci dimenzionality, návrhu a implementace specifických analytických nástrojů pro průtokovou a hmotnos- tní cytometrii odvozených od algoritmu EmbedSOM, a návrhu a implementace... | cs_CZ |
| dc.description.abstract | This thesis studies, implements and experiments with specific application-oriented approaches for exploring and querying multi-dimensional datasets. The first part of the thesis scrutinizes indexing of the complex space of chemical compounds, and details a design of high-performance retrieval system for small molecules. The resulting system is then utilized within a wider context of federated search in heterogeneous data and metadata related to the chemical datasets. In the second part, the thesis focuses on fast visualization and exploration of many-dimensional data that originate from single- cell cytometry. Self-organizing maps are used to derive fast methods for analysis of the datasets, and used as a base for a novel data visualization algorithm. Finally, a similar approach is utilized for highly interactive exploration of multimedia datasets. The main contributions of the thesis comprise the advancement in optimization and methods for querying the chemical data implemented in the Sachem database cartridge, the federated, SPARQL-based interface to Sachem that provides the heterogeneous search support, dimensionality reduction algorithm EmbedSOM, design and implementation of the specific EmbedSOM-backed analysis tool for flow and mass cytometry, and design and implementation of the multimedia... | en_US |
| dc.language | English | cs_CZ |
| dc.language.iso | en_US | |
| dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
| dc.subject | vysokodimenzionální data | cs_CZ |
| dc.subject | vyhledávání informací | cs_CZ |
| dc.subject | chemoinformatika | cs_CZ |
| dc.subject | redukce dimenzionality | cs_CZ |
| dc.subject | cytometrie | cs_CZ |
| dc.subject | vyhledávání multimédií | cs_CZ |
| dc.subject | high-dimensional data | en_US |
| dc.subject | information retrieval | en_US |
| dc.subject | cheminformatics | en_US |
| dc.subject | dimensionality reduction | en_US |
| dc.subject | cytometry | en_US |
| dc.subject | multimedia retrieval | en_US |
| dc.title | High-performance exploration and querying of selected multi-dimensional spaces in life sciences | en_US |
| dc.type | dizertační práce | cs_CZ |
| dcterms.created | 2020 | |
| dcterms.dateAccepted | 2020-12-15 | |
| dc.description.department | Department of Software Engineering | en_US |
| dc.description.department | Katedra softwarového inženýrství | cs_CZ |
| dc.description.faculty | Faculty of Mathematics and Physics | en_US |
| dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
| dc.identifier.repId | 164334 | |
| dc.title.translated | Vysoce výkonné prohledávání a dotazování ve vybraných mnohadimenzionálních prostorech v přírodních vědách | cs_CZ |
| dc.contributor.referee | Glaab, Enrico | |
| dc.contributor.referee | Svozil, Daniel | |
| thesis.degree.name | Ph.D. | |
| thesis.degree.level | doktorské | cs_CZ |
| thesis.degree.discipline | Computer Science - Software Systems | en_US |
| thesis.degree.discipline | Informatika - Softwarové systémy | cs_CZ |
| thesis.degree.program | Computer Science - Software Systems | en_US |
| thesis.degree.program | Informatika - Softwarové systémy | cs_CZ |
| uk.thesis.type | dizertační práce | cs_CZ |
| uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
| uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
| uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
| uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
| uk.faculty-abbr.cs | MFF | cs_CZ |
| uk.degree-discipline.cs | Informatika - Softwarové systémy | cs_CZ |
| uk.degree-discipline.en | Computer Science - Software Systems | en_US |
| uk.degree-program.cs | Informatika - Softwarové systémy | cs_CZ |
| uk.degree-program.en | Computer Science - Software Systems | en_US |
| thesis.grade.cs | Prospěl/a | cs_CZ |
| thesis.grade.en | Pass | en_US |
| uk.abstract.cs | Tato práce studuje, implementuje a experimentuje se specifickými, aplikačně orien- tovanými přístupy pro prozkoumávání a dotazování multimediálních dat. První část práce zkoumá indexování komplexního prostoru chemických sloučenin a popisuje návrh vysoce výkonného systému pro dotazování v databázích malých molekul. Výsledný sys- tém je následně využit v širším kontextu federovaného vyhledávání v heterogenních dat- ech a metadatech souvisejících s chemickými informačními zdroji. V druhé části se práce zaměřuje na rychlou vizualizaci a prohledávání mnohadimenziálních dat pocháze- jících z jednobuněčné průtokové cytometrie. Ze samoorganizačních map odvozuje rychlé metody pro analýzu dat, a využívá je jako základ pro nový vizualizační algoritmus. Podobný přístup zpracování dat je nakonec využit pro vysoce interaktivní prohledávání multimediálních dat. Hlavní příspěvky a výsledky práce se sestávají z pokroku v opti- malizaci metod pro dotazování chemických dat implementovaných v databázi Sachem, federovaného rozhraní pro Sachem založeného na jazyce SPARQL které poskytuje pod- poru pro heterogenního dotazování, algoritmu EmbedSOM pro redukci dimenzionality, návrhu a implementace specifických analytických nástrojů pro průtokovou a hmotnos- tní cytometrii odvozených od algoritmu EmbedSOM, a návrhu a implementace... | cs_CZ |
| uk.abstract.en | This thesis studies, implements and experiments with specific application-oriented approaches for exploring and querying multi-dimensional datasets. The first part of the thesis scrutinizes indexing of the complex space of chemical compounds, and details a design of high-performance retrieval system for small molecules. The resulting system is then utilized within a wider context of federated search in heterogeneous data and metadata related to the chemical datasets. In the second part, the thesis focuses on fast visualization and exploration of many-dimensional data that originate from single- cell cytometry. Self-organizing maps are used to derive fast methods for analysis of the datasets, and used as a base for a novel data visualization algorithm. Finally, a similar approach is utilized for highly interactive exploration of multimedia datasets. The main contributions of the thesis comprise the advancement in optimization and methods for querying the chemical data implemented in the Sachem database cartridge, the federated, SPARQL-based interface to Sachem that provides the heterogeneous search support, dimensionality reduction algorithm EmbedSOM, design and implementation of the specific EmbedSOM-backed analysis tool for flow and mass cytometry, and design and implementation of the multimedia... | en_US |
| uk.file-availability | V | |
| uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
| thesis.grade.code | P | |
| uk.publication-place | Praha | cs_CZ |
| uk.embargo.reason | ochrana oprávněných zájmů třetích osob hodných zvláštního zřetele | cs |
| uk.embargo.reason | protection of the legitimate interests of third parties worthy of special consideration | en |
| uk.thesis.defenceStatus | O | |
| dc.identifier.lisID | 990024224270106986 | |