Využití prostorových dat v grafových neuronových sítích
Using spatial data in graph neural networks
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/202419Identifikátory
SIS: 278796
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Pilát, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Umělá inteligence
Katedra / ústav / klinika
Katedra softwaru a výuky informatiky
Datum obhajoby
4. 9. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
prostorová data|grafové neuronové sítě|predikceKlíčová slova (anglicky)
spatial data|graph neural networks|predictionTato práce zkoumá, jak lze do tabulkových dat zavést relační strukturu pomocí konstrukce grafů z prostorových příznaků a aplikace grafových neuronových sítí (GNN) za účelem zlepšení prediktivního modelování. Byl vyvinut modulární nástroj Enhancer, který tento proces automatizuje: umožňuje konfigurovatelné strategie tvorby hran, používá GNN a poskytuje strukturované vyhodnocení. Byly navrženy čtyři strategie přidávání hran a otestovány na syntetických a reálných datech. Experimenty ukazují, že pokud prostorové vztahy korelují s cílovou proměnnou, GNN výrazně překonávají běžné vícevrstvé neuronové sítě. U reálných dat jsou přínosy méně konzistentní, což zdůrazňuje význam vhodného návrhu hran. Systém zároveň poskytuje diagnostiku trénování a konzistentní porovnání výsledků. Práce představuje flexibilní rámec pro obohacení dat pomocí grafové struktury a demonstruje jeho přínos tam, kde je přítomna smysluplná prostorová struktura, čímž vytváří základ pro další rozšíření, například pro větší datasety nebo adaptivní konstrukci grafů.
This thesis investigates how relational structure can be introduced into tabular datasets by constructing graphs from spatial features and applying graph neural networks (GNNs) to enhance predictive modelling. A modular tool, Enhancer, was developed to automate this process, supporting configurable edge creation strategies, applying GNNs, and providing structured evaluation. Four edge creation strategies were proposed and evaluated across synthetic and real-world datasets. Experiments show that when spatial relationships correlate with the target variable, GNNs significantly outperform standard multilayer perceptrons. In real-world data, the benefit is less consistent, emphasising the importance of appropriate edge construction. The system also provides training, diagnostics and consistent comparison of results. The work introduces a flexible pipeline for graph-based data enhancement and shows its effectiveness when meaningful spatial structure is present, offering a base for future extensions such as larger datasets or adaptive graph construction.
