Community Detection and Link Prediction in Social Networks
Detekce komunit a predikce spojení v sociálních sítích
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/202393Identifikátory
SIS: 279920
Kolekce
- Kvalifikační práce [11987]
Autor
Vedoucí práce
Oponent práce
Hric, Jan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Umělá inteligence
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
4. 9. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
dobývání znalostí|sociální sítě|detekce významných uzlů|detekce komunit|predikce linků|reprezentace znalostíKlíčová slova (anglicky)
data mining|social networks|detection of influential individuals|community detection|link prediction|knowledge representationTáto bakalárska práca skúma vhodnosť rôznych nástrojov na analýzu sociálnych sietí pre slovenské verejné obstarávanie. Práca sa zameriava na identifikáciu vplyvných sub- jektov pomocou centralitných mier, odhaľovanie komunít a predikciu spojení pomocou topologických mier a prístupov na báze strojového učenia. Vytvorili sme sociálnu sieť z reálnych údajov o jednotlivých obstarávaniach, ktoré sme získali z webovej stránky Slovenského úradu pre verejné obstarávanie a namodelovali sme ju pomocou grafovej databázy Neo4j. Súčasťou práce je aj sprístupnenie vytvoreného datasetu na otvorené využitie odbornou komunitou. Experimentálne výsledky naznačujú, že pri predikcii lin- kov dosiahli metódy založené na topológii výrazne horšie výsledky ako prístupy založené na strojovom učení, a navyše nie sú škálovateľné pre veľké siete. Zistenia poukazujú na potenciál nástrojov určených na analýzu sociálnych sietí vo verejnom obstarávaní. Ti- eto analytické nástroje dokážu odhaliť skryté vzťahy v obstarávaní a tým zlepšiť jeho transparentnosť, pričom poskytujú základ pre budúce analytické nástroje.
This thesis explores the applicability of different social network analysis tools for Slovak public procurement. This research focuses on identifying influential entities via centrality measures, discovering communities, and conducting link prediction via both topology-based and machine learning-based approaches. We created a social network from real procurement data scraped from the Slovak Public Procurement Office's website and modeled it using the Neo4j graph database. As part of this thesis, we provide the dataset for open use by the community. Experiments conducted thus far revealed that, particularly for link prediction, topology-based measures performed significantly worse than machine learning-based approaches, and they also lack scalability for large networks. The findings showcase the potential of network-based analysis tools in public procurement. These tools can uncover implicit relationships, thus improving transparency in public procurement and providing a foundation for future analytical tools.
