Komunity a jejich detekce v sociálních sítích
Communities and their Detection in Social Networks
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/148374Identifiers
Study Information System: 232240
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Vomlelová, Marta
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Department of Theoretical Computer Science and Mathematical Logic
Date of defense
10. 9. 2021
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
dobývání znalostí|sociální sítě|detekce komunit|reprezentace znalostíKeywords (English)
data mining|social networks|community detection|knowledge representationAnalýza sociálních sítí se dá využít ke zkoumání struktury společnosti, jejího vývoje a chování lidí v ní. V této bakalářské práci jsme se zaměřili především na detekci komunit v sociálních sítích. Představili jsme základní způsoby analýzy významných vrcholů v síti. Rozebrali jsme několik různých přístupů k detekci komunit - detekce hierarchické struk- tury sítě, překrývajících se komunit a komunit v dynamických sítích. Představili jsme funkci zvanou modularita a její využití při detekci komunit. Práce se následně blíže za- měřuje na implementaci několika algoritmů (Lovaňský algoritmus, algoritmus klastrování pomocí hran, SCAN, DSCAN) v jazyce Python s použitím knihovny NetworkX. Tyto algoritmy jsme následně aplikovali na e-mailovou síť zaměstnanců firmy Enron. V práci jsme se pokusili odhalit komunity v této síti a vliv událostí, které zasáhly firmu, na jejich strukturu. 1
Social networks analysis can be used to study the society's structure, its development and the people's behavior. In this bachelor thesis, we focus mainly on detecting commu- nities in social networks. We introduce the basic methods for significant nodes analysis. We discuss several different approaches to detecting communities, namely detecting hi- erarchical network structure, overlapping communities and communities in dynamic ne- tworks. We introduce a function called 'modularity' and describe its use in community detection. The work then focuses on implementing several algorithms (Louvain algorithm, Link clustering algorithm, SCAN, DSCAN) in Python using the NetworkX library. We then applied the algorithms to Enron employees e-mail network and attempted to reveal communities in it and describe how their structure was affected by major events in the company. 1