Text mining in social network analysis
Dobývání znalostí z textů při analýze sociálních sítí
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/95400Identifiers
Study Information System: 164033
Collections
- Kvalifikační práce [11325]
Author
Advisor
Consultant
Zvirinský, Peter
Referee
Pešková, Klára
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Theoretical Computer Science and Mathematical Logic
Date of defense
29. 1. 2018
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
dolovanie dát, sociálne siete, klastrovanie, neurónové siete, hodnotiace algoritmy, CUDAKeywords (English)
data mining, social networks, clustering, neural networks, ranking algorithms, CUDANázov: Text mining in social network analysis Autor: Bc. Michal Hušek Katedra: Katedra teoretické informatiky a matematické logiky Vedúca práce: doc. RNDr. Iveta Mrázová, CSc., Katedra teoretické informatiky a matematické logiky Abstrakt: Sociálne siete sú v súčastnosti veľmi hodnotným zdrojom informácií. Táto práca sa zameriava na dolovanie dát pochádzajúcich zo sociálnych sietí. Pojednáva a analyzuje rôzne techniky dolovania dát, konkrétne klastrovanie, neurónové siete, hodnotiace algoritmy a histogramovú štatistiku. Väčšina zmienených algoritmov bola implementovaná a testovaná s dátami z reálnej sociálnej siete. V prípade, že to bolo zmyslupné, výsledky boli vzájomne porovnané. Pre výpočtovo náročné úlohy, konkrétne klastrovanie, boli použité grafické procesory na ich zrýchlenie. Testy takto upravených programov potvrdili nižšie časové nároky. Všetky vykonané analýzy sú však nezávislé na konkrétnej použitej sociálnej sieti. Kľúčové slová: dolovanie dát, sociálne siete, klastrovanie, neurónové siete, hodnotiace algoritmy, CUDA
Title: Text mining in social network analysis Author: Bc. Michal Hušek Department: Department of Theoretical Computer Science and Mathematical Logic Supervisor: doc. RNDr. Iveta Mrázová, CSc., Department of Theoretical Computer Science and Mathematical Logic Abstract: Nowadays, social networks represent one of the most important sources of valuable information. This work focuses on mining the data provided by social networks. Multiple data mining techniques are discussed and analysed in this work, namely, clustering, neural networks, ranking algorithms and histogram statistics. Most of the mentioned algorithms have been implemented and tested on real-world social network data and the obtained results have been mutually compared against each other whenever it made sense. For computationally demanding tasks, graphic processing units have been used in order to speed up calculations for vast amounts of data, e.g., during clustering. The performed tests have confirmed lower time requirements. All the performed analyses are, however, independent of the actually involved type of social network. Keywords: data mining, social networks, clustering, neural networks, ranking algorithms, CUDA