Social networks and data mining
Sociální sítě a dobývání znalostí
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/65996Identifikátory
SIS: 136506
Kolekce
- Kvalifikační práce [10690]
Autor
Vedoucí práce
Oponent práce
Neruda, Roman
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
26. 5. 2014
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
sociální sítě, dobývání znalostí, předzpracování dat, extrakce znalostí, klasifikaceKlíčová slova (anglicky)
social networks, data mining, data pre-processing, knowledge extraction, classificationAktuální techniky z oblasti dobývání znalostí představují moderní přístup vhodný pro analýzu velkého množství dat i extrakci potenciálně užitečných informací z těchto dat. Práce je věnována detailnímu studiu jednotlivých kroků procesu dobývání znalostí, včetně přípravy dat, jejich ukládání, čištění, analýzy i vizualizace získaných výsledků. Velký důraz je v práci kladen na efektivní analýzu dat veřejně dostupných z Insolvenčního rejstříku České republiky, který obsahuje údaje o insolvenčních řízeních zahájených v České republice po 1. lednu 2008. S ohledem na specifika uvažovaného typu dat se zaměříme zejména na popis, implementaci, testování a vyhodnocení vybraných metod dobývání znalostí. Mezi jinými budou studované techniky zahrnovat i analýzu nákupního košíku, Bayesovské sítě a metody pro analýzu sociálních sítí. Výsledky provedených analýz dokumentují některé ze sociálních vztahů patrných ve struktuře současné české společnosti.
Recent data mining methods represent modern approaches capable of analyzing large amounts of data and extracting meaningful and potentially useful information from it. In this work, we discuss all the essential steps of the data mining process - including data preparation, storage, cleaning, data analysis as well as visualization of the obtained results. In particular, this work is focused on the data available publicly from the Insolvency Register of the Czech Republic, that comprises all insolvency proceedings commenced after 1. January 2008 in the Czech Republic. With regard to the considered type of data, several data mining methods have been discussed, implemented, tested and evaluated. Among others, the studied techniques include Market Basket Analysis, Bayesian networks and social network analysis. The obtained results reveal several social patterns common in the current Czech society.