Analýza biografických vyprávění pamětníků s užitím počítačové textové analýzy
Analysis of biographical narratives using computer-assisted text analysis
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/43161Identifiers
Study Information System: 110683
Collections
- Kvalifikační práce [16295]
Author
Advisor
Referee
Soukup, Petr
Faculty / Institute
Faculty of Social Sciences
Discipline
Sociology
Department
Department of Sociology
Date of defense
25. 6. 2012
Publisher
Univerzita Karlova, Fakulta sociálních vědLanguage
Czech
Grade
Excellent
Keywords (Czech)
metodologie, počítačová textová analýza, mnohorozměrné škálování, biografická analýza, normalizace, disidenti, komunističtí funkcionářiKeywords (English)
methodology, computer-assisted text analysis, multidimensional scaling, biographical analysis, normalization, dissidents, Communist functionariesVedle dotazníkových šetření představují texty důležitý zdroj dat pro sociologický výzkum již od počátků jeho rozvoje. Metody analýzy textů v sociologii zahrnují dva základní vývojové proudy: první představuje kvantitativní obsahová analýza Bernarda Berelsona, druhý hermeneutická analýza Hanse-Georga Gadamera. V posledních dvaceti letech jsou pak oba tyto metodologické proudy ovlivněny rozvojem informačních technologií. Předkládaná práce se zabývá jednou z metod počítačové textové analýzy (CATA), která stojí na pomezí obou těchto metodologických proudů, metodu sledování spoluvýskytu slov. Práce představuje tuto metodu v kontextu ostatních metod analýzy textu a zmiňuje se i o inspiračních zdrojích dalšího rozvoje těchto metod, o korpusové lingvistice a text miningu. Ve druhé části pak rozebírá jednotlivé kroky analýzy spoluvýskytů slov v textu: sestavení textového korpusu, sestavení slovníku, výpočet datové matice a vizualizace vzdáleností slov s užitím metody mnohorozměrného škálování. Metoda je dále aplikována na konkrétní data, dva textové korpusy sestavené z přepisů biografických interview s aktéry československé normalizace, s disidenty a komunistickými funkcionáři. U těchto korpusů je posouzena kvalita modelů v závislosti na volbě parametrů (koeficient vzdálenosti, velikost kontextové...
Besides the social survey data, texts have been an important source of sociological data since the beginning of the development of sociological methodology. Text analysis methods contain two main branches of development: Bernard Berelson's content analysis and Hans-Georg Gadamer's hermeneutic analysis. Both these methodological branches have been influenced by the development of information technologies in the last twenty years. The thesis presented here deals with one of the methods of computer text analysis (CATA), which stands on the border between these two methodological streams, a method of analyzing words' collocations in texts. The thesis presents the method in the context of other methods of text analysis, and mentions sources of inspiration for further development of these methods - corpus linguistics and text mining. The second part discusses the different steps of words' collocation analysis: building a text corpus, dictionary compilation, calculation of data matrix and visualisation of words' distances using multidimensional scaling (MDS). The method is also applied to a specific data, two text corpora compiled from transcripts of biographical interviews with actors of Czechoslovak normalization - with dissidents and Communist functionaries. Quality of the models is assessed, depending...