Analýza biografických vyprávění pamětníků s užitím počítačové textové analýzy

Čepelák, Václav

Analysis of biographical narratives using computer-assisted text analysis

diplomová práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (252.8Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/43161

Identifikátory

SIS: 110683

Katalog UK: 990014833820106986

Oponent práce

Soukup, Petr

Fakulta / součást

Fakulta sociálních věd

Obor

Sociologie

Katedra / ústav / klinika

Katedra sociologie

Datum obhajoby

25. 6. 2012

Nakladatel

Univerzita Karlova, Fakulta sociálních věd

Jazyk

Čeština

Známka

Výborně

Klíčová slova (česky)

metodologie, počítačová textová analýza, mnohorozměrné škálování, biografická analýza, normalizace, disidenti, komunističtí funkcionáři

Klíčová slova (anglicky)

methodology, computer-assisted text analysis, multidimensional scaling, biographical analysis, normalization, dissidents, Communist functionaries

Vedle dotazníkových šetření představují texty důležitý zdroj dat pro sociologický výzkum již od počátků jeho rozvoje. Metody analýzy textů v sociologii zahrnují dva základní vývojové proudy: první představuje kvantitativní obsahová analýza Bernarda Berelsona, druhý hermeneutická analýza Hanse-Georga Gadamera. V posledních dvaceti letech jsou pak oba tyto metodologické proudy ovlivněny rozvojem informačních technologií. Předkládaná práce se zabývá jednou z metod počítačové textové analýzy (CATA), která stojí na pomezí obou těchto metodologických proudů, metodu sledování spoluvýskytu slov. Práce představuje tuto metodu v kontextu ostatních metod analýzy textu a zmiňuje se i o inspiračních zdrojích dalšího rozvoje těchto metod, o korpusové lingvistice a text miningu. Ve druhé části pak rozebírá jednotlivé kroky analýzy spoluvýskytů slov v textu: sestavení textového korpusu, sestavení slovníku, výpočet datové matice a vizualizace vzdáleností slov s užitím metody mnohorozměrného škálování. Metoda je dále aplikována na konkrétní data, dva textové korpusy sestavené z přepisů biografických interview s aktéry československé normalizace, s disidenty a komunistickými funkcionáři. U těchto korpusů je posouzena kvalita modelů v závislosti na volbě parametrů (koeficient vzdálenosti, velikost kontextové...

Abstrakt (anglicky)

Besides the social survey data, texts have been an important source of sociological data since the beginning of the development of sociological methodology. Text analysis methods contain two main branches of development: Bernard Berelson's content analysis and Hans-Georg Gadamer's hermeneutic analysis. Both these methodological branches have been influenced by the development of information technologies in the last twenty years. The thesis presented here deals with one of the methods of computer text analysis (CATA), which stands on the border between these two methodological streams, a method of analyzing words' collocations in texts. The thesis presents the method in the context of other methods of text analysis, and mentions sources of inspiration for further development of these methods - corpus linguistics and text mining. The second part discusses the different steps of words' collocation analysis: building a text corpus, dictionary compilation, calculation of data matrix and visualisation of words' distances using multidimensional scaling (MDS). The method is also applied to a specific data, two text corpora compiled from transcripts of biographical interviews with actors of Czechoslovak normalization - with dissidents and Communist functionaries. Quality of the models is assessed, depending...

Citace dokumentu

Metadata

Zobrazit celý záznam