Strojová tematická analýza výročních zpráv o závislostech: využití jazykových modelů a metod zpracování přirozeného jazyka
Machine-Based Thematic Analysis of Annual Reports on Addictions: Applications of Language Models and Natural Language Processing Methods
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/202960Identifikátory
SIS: 241998
Kolekce
- Kvalifikační práce [4873]
Autor
Vedoucí práce
Oponent práce
Miovský, Michal
Fakulta / součást
1. lékařská fakulta
Obor
Adiktologie
Katedra / ústav / klinika
Klinika adiktologie 1. LF UK a VFN
Datum obhajoby
9. 9. 2025
Nakladatel
Univerzita Karlova, 1. lékařská fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
tematická analýza, výroční zprávy, závislosti, drogová politika, veřejné zdraví, paradigmatická změna, digitalizace, zpracování přirozeného jazyka, BERTopic, Národní monitorovací střediskoKlíčová slova (anglicky)
thematic analysis, annual reports, addiction, drug policy, public health, paradigm shift, digitalisation, natural language processing, BERTopic, National Monitoring CentreVýchodiska: Výroční zprávy Národního monitorovacího střediska pro drogy a závislosti (NMS) představují klíčový nástroj monitoringu závislostí v České republice od roku 2002. Dosud nebyly systematicky analyzovány z hlediska jejich tematického obsahu a vývoje v čase. Pochopení vývoje těchto zpráv je důležité pro optimalizaci monitoringu a efektivnější komunikaci výsledků různým cílovým skupinám. Cíle: Cílem výzkumu byla kvalitativní obsahová analýza výročních zpráv NMS. Výzkum měl určit klíčová témata s definovanou četností výskytu, sledovat jejich vývoj v čase a identifikovat paradigmatické změny v oblasti závislostí. Metody: Pro analýzu 46 výročních zpráv z let 2002-2024 byla použita metodologie kombinující tradiční postupy s moderními technologiemi zpracování přirozeného jazyka. Texty byly zpracovány modelem BERTopic s algoritmem HDBSCAN. Segmenty textu byly shrnuty pomocí velkých jazykových modelů GPT-4o a Claude Sonnet 4 a podrobeny kvalitativní obsahové analýze, interpretaci a syntéze s ohledem na výzkumné otázky. Výsledky: Analýza identifikovala ve výročních zprávách 368 témat, z nichž 100 nejčetnějších bylo kategorizováno do pěti hlavních skupin: epidemiologie a monitoring (váha 1232), socioekonomické dopady (1450), systém péče (859), regulace (924) a politika (306). Byla identifikována...
Background: Since 2002, the annual reports of the National Monitoring Centre for Drugs and Addiction (NMS) have served as a key instrument for monitoring addiction in the Czech Republic. However, their thematic content and longitudinal development have not yet been subjected to systematic analysis. Gaining insight into the evolution of these reports is essential for optimising monitoring efforts and enhancing the communication of findings to diverse target audiences. Objectives: The objective of the research was to conduct a qualitative content analysis of the NMS annual reports. The study aimed to identify key topics with a predefined minimum frequency of occurrence, trace their development over time, and identify paradigmatic changes in the field of addiction. Methods: To analyse 46 annual reports from 2002 to 2024, the study employed a methodology that combined traditional qualitative approaches with modern natural language processing technologies. The texts were processed using the BERTopic model in conjunction with the HDBSCAN clustering algorithm. Selected text segments were summarised using large language models (GPT-4o and Claude Sonnet 4) and subsequently subjected to qualitative content analysis, interpretation, and synthesis in line with the research questions. Results: The analysis...
