Akustické charakteristiky hlasu při roztroušené skleróze
Acoustic features of speech in multiple sclerosis
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/118820Identifikátory
SIS: 217606
Kolekce
- Kvalifikační práce [22834]
Autor
Vedoucí práce
Oponent práce
Šturm, Pavel
Fakulta / součást
Filozofická fakulta
Obor
Fonetika
Katedra / ústav / klinika
Fonetický ústav
Datum obhajoby
17. 6. 2020
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
fonetika|dysarthrie|roztroušená skleróza|neurodegenerativní|biometrikaKlíčová slova (anglicky)
phonetics|dysarthria|multiple sclerosis|neurodegenerative|biometricsTato práce se zabývá akustickými odlišnostmi nahrávek zdravých lidí a lidí postižených roztroušenou sklerózou a také tím, jak mohou tyto odlišnosti být použity za účelem automatické detekce roztroušené sklerózy z jednoduchých hlasových nahrávek a z toho vyplývajícího případného brzkého nalezení rozvíjející se choroby. Kapitola 1 obsahuje teoretické pozadí vlivu roztroušené sklerózy na řeč a také popis dat, softwaru, hypotéz a předpokladů v práci užitých. Za tímto účelem byly užity dva soubory nahrávek čteného textu, jeden s nahrávkami nemocných mluvčích a druhý obsahoval zdravé kontrolní mluvčí. Některé z těchto souborů byly ručně anotovány, což představuje první soubor dat. Současně byly celé tyto dva soubory nahrávek anotovány automaticky, čímž byl vytvořen druhý, větší soubor dat. Tento byl vytvořen za účelem přezkoumání možnosti detekovat roztroušenou sklerózu čistě automaticky. Kapitola 2 popisuje 13 akustických parametrů použitých v této práci, jejich předpokládané vztahy se symptomatologií roztroušené sklerózy a metody jejich byly výpočtu. Kapitola 3 se zabývá statistickým testováním parametrů, jejich interpretací, úspěšností dvou machine learningových modelů vytvořených za účelem zhodnocení jejich celkové prediktivní síly a možným praktickým využitím druhého z nich. Z ručního datového souboru bylo...
This thesis analyzes what acoustically sets apart recordings of healthy people from recordings of people afflicted with multiple sclerosis, and how this distinction can be used to automatically detect multiple sclerosis from fairly simple recordings of a subject's voice, potentially discovering early cases of this disease. Chapter 1 includes the theoretical background of the effect of multiple sclerosis on speech and the descriptions of the data, software, hypotheses and assumptions used here. Two sets recordings of read speech were used, a corpus of afflicted speakers and a control corpus of healthy speakers, totalling 250 individuals. A subset of this corpus was manually annotated, resulting in one dataset. Simultaneously, these entire corpora were also annotated automatically, resulting in another dataset, which was created to explore the possibility of detecting multiple sclerosis automatically. Chapter 2 describes the 13 acoustic parameters used in this thesis, their exact hypothesized relationships with the symptoms of multiple sclerosis and the ways they were calculated. Chapter 3 elaborates on the statistical testing of the aforementioned parameters, their interpretation, the success rate of the two machine learning models used to assess their total predictive power, and a potential way to apply the...