Spectral properties of the source signal as speaker-specific cues
Spektrální vlastnosti zdrojového signálu jako údaje o identitě mluvčího
diploma thesis (DEFENDED)

Volín, Jan
Faculty / Institute
Faculty of Arts
English and American Studies - Phonetics
Institute of Phonetics
Date of defense
8. 2. 2012
Univerzita Karlova, Filozofická fakultaLanguage
Keywords (Czech)
Keywords (English)
voice, long-term average spectrum, spectral slope, speaker identity, forensic phonetics
voice, long-term average spectrum, spectral slope, speaker identity, forensic phoneticsIdentifikace mluvčího zůstává i přes neustálý vývoj počítačových technologií jedním z nejsložitějších úkolů forenzní fonetiky. Důvodem je skutečnost, že naše znalosti akustické reprezentace identity mluvčího jsou omezené. Tato studie se zabývá spektrálními vlastnostmi zdrojového signálu a její snahou je zjistit, zda spektrální doména skýtá nějaké informace, které by mohli k identifikaci přispět. Těžištěm této studie jsou tři parametry vyjadřující krátkodobý spektrální sklon, H1-H2, H1-A1 and H1-A3 a to, jak jsou schopny rozlišit 16 českých ženských mluvčí. V souvislosti s tím je zkoumán vliv vokalické kvality, přízvučnosti slabiky a pozice taktu v promluvě na diskriminační schopnosti těchto parametrů. Výsledky ukázaly, že mluvčí vykazující statisticky významné odlišnosti v hodnotách těchto parametrů, i když užitečnost jednotlivých parametrů se liší. Ukázal se také vliv přízvučnosti slabiky; mluvčí jsou nejlépe rozpoznány v přízvučných slabikách. Studie poukazuje na možnost, že jednotlivé vokály jsou užitečnější pro identifikaci mluvčího, než vokály jiné. Výsledky diskriminační analýzy založené na krátkodobém spektrálním sklonu byly doplněny a srovnány s údaji o dlouhodobém spektrálním sklonu vyjádřeném alpha indexem, Kitzingovým indexem a Hammarbergové indexem, která kvantifikují dlouhodobé...
Despite a continuous development in computer sciences and related disciplines, speaker identification remains one of the most challenging tasks in forensic phonetics. The reason for this is the fact that our knowledge of how identity is reflected in the acoustic signal is still limited. The present study aims to contribute to the search of speaker-specific cues by examining spectral properties of the source signal. Specifically, it examines to what extent three short-term measures of spectral tilt, namely H1-H2, H1-A1 and H1-A3, can discriminate 16 Czech female speakers. It also addresses the influence of vowel quality, syllable status with respect to stress and position of stress group in the utterance on the values of these measures. The results show that these parameters do have some discriminative power, though the contribution of individual parameters differs. The study indicates that discrimination of speakers is the most successful in stressed syllables and argues that individual vowels could differ in their usefulness for speaker identification. The results of LDA based on these short- term measures of spectral tilt were complemented with long-term measures, namely alpha index, Kitzing index and Hammarberg index which quantify the slope of the LTAS. The present study suggests that...