Využití vokalických formantů pro rozpoznání mluvčího v přirozených forenzních nahrávkách
Using vowel formants for speaker identification in natural forensic recordings
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/93144Identifiers
Study Information System: 137715
Collections
- Kvalifikační práce [23715]
Author
Advisor
Referee
Veroňková, Jitka
Faculty / Institute
Faculty of Arts
Discipline
Phonetics
Department
Institute of Phonetics
Date of defense
6. 9. 2017
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
formantové trajektorie|srovnávání hlasů|LDA|čeština|forenzní fonetikaKeywords (English)
formant trajectories|voice comparison|LDA|Czech|forensic phoneticsSrovnávání hlasů je jedním z nejčastěji skloňovaných termínů v oblasti forenzní fonetiky, nicméně najít jeden řečový parametr, jenž by spolehlivě dva hlasy odlišil, se odborníkům zatím nepodařilo. Slibné výsledky přináší měření dynamického průběhu vokálu, a proto v našem výzkumu pomocí lineární diskriminační analýzy (LDA) a na reálných forenzních nahrávkách zkoumáme využitelnost formantových trajektorií. V praktické části této práce srovnáváme, jak se liší výsledky LDA, pokud jsou jejími prediktory samotné formantové hodnoty, nebo koeficienty kvadratického a kubického proložení formantové kontury; a pokud se analyzované skupiny liší co do počtu jednotek. Ukázalo se, že použití formantových frekvencí či polynomické regrese má srovnatelné výsledky, avšak vzhledem k omezením daným LDA je kvadratické proložení nejefektivnější. I přesto, že v našem výzkumu je LDA schopna od sebe mluvčí na nenáhodné úrovni rozlišit, nemůžeme ji pro forenzní praxi doporučit. Za prvé je velmi citlivá na velikost jednotlivých skupin a za druhé, což je důležitější, na nenáhodné úrovni od sebe rozlišuje i jednotky pocházející od stejného mluvčího. Klíčová slova: formantové trajektorie, srovnávání hlasů, LDA, čeština, forenzní fonetika
Voice comparison is one of the most frequently addressed terms in the context of forensic phonetics; however, so far experts have not been able to find a speech parameter which reliably discriminates between two speakers. Formant dynamics have brought promising results in this respect, therefore in our study using linear discriminant analysis (LDA) we tested the speaker-discriminatory potential of formant trajectories on real forensic recordings. The aim was firstly, to compare the results of LDA when formant frequencies or coefficients of quadratic and cubic fit are used as predictors and secondly, to compare the results when the analyzed classes are balanced or not regarding the number of objects. As for the predictors, all of the types demonstrated comparable classification rates, nevertheless, as LDA limits the number of predictors in relation to the class size, the quadratic fit appears to be the most efficient. Even though LDA was able to discriminate between different voices above chance, it cannot be recommended for forensic use. It delivered highly inconsistent results when the number of objects in the classes was changed; and more importantly, it significantly discriminates between objects of the same speaker. Key words: formant trajectories, voice comparison, LDA, Czech, forensic phonetics