Využití dlouhodobé formantové distribuce pro rozpoznatelnost mluvčího v různých akustických podmínkách
Using long-term formant distributions for speaker identification in various acoustic conditions
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/67363Identifikátory
SIS: 132791
Katalog UK: 990019369910106986
Kolekce
- Kvalifikační práce [25207]
Autor
Vedoucí práce
Oponent práce
Bořil, Tomáš
Fakulta / součást
Filozofická fakulta
Obor
Fonetika
Katedra / ústav / klinika
Fonetický ústav
Datum obhajoby
4. 2. 2015
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
LTF, dlouhodobá formantová distribuce, identifikace mluvčích, forenzní fonetika, akustická kvalita nahrávky, šumKlíčová slova (anglicky)
LTF, long-time formant distribution, speaker identification, forensic phonetics, acoustic quality of recording, noiseAnalýza dlouhodobé formantové distribuce (LTF) je poměrně mladou, ale slibnou disciplínou identifikace mluvčích. Jde o metodu mapující dlouhodobé chování formantů v řeči jednotlivých mluvčích. Častými problémy, s nimiž se v praxi setkáváme, je zhoršená akustická kvalita a příliš krátké trvání zkoumaných nahrávek. Tato práce má za cíl představit historický vývoj forenzní fonetiky a současné používané metody. V praktické části se zabýváme využitelností LTF metody ve forenzní praxi, zvláště pak u nahrávek obsahujících šum v pozadí. Ukázalo se, že šum extrahované LTF hodnoty znatelně ovlivňuje, bohužel nejde o žádné systematické změny. Proto jsme navrhli několik metod, jak šum v nahrávce kompenzovat, aby bylo možné navzájem srovnávat i čisté a zašuměné nahrávky. Zkoumali jsme též minimální trvání nahrávky, jež je nutné pro statistickou spolehlivost výsledných hodnot. Tato hranice není přesná a je pro jednotlivé mluvčí značně individuální, ale je patrné, že nahrávky (vokalické proudy) kratší než 15 s mají již často sníženou vypovídající hodnotu, nelze je tedy pro analýzu doporučit. Klíčová slova: LTF, dlouhodobá formantová distribuce, identifikace mluvčích, forenzní fonetika, akustická kvalita nahrávky, šum
The analysis of long-time formant distribution is relatively young but promising discipline of speaker identification. It is a method of mapping the long-term behavior of formants in speech of individual speakers. Frequently encountered problems in practice are bad acoustic quality and very short duration of analyzed recordings. This work aims to present the historical development of forensic phonetics and currently used methods. In the practical part, it deals with the usability of LTF method in forensic practice, especially in recordings containing background noise. It was shown that the noise appreciably affects extracted LTF values and unfortunately the change is not systematic. Therefore, we proposed several methods to compensate the noise in recordings, in order to be able to compare recordings with and without noise. We also investigated the minimum duration of recording, which is necessary for statistical reliability of the resulting values. This boundary is not exact and for each speaker, it is substantially individual. But it is apparent that recordings (vocalic streams) shorter than 15 s often provide incomplete information, wherefore they cannot be recommended for analysis. Keywords: LTF, long-time formant distribution, speaker identification, forensic phonetics, acoustic quality of...
