Způsoby využití základní frekvence pro identifikaci mluvčích
Ways of exploiting fundamental frequency for speaker identification
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/84140Identifikátory
SIS: 164297
Katalog UK: 990020317310106986
Kolekce
- Kvalifikační práce [24998]
Autor
Vedoucí práce
Oponent práce
Šturm, Pavel
Fakulta / součást
Filozofická fakulta
Obor
Fonetika - Tlumočnictví: čeština - angličtina
Katedra / ústav / klinika
Fonetický ústav
Datum obhajoby
7. 9. 2015
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Čeština
Známka
Velmi dobře
Klíčová slova (česky)
forenzní fonetika, identifikace mluvčího, základní frekvence, češtinaKlíčová slova (anglicky)
forensic phonetics, speaker identification, fundamental frequency, CzechPředkládaná diplomová práce se zabývá forenzním využitím údajů o základní frekvenci, konkrétně jejích středních hodnot a ukazatelů variability. Mezi fonetiky zabývajícími se forenzní analýzou řeči je obecně známo, že F0 nemá příliš velký potenciál jako parametr využitelný při identifikaci mluvčích, protože podléhá mnoha vnějším faktorům (jako je momentální citové rozpoložení, okolní hluk, přenosový kanál nebo dokonce vlastní snaha maskovat svůj hlas), jež zapříčiňují vysokou intraindividuální variabilitu. Přesto však platí, že forenzní užití F0 skýtá i určité výhody, například snadnost extrakce jejích hodnot ze signálu a nižší ovlivnitelnost lexikálním obsahem - na rozdíl od vokalických formantů. V této práci zkoumáme nahrávky osmi mužských mluvčích pořízené ve dvou mluvních stylech (spontánním a čteném) a porovnáváme příslušné ukazatele stability i variability základní frekvence, které jsou pokud možno robustní vůči proměnlivým vnějším okolnostem: za střední hodnoty je to základní hladina a za deskriptory variability percentilové rozpětí. Kromě toho si všímáme řečových jevů, jako je třepená fonace, které jsou idiosynkratické a napomáhají rozlišitelnosti daného mluvčího od ostatních. Klíčová slova: forenzní fonetika, identifikace mluvčího, základní frekvence, čeština
The present Master's thesis deals with the forensic use of fundamental frequency characteristics, specifically with F0 mean values and indicators of variability. Phoneticians who specialise in the forensic analysis of speech generally believe that F0 does not hold much potential as a parameter useful for speaker identification, mainly because it is easily influenced by extrinsic factors (e.g. the speaker's emotional state, interfering noise, transmission channel or even the speaker's own effort to mask his voice), which cause high intra-individual variability. Despite these facts, however, the forensic use of F0 offers a number of advantages, namely straightforward extraction from the speech signal and lower susceptibility to varying lexical content - unlike, for example, vowel formants. This thesis investigates the recordings of 8 male speakers made in two different speech styles (spontaneous and read) and compares the respective indicators of F0 stability and variability, in particular those that are robust in varying external conditions: that is, the baseline for mean values and the 10.-90. percentile range for variability indicators. Apart from that, we take into account phenomena such as the creaky voice, which are idiosyncratic and contribute to easier speaker discrimination. Key words:...
