Způsoby využití základní frekvence pro identifikaci mluvčích
Ways of exploiting fundamental frequency for speaker identification
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/84140Identifiers
Study Information System: 164297
CU Caralogue: 990020317310106986
Collections
- Kvalifikační práce [23978]
Author
Advisor
Referee
Šturm, Pavel
Faculty / Institute
Faculty of Arts
Discipline
Phonetics - Interpreting Studies: Czech - English
Department
Institute of Phonetics
Date of defense
7. 9. 2015
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
forenzní fonetika, identifikace mluvčího, základní frekvence, češtinaKeywords (English)
forensic phonetics, speaker identification, fundamental frequency, CzechPředkládaná diplomová práce se zabývá forenzním využitím údajů o základní frekvenci, konkrétně jejích středních hodnot a ukazatelů variability. Mezi fonetiky zabývajícími se forenzní analýzou řeči je obecně známo, že F0 nemá příliš velký potenciál jako parametr využitelný při identifikaci mluvčích, protože podléhá mnoha vnějším faktorům (jako je momentální citové rozpoložení, okolní hluk, přenosový kanál nebo dokonce vlastní snaha maskovat svůj hlas), jež zapříčiňují vysokou intraindividuální variabilitu. Přesto však platí, že forenzní užití F0 skýtá i určité výhody, například snadnost extrakce jejích hodnot ze signálu a nižší ovlivnitelnost lexikálním obsahem - na rozdíl od vokalických formantů. V této práci zkoumáme nahrávky osmi mužských mluvčích pořízené ve dvou mluvních stylech (spontánním a čteném) a porovnáváme příslušné ukazatele stability i variability základní frekvence, které jsou pokud možno robustní vůči proměnlivým vnějším okolnostem: za střední hodnoty je to základní hladina a za deskriptory variability percentilové rozpětí. Kromě toho si všímáme řečových jevů, jako je třepená fonace, které jsou idiosynkratické a napomáhají rozlišitelnosti daného mluvčího od ostatních. Klíčová slova: forenzní fonetika, identifikace mluvčího, základní frekvence, čeština
The present Master's thesis deals with the forensic use of fundamental frequency characteristics, specifically with F0 mean values and indicators of variability. Phoneticians who specialise in the forensic analysis of speech generally believe that F0 does not hold much potential as a parameter useful for speaker identification, mainly because it is easily influenced by extrinsic factors (e.g. the speaker's emotional state, interfering noise, transmission channel or even the speaker's own effort to mask his voice), which cause high intra-individual variability. Despite these facts, however, the forensic use of F0 offers a number of advantages, namely straightforward extraction from the speech signal and lower susceptibility to varying lexical content - unlike, for example, vowel formants. This thesis investigates the recordings of 8 male speakers made in two different speech styles (spontaneous and read) and compares the respective indicators of F0 stability and variability, in particular those that are robust in varying external conditions: that is, the baseline for mean values and the 10.-90. percentile range for variability indicators. Apart from that, we take into account phenomena such as the creaky voice, which are idiosyncratic and contribute to easier speaker discrimination. Key words:...