Neural networks for automatic speaker, language, and sex identification
Použití rekurentních neuronových sítí pro automatické rozpoznávání řečníka, jazyka a pohlaví
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/77265Identifiers
Study Information System: 162400
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Peterek, Nino
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computational Linguistics
Department
Institute of Formal and Applied Linguistics
Date of defense
3. 2. 2016
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
automatické rozpoznávání řeči, ASR, neuronové sítě, convoluční neuronové sítě, CNN, rekurentní neuronové sítě, RNN, LSTMKeywords (English)
automatic speech recognition, ASR, neural networks, convolutional neural networks, CNN, recurent neural networks, RNN, long short term memory networks, LSTMNázev: Neuronové sítě pro automatické rozpoznávání řečníka, jazyka a pohlaví Autorka: Bich-Ngoc Do Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurek, Ph.D., Ústav formální a aplikované lingvistiky, a Dr. Marco Wiering, Institut umělé inteligence a kognitivních věd, Fakulta matematiky a přírodních věd, Univerzita v Groningenu Abstrakt: Rozpoznávání řečníka je náročný úkol a má využití v mnoha oblastech, například využítí pro autorizaci nebo forenzní vědě. V posledních letech se rozšířil koncept učení hlubokých, především hluboké neuronové sítě, které se ukázaly jako schopná technika strojového učení a dosáhly výborných úspěchů v mnoha oblastech výzkumu zpracování přirozeného jazyka a zpra- cování mluveného slova. Tato práce si dává za cíl prozkoumat možnosti modelu hlubokých neuronových sítí, rekurentních neuronových sítí v úloze rozpoznávání řečníka. Námi navržené systémy byly vyhodnoceny na kor- pusu TIMIT pro úlohu identifikace řečníka. V porovnání s jinými systémy za stejných testových podmínkách náš systém nedosáhl referenčních výsledků kvůli nedostatku validačních dat. Naše experimenty ukázaly, že nejlepší konfigurace systému je...
Title: Neural networks for automatic speaker, language, and sex identifica- tion Author: Bich-Ngoc Do Department: Institute of Formal and Applied Linguistics Supervisor: Ing. Mgr. Filip Jurek, Ph.D., Institute of Formal and Applied Linguistics and Dr. Marco Wiering, Faculty of Mathematics and Natural Sciences, University of Groningen Abstract: Speaker recognition is a challenging task and has applications in many areas, such as access control or forensic science. On the other hand, in recent years, deep learning paradigm and its branch, deep neural networks have emerged as powerful machine learning techniques and achieved state-of- the-art in many fields of natural language processing and speech technology. Therefore, the aim of this work is to explore the capability of a deep neural network model, recurrent neural networks, in speaker recognition. Our pro- posed systems are evaluated on TIMIT corpus using speaker identification task. In comparison with other systems in the same test conditions, our systems could not surpass reference ones due to the sparsity of validation data. In general, our experiments show that the best system configuration is a combination of MFCCs with their dynamic features and a recurrent neural network model. We also experiment recurrent neural networks and convo- lutional neural...
Citace dokumentu
Metadata
Show full item recordRelated items
Showing items related by title, author, creator and subject.
-
Mezigenerační rozdíly mezi uživateli v oblasti užívání sociálních sítí
Defence status: DEFENDEDWojnarová, Daniela (Univerzita Karlova, Fakulta sociálních věd, 2021)Date of defense: 17. 6. 2021 -
International Trade Network
Defence status: DEFENDEDHanousek, Milan (Univerzita Karlova, Fakulta sociálních věd, 2014)Date of defense: 23. 9. 2014Tato práce studuje topologické vlastnosti sítě mezinárodního obchodu (ITN) mezi světovými zeměmi pomocí síťové analýzy. Zkoumáme rozdělení nejdůležitějších síťových statistik, které měří propojenost, uspořádání a shlukování. ... -
Ovlivnitelnost influencerskou reklamou a sociálními sítěmi z pohledu genderové odlišnosti
Defence status: DEFENDEDŠebová, Klára (Univerzita Karlova, Fakulta humanitních studií, 2021)Date of defense: 10. 9. 2021