Neural networks for automatic speaker, language, and sex identification
Použití rekurentních neuronových sítí pro automatické rozpoznávání řečníka, jazyka a pohlaví
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/77265Identifikátory
SIS: 162400
Katalog UK: 990020827150106986
Kolekce
- Kvalifikační práce [11979]
Autor
Vedoucí práce
Oponent práce
Peterek, Nino
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
3. 2. 2016
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
automatické rozpoznávání řeči, ASR, neuronové sítě, convoluční neuronové sítě, CNN, rekurentní neuronové sítě, RNN, LSTMKlíčová slova (anglicky)
automatic speech recognition, ASR, neural networks, convolutional neural networks, CNN, recurent neural networks, RNN, long short term memory networks, LSTMNázev: Neuronové sítě pro automatické rozpoznávání řečníka, jazyka a pohlaví Autorka: Bich-Ngoc Do Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurek, Ph.D., Ústav formální a aplikované lingvistiky, a Dr. Marco Wiering, Institut umělé inteligence a kognitivních věd, Fakulta matematiky a přírodních věd, Univerzita v Groningenu Abstrakt: Rozpoznávání řečníka je náročný úkol a má využití v mnoha oblastech, například využítí pro autorizaci nebo forenzní vědě. V posledních letech se rozšířil koncept učení hlubokých, především hluboké neuronové sítě, které se ukázaly jako schopná technika strojového učení a dosáhly výborných úspěchů v mnoha oblastech výzkumu zpracování přirozeného jazyka a zpra- cování mluveného slova. Tato práce si dává za cíl prozkoumat možnosti modelu hlubokých neuronových sítí, rekurentních neuronových sítí v úloze rozpoznávání řečníka. Námi navržené systémy byly vyhodnoceny na kor- pusu TIMIT pro úlohu identifikace řečníka. V porovnání s jinými systémy za stejných testových podmínkách náš systém nedosáhl referenčních výsledků kvůli nedostatku validačních dat. Naše experimenty ukázaly, že nejlepší konfigurace systému je...
Title: Neural networks for automatic speaker, language, and sex identifica- tion Author: Bich-Ngoc Do Department: Institute of Formal and Applied Linguistics Supervisor: Ing. Mgr. Filip Jurek, Ph.D., Institute of Formal and Applied Linguistics and Dr. Marco Wiering, Faculty of Mathematics and Natural Sciences, University of Groningen Abstract: Speaker recognition is a challenging task and has applications in many areas, such as access control or forensic science. On the other hand, in recent years, deep learning paradigm and its branch, deep neural networks have emerged as powerful machine learning techniques and achieved state-of- the-art in many fields of natural language processing and speech technology. Therefore, the aim of this work is to explore the capability of a deep neural network model, recurrent neural networks, in speaker recognition. Our pro- posed systems are evaluated on TIMIT corpus using speaker identification task. In comparison with other systems in the same test conditions, our systems could not surpass reference ones due to the sparsity of validation data. In general, our experiments show that the best system configuration is a combination of MFCCs with their dynamic features and a recurrent neural network model. We also experiment recurrent neural networks and convo- lutional neural...
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Mezigenerační rozdíly mezi uživateli v oblasti užívání sociálních sítí
Výsledek obhajoby: OBHÁJENOWojnarová, Daniela (Univerzita Karlova, Fakulta sociálních věd, 2021)Datum obhajoby: 17. 6. 2021 -
International Trade Network
Výsledek obhajoby: OBHÁJENOHanousek, Milan (Univerzita Karlova, Fakulta sociálních věd, 2014)Datum obhajoby: 23. 9. 2014Tato práce studuje topologické vlastnosti sítě mezinárodního obchodu (ITN) mezi světovými zeměmi pomocí síťové analýzy. Zkoumáme rozdělení nejdůležitějších síťových statistik, které měří propojenost, uspořádání a shlukování. ... -
Ovlivnitelnost influencerskou reklamou a sociálními sítěmi z pohledu genderové odlišnosti
Výsledek obhajoby: OBHÁJENOŠebová, Klára (Univerzita Karlova, Fakulta humanitních studií, 2021)Datum obhajoby: 10. 9. 2021
