Restoring and improving the technical quality of audio recordings using machine learning methods
Restaurování a vylepšování technické kvality zvukových nahrávek metodami strojového učení
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/175607Identifikátory
SIS: 236169
Kolekce
- Kvalifikační práce [11987]
Autor
Vedoucí práce
Oponent práce
Dušek, Ondřej
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
7. 9. 2022
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
Hluboká neuronová síť|audio|Konvoluční neuronová síť|TensorFlow|kvalitaKlíčová slova (anglicky)
Deep Neural Network|audio|Convolutional Neural Network|TensorFlow|qualityCílem této práce je vytrénovat umělou neuronovou síť, která bude schopna zlepšovat technickou kvalitu zvukových nahrávek. Abych toho docílil, použil jsem tři druhy umělých zarušení zvukových nahrávek k natrénování sedmi různých hlubokých neuronových sítí na párech zarušeného a nezarušeného audia. Výsledných 21 sítí jsem následně ohod- notil pomocí objektivních i subjektivních způsobů. Ve výsledku se neuronové sítě naučily odstraňovat umělá zarušení velice dobře, nicméně vylepšovat nezarušené vstupy se ne- naučily. 1
The goal of this thesis is to train an artificial neural network which will be able to improve the technical quality of audio recordings. To achieve this, three artificial audio distortions are used to train seven different deep neural networks on pairs of distorted and undistorted audio. The resulting 21 networks are then evaluated using a number of objective and subjective measures. In the end, the networks learned to remove artificial distortions very well, but they did not learn to improve the technical quality of undistorted inputs. 1
