Restoring and improving the technical quality of audio recordings using machine learning methods
Restaurování a vylepšování technické kvality zvukových nahrávek metodami strojového učení
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/175607Identifiers
Study Information System: 236169
Collections
- Kvalifikační práce [12076]
Author
Advisor
Referee
Dušek, Ondřej
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Artificial Intelligence
Department
Institute of Formal and Applied Linguistics
Date of defense
7. 9. 2022
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
Hluboká neuronová síť|audio|Konvoluční neuronová síť|TensorFlow|kvalitaKeywords (English)
Deep Neural Network|audio|Convolutional Neural Network|TensorFlow|qualityCílem této práce je vytrénovat umělou neuronovou síť, která bude schopna zlepšovat technickou kvalitu zvukových nahrávek. Abych toho docílil, použil jsem tři druhy umělých zarušení zvukových nahrávek k natrénování sedmi různých hlubokých neuronových sítí na párech zarušeného a nezarušeného audia. Výsledných 21 sítí jsem následně ohod- notil pomocí objektivních i subjektivních způsobů. Ve výsledku se neuronové sítě naučily odstraňovat umělá zarušení velice dobře, nicméně vylepšovat nezarušené vstupy se ne- naučily. 1
The goal of this thesis is to train an artificial neural network which will be able to improve the technical quality of audio recordings. To achieve this, three artificial audio distortions are used to train seven different deep neural networks on pairs of distorted and undistorted audio. The resulting 21 networks are then evaluated using a number of objective and subjective measures. In the end, the networks learned to remove artificial distortions very well, but they did not learn to improve the technical quality of undistorted inputs. 1
