Učící se analyzátor audio-vizuálních záznamů
Continously Learning Analyser of Audio-Visual Recordings
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/82961Identifikátory
SIS: 129612
Katalog UK: 990021107420106986
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Klusáček, David
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
8. 9. 2016
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Dobře
Klíčová slova (česky)
automatické segmentování, audio, video, řeč, audio-vizuální archivyKlíčová slova (anglicky)
Automatic Segmentation, Audio, Video, Speech, Audio-Visual ArchivesV této práci je představen analyzátor audiovizuálních záznamů, který ze zvukové složky záznamu a dodaných titulků vytvoří textovou anotaci. Anotace obsahuje textový přepis pořadu založený na titulcích a je v ní vyznačeno, který z mluvčích danou repliku pronesl. Zjištění počtu mluvčích a jejich přidělení úsekům záznamu zajišťuje externí knihovna, stejně jako detekci úseků s muzikou. V práci je popsáno fungování této knihovny a je vyhodnocena na dostupných datech z korpusu DIALOG. Pro přiřazení textu ke správnému úseku záznamu používáme Kaldi, toolkit pro automatické rozpoznávání řeči. Práce dále obsahuje přehled o tvorbě skrytých titulků, o tvorbě korpusů mluvené řeči a stručný přehled literatury věnující se analýze záznamů. 1
This thesis introduces a tool for analysis of audiovisual records. The tool uses the audio and closed captions supplied by the user to prepare text annotation. The annotation contains a transcript of the show which is based on the closed captions. In addition, speaker diarization is performed to mark who spoke when. The diarization is performed by a third party library. The library is evaluated on data from DIALOG corpus. The inner workings of the library are described. To assign the right portions of the text to the right section of the record Kaldi, a speech recognition toolkit, is used. Furthermore the thesis contains an overview describing how closed captions are created; overview of speech corpora creation; and a brief review of literature on record analysis. 1
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Audiosložka ve vyučování češtiny jako cizího jazyka
Výsledek obhajoby: OBHÁJENOSmrčková, Tereza (Univerzita Karlova, Filozofická fakulta, 2015)Datum obhajoby: 14. 9. 2015(česky) Tato práce se zabývá problematikou výuky naslouchání v češtině jako cizím jazyce, k čemuž využívá studium teoretických pramenů, strukturované pozorování a komparaci didaktických materiálů, dotazníky a neformální ... -
Tvorba a konzumace podcastů v České republice se zaměřením na marketing a podnikání
Výsledek obhajoby: OBHÁJENOGregorová, Leona (Univerzita Karlova, Fakulta sociálních věd, 2020)Datum obhajoby: 28. 1. 2020This diploma thesis is devoted to the phenomenon of podcasting and its definition within the new media. It introduces the term in the context of its history and its current situation on foreign markets, ie the cradle of ... -
DiaSynth - Syntezátor audia pomocí diagramů, přehrávač a analyzátor
Výsledek obhajoby: OBHÁJENOStrýček, Radek (Univerzita Karlova, Matematicko-fyzikální fakulta, 2021)Datum obhajoby: 11. 2. 2021Cílem práce bylo vytvořit uživatelsky přívětivý program s grafickým uživatelským rozhraním pro práci se zvukem. Práce obsahuje analyzátor, audio přehrávač podobný programu Audacity a část umožňující syntézu zvuku technikou ...
