Hlasové ovládání pro efektivní editaci textu
Hlasové ovládání pro efektivní editaci textu
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/56030Identifikátory
SIS: 129435
Kolekce
- Kvalifikační práce [10690]
Autor
Vedoucí práce
Oponent práce
Skopal, Tomáš
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
2. 9. 2013
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
Hlasové ovládání, podobnostní vyhledávání, editace textuKlíčová slova (anglicky)
Voice control, similarity search, text editingCieľom tejto práce je poskytnúť úvod do problematiky digitálneho spracovania zvuku a rozpoznávania reči. V texte je popísaných niekoľko vybraných deskriptorov reči a algoritmov spojených s problematikou. Tieto sú použité v implementácii jednoduchého hlasom ovládaného textového editoru a .NET knižnice. Deskriptory sú porovnané s ohľadom na rýchlosť a presnosť pri použití v systéme rozpoznávania príkazov pre textový editor a to v systéme závislom alebo nezávislom na hovoriacom. Knižnica tried poskytuje jednoduchý spôsob implementácie hlasového ovládania závislého na hovoriacom v obmedzenej doméne príkazov v ľubovoľnom programe. Editor textu umožňuje užívateľovi priradiť hlasové povely k zabudovaným funkciám programu, čo napríklad umožňuje aj neskúseným užívateľom používať pokročilé funkcie bez nutnosti predošlého učenia sa napríklad klávesových skratiek. Tento prístup je navyše nezávislý na jazyku a je použiteľný aj pre ľudí s poruchami reči, čo momentálne rozšírené riešenia neumožňujú. Výsledky experimentov ukazujú, že prezentované deskriptory a algoritmy sú, za predpokladu dostatočnej kvality nahrávky, dostatočne efektívne pre použitie pri rozpoznávaní príkazov v systéme závislom na hovoriacom. Powered by TCPDF (www.tcpdf.org)
The aim of this thesis is to provide a comprehensive introduction to digital sound processing and speech recognition. Selected speech recognition features as well as algorithms are introduced and utilized in a voice controlled text editor and a .NET class library. The performance of the features is evaluated in both speaker-dependent and speaker-independent recognition of commands related to text editing. The library provides a straightforward way of implementing a speaker-dependent, domain-constrained voice recognition in an arbitrary application. It is used in a simple voice controlled text editor. The editor allows the user to assign voice commands to built-in actions. In this way, it is possible for inexperienced users to access and use advanced features of the program without having to learn complex workflows. Moreover, this approach is language-agnostic and can even be used by people with speech impairments as opposed to majority of presently used voice recognition systems. The results of the experiments indicate that, given a recording of sufficient quality, the presented features and algorithms provide an effective means to implement a speaker-dependent speech recognition system, which can be used in a voice controlled text editor. Powered by TCPDF (www.tcpdf.org)