Podpora rozpoznávání matematických vzorců v rámci OCR systému
Optical Formula Recognition support as a part of the OCR system
Podpora rozpoznávání matematických vzorců v rámci OCR systému
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/49221Identifiers
Study Information System: 104939
Collections
- Kvalifikační práce [11325]
Author
Advisor
Referee
Vácha, Pavel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
5. 9. 2011
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Slovak
Grade
Excellent
Keywords (Czech)
rozpoznávanie matematických vzorcov, rozpoznávanie symbolov, podporné vektory, Kohonenova mapaKeywords (English)
mathematical formula recognition, symbol recognition, support vector machines, Kohonen's mapCieľom tejto práce je implementovať prevod naskenovaného matematického vzorca do editovateľnej podoby vo forme TEX súboru ako doplnok fungujúceho OCR systému. V práci sa venujeme podrobnej analýze tohto problému, jeho rozloženiu na niekoľko menších častí, ako rozpoznanie symbolov a rozpoznanie štruktúry vzorcu, ich riešeniu a taktiež popisujeme rôzne spôsoby riešenia. Úspešnosť našich implementácií týchto častí overujeme na nami vytvorenej databáze symbolov a vzorcov. Podstatnou časťou práce je aj vytvorenie sady komplexných aplikácií s prepracovaným grafickým rozhraním, ktoré umožnia jednoduché prispôsobenie konverzie potrebám užívateľa. Obrázky obsahujúce vzorce môžu obsahovať jemný šum spôsobený nekvalitou skeneru.
The aim of this work is to implement a conversion from the scanned math formula to the editable form as a TEX file as an extension of the working OCR system. In this work we closely analyze this problem, its division into several smaller parts, such as math symbol recognition and a recognition of structure of math formulas, and their solutions together with a description of various solutions. We test our implementations using our database of symbols and math formulas. An important part of the work is also a creation of a set of complex applications with a sophisticated graphical user interface, which allow easy accommodation of conversion to the user's needs. During the conversion we work with images, which may contain insignificant noise caused by a scanner of lower quality.