Algoritmy detekce obchodních dokumentů podle šablon
Algorithms for business document detection using templates
Algoritmy detekce obchodních dokumentů podle šablon
diplomová práce (NEOBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/75868Identifikátory
SIS: 143576
Katalog UK: 990020930320106986
Kolekce
- Kvalifikační práce [11407]
Autor
Vedoucí práce
Oponent práce
Kopecký, Michal
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
16. 6. 2016
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Slovenština
Známka
Neprospěl
Klíčová slova (česky)
pološtrukturované dokumenty, annotácia,OCR, vyhľadávanie dokumentovKlíčová slova (anglicky)
semistrucutred documents, annotation, OCR, document searchDiplomová práca sa zaoberá analýzou a návrhom systému pre automatické rozpoznávanie dokumentov. Systém spracuje dokument a prevedie ho do textovej podoby, pričom musí byť zachovaná informácia o pôvodnej polohe slova v dokumente. Tieto dáta budú následne preskúmané a určitým dátam bude pridelený ich význam. Spôsob, akým bude dátam pridelený význam bude založený na pravidlách, ktoré môže meniť užívateľ podľa svojej potreby. Následne podľa dát, ich prideleného významu a ich polohy, systém nájde podobný dokument a podľa neho identifikuje aktuálne skúmaný dokument. Powered by TCPDF (www.tcpdf.org)
Thesis deals with analysis and design system for automatic document recognition. The system examines the document and converts it into text data, and shall be preserved information about the initial position of the word in the original document. These data will then be reviewed and some of them will be assigned their importance. The way the data will be assigned is based on rules which may vary according to user needs. According to the data, their assignment and the importance of their position, the system finds a similar document and, if it identifies the current document examined. Powered by TCPDF (www.tcpdf.org)