dc.contributor.advisor | Mareš, Martin | |
dc.creator | Tichý, Jan | |
dc.date.accessioned | 2017-05-26T09:40:07Z | |
dc.date.available | 2017-05-26T09:40:07Z | |
dc.date.issued | 2015 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/61914 | |
dc.description.abstract | Předmětem této práce je navrhnout zpracování skenovaných dokumentů obsahujících textové a netextové elementy. V této práci je tento problém analyzován a rozdělen na menší podproblémy, které jsou dále řešeny. Hlavní řešené problémy jsou předzpracování obrázku, při kterém se mají potlačit nedostatky skenování, například špatný kontrast či našikmo sejmutý obraz, dále je řešena segmentace dokumentu na znaky, linky a obrázky a závěrem komprese výstupu pomocí clusterování znaků. Dále je cílem této práce navržené řešení implementovat formou programu, který naskenovaný dokument zpracuje a vytvoří PDF dokument skládající se z nalezených komponent. Powered by TCPDF (www.tcpdf.org) | cs_CZ |
dc.description.abstract | The subject of this work is to propose a method for post-processing of scanned documents containing text and non-text elements. In this work, this problem is analyzed and divided into smaller sub- problems, which are solved. Main problems we propose solutions to are pre-processing of an input image to suppress scanning defects such as poor contrast or rotation of an input image, segmentation to characters, lines and images and finally compression of output document by clustering text elements. We will implement this proposed method as a program processing scanned images into PDF document. Powered by TCPDF (www.tcpdf.org) | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | post-processing | cs_CZ |
dc.subject | zpracování obrazu | cs_CZ |
dc.subject | segmentace obrazu | cs_CZ |
dc.subject | clusterování | cs_CZ |
dc.subject | post-processing | en_US |
dc.subject | image processing | en_US |
dc.subject | image segmentation | en_US |
dc.subject | clustering | en_US |
dc.title | Zpracování scanovaných dokumentů | cs_CZ |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2015 | |
dcterms.dateAccepted | 2015-06-15 | |
dc.description.department | Department of Applied Mathematics | en_US |
dc.description.department | Katedra aplikované matematiky | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 117545 | |
dc.title.translated | Post-processing of scanned documents | en_US |
dc.contributor.referee | Böhm, Martin | |
dc.identifier.aleph | 002006629 | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Programování | cs_CZ |
thesis.degree.discipline | Programming | en_US |
thesis.degree.program | Informatika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra aplikované matematiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Applied Mathematics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Programování | cs_CZ |
uk.degree-discipline.en | Programming | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Neprospěl | cs_CZ |
thesis.grade.en | Fail | en_US |
uk.abstract.cs | Předmětem této práce je navrhnout zpracování skenovaných dokumentů obsahujících textové a netextové elementy. V této práci je tento problém analyzován a rozdělen na menší podproblémy, které jsou dále řešeny. Hlavní řešené problémy jsou předzpracování obrázku, při kterém se mají potlačit nedostatky skenování, například špatný kontrast či našikmo sejmutý obraz, dále je řešena segmentace dokumentu na znaky, linky a obrázky a závěrem komprese výstupu pomocí clusterování znaků. Dále je cílem této práce navržené řešení implementovat formou programu, který naskenovaný dokument zpracuje a vytvoří PDF dokument skládající se z nalezených komponent. Powered by TCPDF (www.tcpdf.org) | cs_CZ |
uk.abstract.en | The subject of this work is to propose a method for post-processing of scanned documents containing text and non-text elements. In this work, this problem is analyzed and divided into smaller sub- problems, which are solved. Main problems we propose solutions to are pre-processing of an input image to suppress scanning defects such as poor contrast or rotation of an input image, segmentation to characters, lines and images and finally compression of output document by clustering text elements. We will implement this proposed method as a program processing scanned images into PDF document. Powered by TCPDF (www.tcpdf.org) | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra aplikované matematiky | cs_CZ |
dc.identifier.lisID | 990020066290106986 | |