Zpracování scanovaných dokumentů

Tichý, Jan

Post-processing of scanned documents

dc.contributor.advisor	Mareš, Martin
dc.creator	Tichý, Jan
dc.date.accessioned	2017-05-26T09:40:07Z
dc.date.available	2017-05-26T09:40:07Z
dc.date.issued	2015
dc.identifier.uri	http://hdl.handle.net/20.500.11956/61914
dc.description.abstract	Předmětem této práce je navrhnout zpracování skenovaných dokumentů obsahujících textové a netextové elementy. V této práci je tento problém analyzován a rozdělen na menší podproblémy, které jsou dále řešeny. Hlavní řešené problémy jsou předzpracování obrázku, při kterém se mají potlačit nedostatky skenování, například špatný kontrast či našikmo sejmutý obraz, dále je řešena segmentace dokumentu na znaky, linky a obrázky a závěrem komprese výstupu pomocí clusterování znaků. Dále je cílem této práce navržené řešení implementovat formou programu, který naskenovaný dokument zpracuje a vytvoří PDF dokument skládající se z nalezených komponent. Powered by TCPDF (www.tcpdf.org)	cs_CZ
dc.description.abstract	The subject of this work is to propose a method for post-processing of scanned documents containing text and non-text elements. In this work, this problem is analyzed and divided into smaller sub- problems, which are solved. Main problems we propose solutions to are pre-processing of an input image to suppress scanning defects such as poor contrast or rotation of an input image, segmentation to characters, lines and images and finally compression of output document by clustering text elements. We will implement this proposed method as a program processing scanned images into PDF document. Powered by TCPDF (www.tcpdf.org)	en_US
dc.language	Čeština	cs_CZ
dc.language.iso	cs_CZ
dc.publisher	Univerzita Karlova, Matematicko-fyzikální fakulta	cs_CZ
dc.subject	post-processing	cs_CZ
dc.subject	zpracování obrazu	cs_CZ
dc.subject	segmentace obrazu	cs_CZ
dc.subject	clusterování	cs_CZ
dc.subject	post-processing	en_US
dc.subject	image processing	en_US
dc.subject	image segmentation	en_US
dc.subject	clustering	en_US
dc.title	Zpracování scanovaných dokumentů	cs_CZ
dc.type	bakalářská práce	cs_CZ
dcterms.created	2015
dcterms.dateAccepted	2015-06-15
dc.description.department	Department of Applied Mathematics	en_US
dc.description.department	Katedra aplikované matematiky	cs_CZ
dc.description.faculty	Matematicko-fyzikální fakulta	cs_CZ
dc.description.faculty	Faculty of Mathematics and Physics	en_US
dc.identifier.repId	117545
dc.title.translated	Post-processing of scanned documents	en_US
dc.contributor.referee	Böhm, Martin
dc.identifier.aleph	002006629
thesis.degree.name	Bc.
thesis.degree.level	bakalářské	cs_CZ
thesis.degree.discipline	Programování	cs_CZ
thesis.degree.discipline	Programming	en_US
thesis.degree.program	Informatika	cs_CZ
thesis.degree.program	Computer Science	en_US
uk.thesis.type	bakalářská práce	cs_CZ
uk.taxonomy.organization-cs	Matematicko-fyzikální fakulta::Katedra aplikované matematiky	cs_CZ
uk.taxonomy.organization-en	Faculty of Mathematics and Physics::Department of Applied Mathematics	en_US
uk.faculty-name.cs	Matematicko-fyzikální fakulta	cs_CZ
uk.faculty-name.en	Faculty of Mathematics and Physics	en_US
uk.faculty-abbr.cs	MFF	cs_CZ
uk.degree-discipline.cs	Programování	cs_CZ
uk.degree-discipline.en	Programming	en_US
uk.degree-program.cs	Informatika	cs_CZ
uk.degree-program.en	Computer Science	en_US
thesis.grade.cs	Neprospěl	cs_CZ
thesis.grade.en	Fail	en_US
uk.abstract.cs	Předmětem této práce je navrhnout zpracování skenovaných dokumentů obsahujících textové a netextové elementy. V této práci je tento problém analyzován a rozdělen na menší podproblémy, které jsou dále řešeny. Hlavní řešené problémy jsou předzpracování obrázku, při kterém se mají potlačit nedostatky skenování, například špatný kontrast či našikmo sejmutý obraz, dále je řešena segmentace dokumentu na znaky, linky a obrázky a závěrem komprese výstupu pomocí clusterování znaků. Dále je cílem této práce navržené řešení implementovat formou programu, který naskenovaný dokument zpracuje a vytvoří PDF dokument skládající se z nalezených komponent. Powered by TCPDF (www.tcpdf.org)	cs_CZ
uk.abstract.en	The subject of this work is to propose a method for post-processing of scanned documents containing text and non-text elements. In this work, this problem is analyzed and divided into smaller sub- problems, which are solved. Main problems we propose solutions to are pre-processing of an input image to suppress scanning defects such as poor contrast or rotation of an input image, segmentation to characters, lines and images and finally compression of output document by clustering text elements. We will implement this proposed method as a program processing scanned images into PDF document. Powered by TCPDF (www.tcpdf.org)	en_US
uk.file-availability	V
uk.publication.place	Praha	cs_CZ
uk.grantor	Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra aplikované matematiky	cs_CZ
dc.identifier.lisID	990020066290106986