Zobrazit minimální záznam

Post-processing of scanned documents
dc.contributor.advisorMareš, Martin
dc.creatorTichý, Jan
dc.date.accessioned2017-05-26T09:40:07Z
dc.date.available2017-05-26T09:40:07Z
dc.date.issued2015
dc.identifier.urihttp://hdl.handle.net/20.500.11956/61914
dc.description.abstractPředmětem této práce je navrhnout zpracování skenovaných dokumentů obsahujících textové a netextové elementy. V této práci je tento problém analyzován a rozdělen na menší podproblémy, které jsou dále řešeny. Hlavní řešené problémy jsou předzpracování obrázku, při kterém se mají potlačit nedostatky skenování, například špatný kontrast či našikmo sejmutý obraz, dále je řešena segmentace dokumentu na znaky, linky a obrázky a závěrem komprese výstupu pomocí clusterování znaků. Dále je cílem této práce navržené řešení implementovat formou programu, který naskenovaný dokument zpracuje a vytvoří PDF dokument skládající se z nalezených komponent. Powered by TCPDF (www.tcpdf.org)cs_CZ
dc.description.abstractThe subject of this work is to propose a method for post-processing of scanned documents containing text and non-text elements. In this work, this problem is analyzed and divided into smaller sub- problems, which are solved. Main problems we propose solutions to are pre-processing of an input image to suppress scanning defects such as poor contrast or rotation of an input image, segmentation to characters, lines and images and finally compression of output document by clustering text elements. We will implement this proposed method as a program processing scanned images into PDF document. Powered by TCPDF (www.tcpdf.org)en_US
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectpost-processingcs_CZ
dc.subjectzpracování obrazucs_CZ
dc.subjectsegmentace obrazucs_CZ
dc.subjectclusterovánícs_CZ
dc.subjectpost-processingen_US
dc.subjectimage processingen_US
dc.subjectimage segmentationen_US
dc.subjectclusteringen_US
dc.titleZpracování scanovaných dokumentůcs_CZ
dc.typebakalářská prácecs_CZ
dcterms.created2015
dcterms.dateAccepted2015-06-15
dc.description.departmentDepartment of Applied Mathematicsen_US
dc.description.departmentKatedra aplikované matematikycs_CZ
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.identifier.repId117545
dc.title.translatedPost-processing of scanned documentsen_US
dc.contributor.refereeBöhm, Martin
dc.identifier.aleph002006629
thesis.degree.nameBc.
thesis.degree.levelbakalářskécs_CZ
thesis.degree.disciplineProgramovánícs_CZ
thesis.degree.disciplineProgrammingen_US
thesis.degree.programInformatikacs_CZ
thesis.degree.programComputer Scienceen_US
uk.thesis.typebakalářská prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra aplikované matematikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Applied Mathematicsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csProgramovánícs_CZ
uk.degree-discipline.enProgrammingen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csNeprospělcs_CZ
thesis.grade.enFailen_US
uk.abstract.csPředmětem této práce je navrhnout zpracování skenovaných dokumentů obsahujících textové a netextové elementy. V této práci je tento problém analyzován a rozdělen na menší podproblémy, které jsou dále řešeny. Hlavní řešené problémy jsou předzpracování obrázku, při kterém se mají potlačit nedostatky skenování, například špatný kontrast či našikmo sejmutý obraz, dále je řešena segmentace dokumentu na znaky, linky a obrázky a závěrem komprese výstupu pomocí clusterování znaků. Dále je cílem této práce navržené řešení implementovat formou programu, který naskenovaný dokument zpracuje a vytvoří PDF dokument skládající se z nalezených komponent. Powered by TCPDF (www.tcpdf.org)cs_CZ
uk.abstract.enThe subject of this work is to propose a method for post-processing of scanned documents containing text and non-text elements. In this work, this problem is analyzed and divided into smaller sub- problems, which are solved. Main problems we propose solutions to are pre-processing of an input image to suppress scanning defects such as poor contrast or rotation of an input image, segmentation to characters, lines and images and finally compression of output document by clustering text elements. We will implement this proposed method as a program processing scanned images into PDF document. Powered by TCPDF (www.tcpdf.org)en_US
uk.file-availabilityV
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra aplikované matematikycs_CZ
dc.identifier.lisID990020066290106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV