Vytěžování textu z fotografií

Kindermann, Hubert

Optical Character Recognition at Camera Captured Images

diplomová práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (151.4Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/65883

Identifikátory

SIS: 127959

Oponent práce

Kolomazník, Jan

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Softwarové systémy

Katedra / ústav / klinika

Katedra softwarového inženýrství

Datum obhajoby

26. 5. 2014

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Čeština

Známka

Velmi dobře

Klíčová slova (česky)

OCR, fotky, rozpoznání znaků, segmentace, normalizace

Klíčová slova (anglicky)

OCR, photos, character recognition, segmentation, normalization

Představujeme postup řešení jednotlivých kroků potřebných k binarizaci a segmentaci řádků textu obsažených ve fotografiích stránek tištěného textu. Uvádíme způsob normalizace neuniformního osvětlení fotografie. Navrhujeme algoritmus pro binarizaci vstupní bitmapy založený na dvou- dimenzionálním pravděpodobnostním modelu pixelu, který bere v úvahu i jeho okolí. Pokračujeme popisem robustního detektoru orientace řádků textu založeného na optimalizaci účelové funkce vycházející z prvních derivací obrazové funkce. Nakonec se zabýváme detekcí jednotlivých řádků textu a jejich následnou segmentací. Tvary výsledných řádků textu na závěr optimalizujeme pomocí grafového algoritmu. Powered by TCPDF (www.tcpdf.org)

Abstrakt (anglicky)

We present solution of steps necessary for binarization and text lines detection contained in printed documents digitized by the camera. We introduce a normalization of non-uniform illumination method for text photographs. We propose input bitmap binarization algorithm based on two-dimensional probability pixel model which also considers its surrounding. We continue with description of robust text lines orientation detector based on optimization of risk function using first order derivatives of image function. In the end we present text lines detection and segmentation algorithm. Final shape of segmented lines is optimized with usage of graph algorithm. Powered by TCPDF (www.tcpdf.org)

Citace dokumentu

Metadata

Zobrazit celý záznam