OCR ručně kreslených chemických strukturních vzorců
OCR of handwritten structural chemical formulae
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/26776Identifikátory
SIS: 66793
Kolekce
- Kvalifikační práce [10957]
Autor
Vedoucí práce
Oponent práce
Pangrác, Ondřej
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Katedra aplikované matematiky
Datum obhajoby
15. 9. 2009
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Práce se zabývá metodami a algoritmy použitými ve vypracovaném programu na rozpoznávání ručně kreslených chemických strukturních vzorců. Popisuje předzpracování vstupního obrazu pomocí Gaussova filtru, rozpoznávání čar v obraze pomocí hledání sousedních tmavých pixelů. Ukazuje nevhodnost Houghovy transformace pro rozpoznávání čar. Věnuje se hledání co nejpřesnější aproximace nalezených čar pomocí co nejméně úseček. Zavádí pohled na strukturní vzorec jako na graf a popisuje algoritmus vytváření vrcholů a hran grafu z rozpoznaných úseček za použití jednoduchých pravidel, které zkoumají délku úseček a jejich okolí. Obsahuje kapitolu věnující se rozpoznávání písmen heteroatomů a funkčních skupin pomocí porovnávání vůči předloze. Součástí práce je i samotný program.
This work is concerned with methods and algorithms used in developed program for recognition of the hand-drawn chemical structural formulae. It describes the preprocessing of the input image by using Gauss filter, the recognition of lines in the image by searching adjacent dark pixels. It shows inapplicability of Hough transform for line recognition. It covers searching for the most accurate approximation of the found lines using as few segments as possible. It shows similarity of structural formulae to graphs and describes algorithm of creating vertices and edges from recognized segments by using simple rules, that examine the length and neighbourhood of segments. It contains a chapter about recognition of the letters of heteroatoms and functional groups by comparing to pattern. In the end it shows errors in recognition on inappropriate input image. The program itself is also included in the work.