Image Segmentation of Museum Data Using Deep Learning.
Segmentace obrazu muzejních dat pomocí hlubokého učení.
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/202439Identifiers
Study Information System: 276926
Collections
- Kvalifikační práce [12069]
Author
Advisor
Referee
Holeňa, Martin
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science with specialisation in Artificial Intelligence
Department
Department of Software and Computer Science Education
Date of defense
4. 9. 2025
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
hluboké učení|segmentace obrazu|segmentace bez učení|muzejní data|SAM2|YOLOEKeywords (English)
Deep Learning|Image Segmentation|Zero-shot Segmentation|Museum Data|Computer Vision|SAM2|YOLOETato práce zkoumá využití segmentace bez učení modelů hlubokého učení pro seg- mentaci obrazů v oblasti muzejních artefaktů, přičemž řeší problémy jako vizuální nejed- noznačnost a nedostatek anotovaných dat. Dva modely, SAM2 a YOLOE, byly hodno- ceny na datové sadě muzejních snímků ve třech úlohách: generování ohraničujících boxů, segmentace bez učení a segmentace na základě prostorových podnětů. YOLOE dosáhl nejlepších výsledků v úlohách bez podnětů, zatímco SAM2 exceloval při použití pros- torových podnětů, což potvrzuje jeho vhodnost pro poloautomatické pracovní postupy. Klasické metody zůstávají užitečné ve specifických případech. Výsledky naznačují, že kombinace moderních modelů s minimálním vstupem uživatele nabízí škálovatelné řešení segmentace v podmínkách s omezenými zdroji. 1
This thesis investigates zero-shot deep learning models for segmenting cultural her- itage and museum artifacts, addressing challenges like visual ambiguity and scarce anno- tations. Two models, SAM2 and YOLOE, were evaluated on a museum image dataset across three tasks: bounding box generation, zero-shot segmentation, and segmentation from spatial prompts. YOLOE performed best in prompt-free tasks, while SAM2 excelled with spatial prompts, supporting its role in semi-automated workflows. Classical methods remained useful in limited cases. Results suggest that combining prompt-driven models with minimal user input offers a scalable solution for segmentation in resource-constrained cultural domains. 1
