Zobrazit minimální záznam

Derivovatelný estimator hloubky pro bin picking
dc.contributor.advisorKlusáček, David
dc.creatorČerný, Marek
dc.description.abstractThe goal of this thesis was to investigate the neural 3D surface reconstruction from multiple views with the intent to use the resulting depth maps for bin picking. Survey of papers from 2014 to 2018 showed that none of the state of the art methods would be used to control a robot arm in our setup. Therefore we decided to create our low-level neural approach which we called the EmfNet. The network is based on a pyramidal resolution refining approach. At each pyramid's layer, there are three separate networks that take part in the computation. Each of them has a definite goal, which gives us almost complete understanding of what is going on inside the network. The EmfNet model was partially usable, but we nevertheless extended it to EmfNet-v2. First, another measuring layer was added, which freed EmfNet from depending on an unnecessary hyperparameter. Second, we used constraints on geometry for the network not to be confused by occlusions (cases where a certain part of the surface is visible only from a single camera). Both networks were implemented and tested on a corpus that was created as a part of this thesis. A corpus containing rendered as well as real data. The process of correspondence pairing inside the network can be observed using the visualization tool. We designed a way how to use a robotic arm...en_US
dc.description.abstractTato práce zkoumá možnosti rekonstrukce povrchu pro bin picking pomocí neuronových sítí. Při zkoumání článků z 2014-2018 se ukázalo, že stávající metody nejsou použitelné. Proto jsme vytvořili vlastní nízkourovnový přístup nazvaný EmfNet. Sít používá pyramidové zjemnování rozlišení, kde se na každé urovni pyramidy výpoctu úcastní tři oddělené sítě s jasne definovaným učelem, coz umožnuje témer kompletní pochopení fungování sítě. Model EmfNet byl již částecně použitelný, ale byl rozšířen na EmfNet-v2. Jednak dostal novou meřící vrstvu, aby nezávisel na zbytečném hyperparametru, hlavne ale bylo využito geometrických omezení k tomu, aby sit nemátly okluze (případy, kdy je určitá část povrchu vidět jen z jedné kamery). Obě sítě jsme implementovali a testovali na vlastnim korpusu jak renderovaných tak realných dat. Process párování korespondencí uvnitř sítě lze sledovat po- mocí vizualizace. Navrhli jsme způsob, jak využít robotickou ruku a SMF software k tomu, abychom relativně rychle získali potřebne mnozství dat pro natrénování modelu. Zatím nejlepší model zvládne zrekonstruovat 80% povrchu s chybou menší než 2 mm za čas pod 1 sekundu. 1cs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectdepth perceptionen_US
dc.subjectbin pickingen_US
dc.subjectdeep convolutional neural networksen_US
dc.subjectvnimani hloubkycs_CZ
dc.subjectbin pickingcs_CZ
dc.subjecthluboke konvolucni neuronove sitecs_CZ
dc.titleDifferentiable Depth Estimation for Bin Pickingen_US
dc.typebakalářská prácecs_CZ
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.title.translatedDerivovatelný estimator hloubky pro bin pickingcs_CZ
dc.contributor.refereeŠikudová, Elena
thesis.degree.disciplineObecná informatikacs_CZ
thesis.degree.disciplineGeneral Computer Scienceen_US
thesis.degree.programComputer Scienceen_US
uk.thesis.typebakalářská prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.degree-discipline.csObecná informatikacs_CZ
uk.degree-discipline.enGeneral Computer Scienceen_US
uk.degree-program.enComputer Scienceen_US
uk.abstract.csTato práce zkoumá možnosti rekonstrukce povrchu pro bin picking pomocí neuronových sítí. Při zkoumání článků z 2014-2018 se ukázalo, že stávající metody nejsou použitelné. Proto jsme vytvořili vlastní nízkourovnový přístup nazvaný EmfNet. Sít používá pyramidové zjemnování rozlišení, kde se na každé urovni pyramidy výpoctu úcastní tři oddělené sítě s jasne definovaným učelem, coz umožnuje témer kompletní pochopení fungování sítě. Model EmfNet byl již částecně použitelný, ale byl rozšířen na EmfNet-v2. Jednak dostal novou meřící vrstvu, aby nezávisel na zbytečném hyperparametru, hlavne ale bylo využito geometrických omezení k tomu, aby sit nemátly okluze (případy, kdy je určitá část povrchu vidět jen z jedné kamery). Obě sítě jsme implementovali a testovali na vlastnim korpusu jak renderovaných tak realných dat. Process párování korespondencí uvnitř sítě lze sledovat po- mocí vizualizace. Navrhli jsme způsob, jak využít robotickou ruku a SMF software k tomu, abychom relativně rychle získali potřebne mnozství dat pro natrénování modelu. Zatím nejlepší model zvládne zrekonstruovat 80% povrchu s chybou menší než 2 mm za čas pod 1 sekundu. 1cs_CZ
uk.abstract.enThe goal of this thesis was to investigate the neural 3D surface reconstruction from multiple views with the intent to use the resulting depth maps for bin picking. Survey of papers from 2014 to 2018 showed that none of the state of the art methods would be used to control a robot arm in our setup. Therefore we decided to create our low-level neural approach which we called the EmfNet. The network is based on a pyramidal resolution refining approach. At each pyramid's layer, there are three separate networks that take part in the computation. Each of them has a definite goal, which gives us almost complete understanding of what is going on inside the network. The EmfNet model was partially usable, but we nevertheless extended it to EmfNet-v2. First, another measuring layer was added, which freed EmfNet from depending on an unnecessary hyperparameter. Second, we used constraints on geometry for the network not to be confused by occlusions (cases where a certain part of the surface is visible only from a single camera). Both networks were implemented and tested on a corpus that was created as a part of this thesis. A corpus containing rendered as well as real data. The process of correspondence pairing inside the network can be observed using the visualization tool. We designed a way how to use a robotic arm...en_US
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ

Soubory tohoto záznamu


Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam

© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV