Zobrazit minimální záznam

Klasifikace obsahu právních dokumentů
dc.contributor.advisorŽabokrtský, Zdeněk
dc.creatorBečvarová, Lucia
dc.date.accessioned2017-06-28T10:02:14Z
dc.date.available2017-06-28T10:02:14Z
dc.date.issued2017
dc.identifier.urihttp://hdl.handle.net/20.500.11956/85648
dc.description.abstractTato práce představuje aplikovaný výzkum pro potřeby firmy Datlowe, s.r.o. zaměřený na automatické zpracování právních dokumentů. Cílem práce je navrhnout, implementovat a vyhodnotit klasifikační modul, který je schopen přiřadit kategorie odstavcům dokumentů. Použitých bylo několik klasifikačních algoritmů, které byly vyhodnoceny a srovnány mezi sebou a následně kombinované dohromady s cílem vytvořit lepší modely. Výsledkem je predikční modul, který byl úspěšně integrován do celého systému zpracování dokumentů. Vedle predikčního modulu jsou dalšími přínosy práce měření mezianotátorské shody a návrh nové sady příznaků využitelných pro klasifikaci.cs_CZ
dc.description.abstractThis thesis presents an applied research for the needs of a company Datlowe, s.r.o. aimed at automatic processing of legal documents. The goal of the work is to design, implement and evaluate a classification module that is able to assign categories to the paragraphs of the documents. Several classification algorithms are used, evaluated and compared to each other to be consequently combined to obtain the best models. The outcome is a prediction module which was successfully integrated into the entire document processing system. Other contributions, along with the classification module, are the measurement of the inter-annotator agreement and introducing new set of features for classification.en_US
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectNLPcs_CZ
dc.subjectklasifikace obsahucs_CZ
dc.subjectprávní doménacs_CZ
dc.subjectNLPen_US
dc.subjectcontent classificationen_US
dc.subjectlegal domainen_US
dc.titleContent classification in legal documentsen_US
dc.typediplomová prácecs_CZ
dcterms.created2017
dcterms.dateAccepted2017-06-07
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.identifier.repId188582
dc.title.translatedKlasifikace obsahu právních dokumentůcs_CZ
dc.contributor.refereeHolub, Martin
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineMatematická lingvistikacs_CZ
thesis.degree.disciplineComputational Linguisticsen_US
thesis.degree.programComputer Scienceen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csMatematická lingvistikacs_CZ
uk.degree-discipline.enComputational Linguisticsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csTato práce představuje aplikovaný výzkum pro potřeby firmy Datlowe, s.r.o. zaměřený na automatické zpracování právních dokumentů. Cílem práce je navrhnout, implementovat a vyhodnotit klasifikační modul, který je schopen přiřadit kategorie odstavcům dokumentů. Použitých bylo několik klasifikačních algoritmů, které byly vyhodnoceny a srovnány mezi sebou a následně kombinované dohromady s cílem vytvořit lepší modely. Výsledkem je predikční modul, který byl úspěšně integrován do celého systému zpracování dokumentů. Vedle predikčního modulu jsou dalšími přínosy práce měření mezianotátorské shody a návrh nové sady příznaků využitelných pro klasifikaci.cs_CZ
uk.abstract.enThis thesis presents an applied research for the needs of a company Datlowe, s.r.o. aimed at automatic processing of legal documents. The goal of the work is to design, implement and evaluate a classification module that is able to assign categories to the paragraphs of the documents. Several classification algorithms are used, evaluated and compared to each other to be consequently combined to obtain the best models. The outcome is a prediction module which was successfully integrated into the entire document processing system. Other contributions, along with the classification module, are the measurement of the inter-annotator agreement and introducing new set of features for classification.en_US
uk.file-availabilityV
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV