dc.contributor.advisor | Vidová Hladká, Barbora | |
dc.creator | Mikuláš, Pavel | |
dc.date.accessioned | 2021-07-23T10:05:44Z | |
dc.date.available | 2021-07-23T10:05:44Z | |
dc.date.issued | 2021 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/127963 | |
dc.description.abstract | V této práci se zabýváme počítačovým zpracováním dat o výzkumných projektech financovaných ze státního rozpočtu. Porovnáme různé metody převedení nestrukturova- ných textových dat do vektorových reprezentací a pokusíme se v datech nalézt různé struktury. Velký důraz bude kladen na měření podobnosti a shlukování projektů. Práce je experimentální a měla by sloužit jako ukázka postupu zpracování velkého množství objektů reálného světa pomocí metod statistiky a strojového učení. 1 | cs_CZ |
dc.description.abstract | The aim of this thesis is to compare different approaches of vectorization of unstructu- red textual data about research projects with government financing. We'll attempt to find some structure in the underlying data with emphasis on meassuring similiarity between projects and their clustering. The thesis is experimental and should serve as an example of processing large number of real world objects using methods of statistics and machine learning. 1 | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | výzkumné projekty|vektorová reprezentace|strojové učení|podobnost|shlukování | cs_CZ |
dc.subject | research projects|vectorization|machine learning|similarity|clustering | en_US |
dc.title | Vektorová reprezentace výzkumných projektů | cs_CZ |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2021 | |
dcterms.dateAccepted | 2021-07-02 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 235783 | |
dc.title.translated | Vectorization of research projects | en_US |
dc.contributor.referee | Víta, Martin | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | General Computer Science | en_US |
thesis.degree.discipline | Obecná informatika | cs_CZ |
thesis.degree.program | Informatika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Obecná informatika | cs_CZ |
uk.degree-discipline.en | General Computer Science | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | V této práci se zabýváme počítačovým zpracováním dat o výzkumných projektech financovaných ze státního rozpočtu. Porovnáme různé metody převedení nestrukturova- ných textových dat do vektorových reprezentací a pokusíme se v datech nalézt různé struktury. Velký důraz bude kladen na měření podobnosti a shlukování projektů. Práce je experimentální a měla by sloužit jako ukázka postupu zpracování velkého množství objektů reálného světa pomocí metod statistiky a strojového učení. 1 | cs_CZ |
uk.abstract.en | The aim of this thesis is to compare different approaches of vectorization of unstructu- red textual data about research projects with government financing. We'll attempt to find some structure in the underlying data with emphasis on meassuring similiarity between projects and their clustering. The thesis is experimental and should serve as an example of processing large number of real world objects using methods of statistics and machine learning. 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |