Vektorová reprezentace výzkumných projektů
Vectorization of research projects
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/127963Identifikátory
SIS: 235783
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Víta, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
2. 7. 2021
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
výzkumné projekty|vektorová reprezentace|strojové učení|podobnost|shlukováníKlíčová slova (anglicky)
research projects|vectorization|machine learning|similarity|clusteringV této práci se zabýváme počítačovým zpracováním dat o výzkumných projektech financovaných ze státního rozpočtu. Porovnáme různé metody převedení nestrukturova- ných textových dat do vektorových reprezentací a pokusíme se v datech nalézt různé struktury. Velký důraz bude kladen na měření podobnosti a shlukování projektů. Práce je experimentální a měla by sloužit jako ukázka postupu zpracování velkého množství objektů reálného světa pomocí metod statistiky a strojového učení. 1
The aim of this thesis is to compare different approaches of vectorization of unstructu- red textual data about research projects with government financing. We'll attempt to find some structure in the underlying data with emphasis on meassuring similiarity between projects and their clustering. The thesis is experimental and should serve as an example of processing large number of real world objects using methods of statistics and machine learning. 1
