dc.contributor.advisor | Peška, Ladislav | |
dc.creator | Spišák, Martin | |
dc.date.accessioned | 2023-11-06T13:24:39Z | |
dc.date.available | 2023-11-06T13:24:39Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/184373 | |
dc.description.abstract | In theory, the linear autoencoder EASE is one of the most capable collaborative filtering recommenders for large item domains with sparse user-item feedback. However, the model's weights are determined by the inverse of a matrix of dimension equal to the item set size. This inverse matrix is generally dense, and for large item sets, the computed weight matrix might be too large to store in memory during inference. Consequently, scaling the model beyond tens of thousands of items quickly becomes very expensive. We propose a modification of EASE called SANSA to alleviate the issue. SANSA approximates the weights of EASE with prescribed density via an end-to-end sparse training procedure. To find a method capable of computing the sparse approximation efficiently, we investigate approaches for constructing sparse approximate inverse precon- ditioners. We select a method fitting for very large SPD problems with general sparsity patterns. The training procedure is robust and finds a good approximation of EASE even on datasets with dense item relations. Moreover, as the number of items in datasets grows, SANSA achieves unparalleled efficiency, even compared to EASE's previous state- of-the-art modification focused on scalability. Consequently, SANSA effortlessly scales the concept of EASE to millions of items. 1 | en_US |
dc.description.abstract | Lineárny autoenkóder EASE by mal byť jedným z najvýkonnejších odporúčacích sys- témov na báze kolaboratívneho filtrovania pre veľké katalógy položiek s riedkou spätnou väzbou od používateľov. Váhy modelu sú však určené inverznou maticou dimenzie rovnej veľkosti katalógu. Táto inverzná matica je obvykle hustá, v dôsledku čoho môže byť v prípade veľkého počtu položiek váhová matica priveľká na držanie v pamäti počas in- ferencie. Výpočetné náklady na škálovanie modelu nad desiatky tisíc položiek tak veľmi prudko stúpajú. V práci navrhujeme modifikáciu EASE s názvom SANSA, ktorá tento problém rieši. SANSA aproximuje váhy EASE so zvolenou hustotou. Túto aproximáciu nájde pomocou end-to-end riedkej trénovacej procedúry. Pre voľbu metódy schopnej efektívne spočí- tať riedku aproximáciu veľkej inverznej matice, skúmame prístupy pre konštrukciu ried- kych približných inverzov pre účely predpodmienenia sústav lineárnych rovníc. Vybraná metóda je vhodná pre veľmi veľké sústavy so všeobecným vzorom riedkosti. Trénovacia procedúra je robustná a nájde dobrú aproximáciu modelu EASE aj na súboroch dát s hustými vzťahmi medzi položkami. Navyše, so zvyšujúcim sa počtom položiek v katalógu dosahuje SANSA bezkonkurenčnú efektivitu, a to aj v porovnaní s predchádzajúcou na- jefektívnejšou modifikáciou modelu EASE zameranou na... | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | EASE^R|(Sparse) approximate inverse|recommender systems | cs_CZ |
dc.subject | EASE^R|(Sparse) approximate inverse|recommender systems | en_US |
dc.title | Sparse Approximate Inverse for Enhanced Scalability in Recommender Systems | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2023 | |
dcterms.dateAccepted | 2023-09-07 | |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.department | Department of Software Engineering | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 255616 | |
dc.title.translated | Zlepšování škálovatelnosti doporučovacích systémů pomocí řídkých přibližných inverzů | cs_CZ |
dc.contributor.referee | Vančura, Vojtěch | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Matematika pro informační technologie | cs_CZ |
thesis.degree.discipline | Mathematics for Information Technologies | en_US |
thesis.degree.program | Matematika pro informační technologie | cs_CZ |
thesis.degree.program | Mathematics for Information Technologies | en_US |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Matematika pro informační technologie | cs_CZ |
uk.degree-discipline.en | Mathematics for Information Technologies | en_US |
uk.degree-program.cs | Matematika pro informační technologie | cs_CZ |
uk.degree-program.en | Mathematics for Information Technologies | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Lineárny autoenkóder EASE by mal byť jedným z najvýkonnejších odporúčacích sys- témov na báze kolaboratívneho filtrovania pre veľké katalógy položiek s riedkou spätnou väzbou od používateľov. Váhy modelu sú však určené inverznou maticou dimenzie rovnej veľkosti katalógu. Táto inverzná matica je obvykle hustá, v dôsledku čoho môže byť v prípade veľkého počtu položiek váhová matica priveľká na držanie v pamäti počas in- ferencie. Výpočetné náklady na škálovanie modelu nad desiatky tisíc položiek tak veľmi prudko stúpajú. V práci navrhujeme modifikáciu EASE s názvom SANSA, ktorá tento problém rieši. SANSA aproximuje váhy EASE so zvolenou hustotou. Túto aproximáciu nájde pomocou end-to-end riedkej trénovacej procedúry. Pre voľbu metódy schopnej efektívne spočí- tať riedku aproximáciu veľkej inverznej matice, skúmame prístupy pre konštrukciu ried- kych približných inverzov pre účely predpodmienenia sústav lineárnych rovníc. Vybraná metóda je vhodná pre veľmi veľké sústavy so všeobecným vzorom riedkosti. Trénovacia procedúra je robustná a nájde dobrú aproximáciu modelu EASE aj na súboroch dát s hustými vzťahmi medzi položkami. Navyše, so zvyšujúcim sa počtom položiek v katalógu dosahuje SANSA bezkonkurenčnú efektivitu, a to aj v porovnaní s predchádzajúcou na- jefektívnejšou modifikáciou modelu EASE zameranou na... | cs_CZ |
uk.abstract.en | In theory, the linear autoencoder EASE is one of the most capable collaborative filtering recommenders for large item domains with sparse user-item feedback. However, the model's weights are determined by the inverse of a matrix of dimension equal to the item set size. This inverse matrix is generally dense, and for large item sets, the computed weight matrix might be too large to store in memory during inference. Consequently, scaling the model beyond tens of thousands of items quickly becomes very expensive. We propose a modification of EASE called SANSA to alleviate the issue. SANSA approximates the weights of EASE with prescribed density via an end-to-end sparse training procedure. To find a method capable of computing the sparse approximation efficiently, we investigate approaches for constructing sparse approximate inverse precon- ditioners. We select a method fitting for very large SPD problems with general sparsity patterns. The training procedure is robust and finds a good approximation of EASE even on datasets with dense item relations. Moreover, as the number of items in datasets grows, SANSA achieves unparalleled efficiency, even compared to EASE's previous state- of-the-art modification focused on scalability. Consequently, SANSA effortlessly scales the concept of EASE to millions of items. 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
thesis.grade.code | 1 | |
dc.contributor.consultant | Tůma, Miroslav | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |