Implementing incomplete inverse decomposition on graphical processing units
Implementace neúplného inverzního rozkladu na grafických kartách
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/52011Identifiers
Study Information System: 139227
Collections
- Kvalifikační práce [11322]
Author
Advisor
Referee
Hakl, František
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Discrete Models and Algorithms
Department
Department of Applied Mathematics
Date of defense
2. 9. 2013
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
Přibližná inverze, neúplná faktorizace, grafický procesorKeywords (English)
Approximate inverse, incomplete decomposition, graphical processing unit (GPU)Cílem této práce bylo vyhodnocení možnosti řešit soustavy lineárních algebraických rovnic na grafických akcelerátorech. Zatímco řešiče obecně hustých soustav na těchto procesorech jsou víceméně součástí standardních uživatelských knihoven, tato práce se zaměřuje na soustavy řídké, kde tomu tak zdaleka není. Konkrétně se tato práce zaměřuje na jeden specifický algoritmus přibližného inverzního rozkladu symetrických a pozitivně definitních matic, který je kombinován s příslušnou krylovovskou metodou, metodou sdružených gradientů. Důležitou součástí této práce je inovativní paralelní implementace. Předkládané výsledky experimentů se systémy různých velikostí i struktur řídkosti ukazují, že nový přístup je slibný a v jeho vývoji by se mělo pokračovat. Sumárně, práce ukazuje, že přepodmiňování řídkých soustav přibližnými inverzemi na grafických akcelerátorech je jeden z možných efektivních postupů řešení. Powered by TCPDF (www.tcpdf.org)
The goal of this Thesis was to evaluate a possibility to solve systems of linear algebraic equations with the help of graphical processing units (GPUs). While such solvers for generally dense systems seem to be more or less a part of standard production libraries, the Thesis concentrates on this low-level parallelization of equations with a sparse system that still presents a challenge. In particular, the Thesis considers a specific algorithm of an approximate inverse decomposition of symmetric and positive definite systems combined with the conjugate gradient method. An important part of this work is an innovative parallel implementation. The presented experimental results for systems of various sizes and sparsity structures point out that the approach is rather promising and should be further developed. Summarizing our results, efficient preconditioning of sparse systems by approximate inverses on GPUs seems to be worth of consideration. Powered by TCPDF (www.tcpdf.org)