Optimalizační techniky stencil algoritmů akcelerovaných pomocí GPU
Optimisation techniques for GPU-accelerated stencil algorithms
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/202578Identifikátory
SIS: 278264
Kolekce
- Kvalifikační práce [11987]
Autor
Vedoucí práce
Oponent práce
Yaghob, Jakub
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Systémové programování
Katedra / ústav / klinika
Katedra distribuovaných a spolehlivých systémů
Datum obhajoby
5. 9. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
stencil|CUDA|GPU|paralelní|optimalizaceKlíčová slova (anglicky)
stencil|CUDA|GPU|parallel|optimizationsStencil algoritmy patří mezi nejrozšířenější typy výpočtů v oblasti vysoce výkonného počítaní. I přes pokroky v hardwaru GPU je výkon značně omezen propustností pamětí, což zvyšuje význam optimalizací. Tato práce se zabývá optimalizačními technikami GPU stencilových výpočtů, přičemž se zaměřuje zejména na non-temporally blocked difuzi a Game of Life. Byl vyvinut framework pro měření výkonnosti a validaci GPU stencil algo- ritmů s knihovnou Noarr. Práce má dva experimentální přínosy. Za prvé, technika packet coding byla aplikována na difuzi prostřednictvím vektorových datových typů prostředí CUDA, což vedlo k vysokému výkonu s 7-bodovým stencilem difuze. Za druhé, práce navrhuje novou techniku, inactive tile skipping, pro Game of Life. Po přidání do jednoho z nejvýkonnějších existujících algorithmů má tato technika výkonnostní přínos u Life simulací s řídkou aktivitou.
Stencil computations are one of the most prevalent computational patterns in high- performance computing. Despite advancements in GPU hardware, performance is often limited by memory bandwidth necessitating optimization. This thesis addresses the op- timization techniques applied to GPU stencil computations, focusing especially on non- temporally blocked diffusion and Conway's Game of Life. A framework for benchmarking and validating GPU stencil algorithms was developed with the Noarr library. There are two noteworthy experimental results. Firstly, the packet coding technique was applied to diffusion through CUDA vector data types, achieving high performance with the 7 point diffusion stencil. Secondly, the thesis proposes a novel inactive tile skipping technique for the Game of Life. When added to state-of-the-art GoL algorithm, the method showed performance benefits in Life computations with sparse activity.
