Řízení prohledávání stromů hry
A Controlled Searching of Game Trees
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/94814Identifikátory
SIS: 176554
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Majerech, Vladan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Programování a softwarové systémy
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
31. 1. 2018
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
MCTS, UCT, BMCTS, RAVEKlíčová slova (anglicky)
MCTS, UCT, BMCTS, RAVENázev práce: Řízení prohledávání stromů hry Autor: Jan Vrba Katedra / Ústav: Katedra teoretické informatiky a matematické logiky Vedoucí bakalářské práce: RNDr. Jan Hric Abstrakt: Monte-Carlo Tree Search je metodou prohledávání herního stromu na základě náhodných Monte-Carlo sehrávek. Od doby, kdy byla tato metoda poprvé představena v roce 2006, byla úspěšně použita v mnoha různých oblastech. Za zvláštní zmínku stojí její použití pro hru Go. MCTS je určeno především pro problémy, které mají příliš velký stavový prostor, aby šel prohledat v rozumném čase. Práce s velkým stavovým prostorem a skutečnost, že metoda při rozvíjení vrcholu každý možný tah nejdříve jednou vyzkouší vede k velkým paměťovým nárokům. Tato práce se zabývá možnostmi, kterými může uživatel, v závislosti na provedených náhodných sehrávkách, regulovat paměťovou komplexitu. Klíčová slova: MCTS, UCT, BMCTS, RAVE
Title: A Controlled Searching of Game Trees Author: Jan Vrba Department: Department of Theoretical Computer Science and Mathematical Logic Supervisor: RNDr. Jan Hric Abstract: Monte-Carlo Tree Search is a search algorithm based on random Monte- Carlo playouts. Since it was first introduced in 2006, it has been successfully used in several areas. Most notably for the game Go. MCTS is intended mainly for problems with too large a state space to be fully explored in reasonable time. Working with a large state space and the fact that when evaluating a node, it first explores all possible moves leads to large memory complexity. This work explores options a user can use to regulate memory complexity based on the results of previous Monte-Carlo playouts. Keywords: MCTS, UCT, BMCTS, RAVE
