Řízení prohledávání stromů hry

Vrba, Jan

A Controlled Searching of Game Trees

bakalářská práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (479.2Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/94814

Identifikátory

SIS: 176554

Oponent práce

Majerech, Vladan

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Programování a softwarové systémy

Katedra / ústav / klinika

Katedra teoretické informatiky a matematické logiky

Datum obhajoby

31. 1. 2018

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Čeština

Známka

Výborně

Klíčová slova (česky)

MCTS, UCT, BMCTS, RAVE

Klíčová slova (anglicky)

MCTS, UCT, BMCTS, RAVE

Název práce: Řízení prohledávání stromů hry Autor: Jan Vrba Katedra / Ústav: Katedra teoretické informatiky a matematické logiky Vedoucí bakalářské práce: RNDr. Jan Hric Abstrakt: Monte-Carlo Tree Search je metodou prohledávání herního stromu na základě náhodných Monte-Carlo sehrávek. Od doby, kdy byla tato metoda poprvé představena v roce 2006, byla úspěšně použita v mnoha různých oblastech. Za zvláštní zmínku stojí její použití pro hru Go. MCTS je určeno především pro problémy, které mají příliš velký stavový prostor, aby šel prohledat v rozumném čase. Práce s velkým stavovým prostorem a skutečnost, že metoda při rozvíjení vrcholu každý možný tah nejdříve jednou vyzkouší vede k velkým paměťovým nárokům. Tato práce se zabývá možnostmi, kterými může uživatel, v závislosti na provedených náhodných sehrávkách, regulovat paměťovou komplexitu. Klíčová slova: MCTS, UCT, BMCTS, RAVE

Abstrakt (anglicky)

Title: A Controlled Searching of Game Trees Author: Jan Vrba Department: Department of Theoretical Computer Science and Mathematical Logic Supervisor: RNDr. Jan Hric Abstract: Monte-Carlo Tree Search is a search algorithm based on random Monte- Carlo playouts. Since it was first introduced in 2006, it has been successfully used in several areas. Most notably for the game Go. MCTS is intended mainly for problems with too large a state space to be fully explored in reasonable time. Working with a large state space and the fact that when evaluating a node, it first explores all possible moves leads to large memory complexity. This work explores options a user can use to regulate memory complexity based on the results of previous Monte-Carlo playouts. Keywords: MCTS, UCT, BMCTS, RAVE

Citace dokumentu

Metadata

Zobrazit celý záznam