Distributed Monte-Carlo Tree Search for Games with Team of Cooperative Agents
Distribuovaný MCTS pro hry s týmem kooperujících agendů
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/58995Identifikátory
SIS: 130713
Kolekce
- Kvalifikační práce [10928]
Autor
Vedoucí práce
Oponent práce
Majerech, Vladan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Teoretická informatika
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
10. 9. 2013
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
Multi-agentní systémy, Monte-Carlo tree search, distribuované algoritmyKlíčová slova (anglicky)
Multi-agent systems, Monte-Carlo tree search, distributed algorithmsCílem této práce je návrh, implementace a experimentální evaluace distribuovaných algoritmů pro plánování akcí týmu kooperujících autonomních agentů založených na Monte-Carlo tree search algoritmu. Jednotlivé algoritmy vyžadují rozdílné množství komunikace. V práci jsou shrnuty relevantní poznatky o Monte-Carlo tree search algoritmu, jeho paralelizaci a distribuovatelnosti a~algoritmech pro distribuovanou koordinaci autonomních agentů. Navržené algoritmy jsou testovány v prostředí zjednodušené hry Ms Pac-Man. Testována je síla jednotlivých algoritmů v závislosti na času výpočtu, množství komunikace a robustnosti vůči selhání komunikace. Jednotlivé algoritmy jsou dle těchto charakteristik porovnány. Powered by TCPDF (www.tcpdf.org)
The aim of this work is design, implementation and experimental evaluation of distributed algorithms for planning actions of a team of cooperative autonomous agents. Particular algorithms require different amount of communication. In the work, the related research on Monte-Carlo tree search algorithm, its parallelization and distributability and algorithms for distributed coordination of autonomous agents. Designed algorithms are tested in the environment of the game of Ms Pac-Man. Quality of the algorithms is tested in dependence on computational time, the amount of communication and the robustness against communication failures. Particular algorithms are compared according to these characteristics. Powered by TCPDF (www.tcpdf.org)