Distributed Monte-Carlo Tree Search for Games with Team of Cooperative Agents
Distribuovaný MCTS pro hry s týmem kooperujících agendů
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/58995Identifiers
Study Information System: 130713
Collections
- Kvalifikační práce [10928]
Author
Advisor
Referee
Majerech, Vladan
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Theoretical Computer Science
Department
Department of Theoretical Computer Science and Mathematical Logic
Date of defense
10. 9. 2013
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
Multi-agentní systémy, Monte-Carlo tree search, distribuované algoritmyKeywords (English)
Multi-agent systems, Monte-Carlo tree search, distributed algorithmsCílem této práce je návrh, implementace a experimentální evaluace distribuovaných algoritmů pro plánování akcí týmu kooperujících autonomních agentů založených na Monte-Carlo tree search algoritmu. Jednotlivé algoritmy vyžadují rozdílné množství komunikace. V práci jsou shrnuty relevantní poznatky o Monte-Carlo tree search algoritmu, jeho paralelizaci a distribuovatelnosti a~algoritmech pro distribuovanou koordinaci autonomních agentů. Navržené algoritmy jsou testovány v prostředí zjednodušené hry Ms Pac-Man. Testována je síla jednotlivých algoritmů v závislosti na času výpočtu, množství komunikace a robustnosti vůči selhání komunikace. Jednotlivé algoritmy jsou dle těchto charakteristik porovnány. Powered by TCPDF (www.tcpdf.org)
The aim of this work is design, implementation and experimental evaluation of distributed algorithms for planning actions of a team of cooperative autonomous agents. Particular algorithms require different amount of communication. In the work, the related research on Monte-Carlo tree search algorithm, its parallelization and distributability and algorithms for distributed coordination of autonomous agents. Designed algorithms are tested in the environment of the game of Ms Pac-Man. Quality of the algorithms is tested in dependence on computational time, the amount of communication and the robustness against communication failures. Particular algorithms are compared according to these characteristics. Powered by TCPDF (www.tcpdf.org)