Rizikově senzitivní řízení v markovských řetězcích
Risk sensitive management in Markov chains
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/90597Identifiers
Study Information System: 181799
Collections
- Kvalifikační práce [10690]
Author
Advisor
Referee
Lachout, Petr
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
8. 9. 2017
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
Markovský řetězec, Optimální řízení, Howardův algoritmus, Exponenciální užitková funkceKeywords (English)
Markov chains, Optimal control, Howard's algorithm, Exponential utitility functionTématem této bakalářské práce jsou markovské procesy s diskrétním časem, s konečnou množinou stavů a s oceněním přechodů. Dále uvažujeme konečnou množinu řízení řetězce a zabýváme se hledáním optimálního řízení s ohledem na exponenciální užitkovou funkci. Je uveden iterační algoritmus a následně je dokázáno, že po konečně mnoha krocích nalezne optimální řízení. Dále je ukázáno, že toto řízení je optimální, i kdybychom připustili nehomogenní řízení řetězce. Součástí práce jsou i vybraná tvrzení z Perron-Frobeniovy teorie, která se využijí k důkazům zásadních tvrzení. 1
The main topic of this bachelor thesis is Markov reward chains with finite state set. We consider a markov decision chain with a finite action space and we are concerned on finding an optimal control with respect to exponential utility function. An iterative algorithm is given. Then we prove that after finite number of steps we end up with optimal control. Afterwards we show that optimality of this cotrol is fulfilled, even if we consider an adaptive chain control strategy. In the last part of the work, there is a selection of propositions from Perron-Frobenius theory, which are essential in proofs of theorems. 1