Optimální rizikově senzitivní řízení v radikálních řetězcích
Optimal risk sensitive control in radical chains
bakalářská práce (NEOBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/175568Identifikátory
SIS: 194678
Kolekce
- Kvalifikační práce [10678]
Autor
Vedoucí práce
Oponent práce
Maslowski, Bohdan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná matematika
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
7. 9. 2022
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Neprospěl/a
Klíčová slova (česky)
Markovovy řetězce|radikální řetězce|Howardův algoritmus|diskontování|optimální řízeníKlíčová slova (anglicky)
Markov chains|radical chains|Howard's algorithm|discounting|optimal controlTato práce se v první části zabývá markovskými řetězci s diskrétním časem a s ko- nečnou množinou stavů. Následně je zavedeno ocenění přechodů a možnost řízení těchto řetězců. Výnosy z ocenění přechodů jsou pak dosazeny do exponenciální užitkové funkce a ta je diskontována k počátku. Poté představuje Howardův iterační algoritmus, který nalezne optimální řízení. Toto řízení je optimální jak mezi homogenními, tak mezi neho- mogenními řízeními. Ve druhé části pak řízené markovské řetězce zobecňuje na takzvané radikální řetězce, opět s diskrétním časem a s konečnou množinou stavů. Toto zobec- nění je provedeno přidáním možnosti volit radikální rozhodnutí, která probíhají mimo reálný čas. Howardův iterační algoritmus je poté upraven pro tento obecnější případ. Řízení, které nalezne je opět optimální jak mezi homogenními, tak mezi nehomogenními řízeními. 1
In the first segment this thesis deal with Markov chains with discreet time and a finite set of states. Subsequently there is introduced valuation of transitions and a possibility of controlling these chains. Yields from valuation of transitions are then appointed to exponential utility funcion and discounted to the begining. Afterwards there is estab- lished Howard's iterative algorithm, which finds optimal control. The control is optimal amongst homogeneous and non-homogeneous controls. In the second segment, Markov chains are generalized to so called radical chains, again with discreet time and a finite set of states. The generalization is executed by adding an opportunity of choosing radical decisions, which take place out of real time. Howard's iterative algorithm is modified for this more general case. The control found by the algorithm is optimal amongst homoge- neous and non-homogeneous controls. 1