Optimální rizikově senzitivní řízení v radikálních řetězcích

Picek, Radovan

Optimal risk sensitive control in radical chains

bakalářská práce (NEOBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (348.5Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/175568

Identifikátory

SIS: 194678

Oponent práce

Maslowski, Bohdan

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Obecná matematika

Katedra / ústav / klinika

Katedra pravděpodobnosti a matematické statistiky

Datum obhajoby

7. 9. 2022

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Čeština

Známka

Neprospěl/a

Klíčová slova (česky)

Markovovy řetězce|radikální řetězce|Howardův algoritmus|diskontování|optimální řízení

Klíčová slova (anglicky)

Markov chains|radical chains|Howard's algorithm|discounting|optimal control

Tato práce se v první části zabývá markovskými řetězci s diskrétním časem a s ko- nečnou množinou stavů. Následně je zavedeno ocenění přechodů a možnost řízení těchto řetězců. Výnosy z ocenění přechodů jsou pak dosazeny do exponenciální užitkové funkce a ta je diskontována k počátku. Poté představuje Howardův iterační algoritmus, který nalezne optimální řízení. Toto řízení je optimální jak mezi homogenními, tak mezi neho- mogenními řízeními. Ve druhé části pak řízené markovské řetězce zobecňuje na takzvané radikální řetězce, opět s diskrétním časem a s konečnou množinou stavů. Toto zobec- nění je provedeno přidáním možnosti volit radikální rozhodnutí, která probíhají mimo reálný čas. Howardův iterační algoritmus je poté upraven pro tento obecnější případ. Řízení, které nalezne je opět optimální jak mezi homogenními, tak mezi nehomogenními řízeními. 1

Abstrakt (anglicky)

In the first segment this thesis deal with Markov chains with discreet time and a finite set of states. Subsequently there is introduced valuation of transitions and a possibility of controlling these chains. Yields from valuation of transitions are then appointed to exponential utility funcion and discounted to the begining. Afterwards there is estab- lished Howard's iterative algorithm, which finds optimal control. The control is optimal amongst homogeneous and non-homogeneous controls. In the second segment, Markov chains are generalized to so called radical chains, again with discreet time and a finite set of states. The generalization is executed by adding an opportunity of choosing radical decisions, which take place out of real time. Howard's iterative algorithm is modified for this more general case. The control found by the algorithm is optimal amongst homoge- neous and non-homogeneous controls. 1

Citace dokumentu

Metadata

Zobrazit celý záznam