Approximating ergodic average reward continuous: time controlled Markov chains

Lorenzo Magán, José María

doi:10.1109/TAC.2009.2033848

Approximating ergodic average reward continuous: time controlled Markov chains

Download

Approximating ergodic average.pdf (296.69 KB)

Publication date

2010

Authors

Lorenzo Magán, José María

Publisher

IEEE

Citations

Exportar

URI

https://hdl.handle.net/20.500.14352/108643

Citation

T. Prieto-Rumeau and J. M. Lorenzo, "Approximating Ergodic Average Reward Continuous-Time Controlled Markov Chains," in IEEE Transactions on Automatic Control, vol. 55, no. 1, pp. 201-207, Jan. 2010, doi: 10.1109/TAC.2009.2033848. keywords: {Convergence;Optimal control;State-space methods;Statistics;Operations research;Process control;Adaptive control;Terminology;Approximation of control problems;Ergodic Markov decision processes (MDPs);policy iteration algorithm},

Abstract

We study the approximation of an ergodic average reward continuous-time denumerable state Markov decision process (MDP) by means of a sequence of MDPs. Our results include the convergence of the corresponding optimal policies and the optimal gains. For a controlled upwardly skip-free process, we show some computational results to illustrate the convergence theorems

UCM subjects

Estadística

Unesco subjects

1209 Estadística

Collections

Artículos

Full item page

Approximating ergodic average reward continuous: time controlled Markov chains

Download

Official URL

Full text at PDC

Publication date

Authors

Advisors (or tutors)

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations

Exportar

URI

Citation

Abstract

Research Projects

Organizational Units

Journal Issue

Description

UCM subjects

Unesco subjects

Keywords

Collections