Continuity of optimal values and solutions for control of Markov chains with constraints
[Continuité de la valeur optimale et solutions pour les chaînes de Markov contrôlées avec contraintes]
Résumé
Lors de la résolution pratique de jeux dynamiques, la difficulté provient non seulement du fait que l'espace d'état est continu, mais souvent aussi du fait qu'il est infini. La discrétisation de l'espace doit donc s'accompagner d'une troncature. Ceci conduit à construire une suite d'approximations, et il s'agit de prouver que les solutions des problèmes approchés convergent bien vers la solution du problème initial. Plusieurs résultats dans cette direction ont été obtenus. Outre l'approximation de la fonction Valeur, ces travaux concernent un aspect plus nouveau : l'approximation des stratégies elles-mêmes. Les auteurs ont ainsi étudié certains aspects de robustesse des stratégies optimales et développé une théorie générale pour problèmes de contrôle avec contraintes qu'ils ont appliquée aux processus de décision Markoviens.