Optimalidad ergódica en el modelo de Mitra-Wan y en juegos markovianos

Leonardo Ramiro Laura Guarachi

Título

Autor

Leonardo Ramiro Laura Guarachi

Colaborador

Onésimo Hernández Lerma (Asesor de tesis)

Nivel de Acceso

Acceso Abierto

Licencia

http://creativecommons.org/licenses/by-nc-nd/4.0

Materias

CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA - (CTI) IFM-D-2015-1778 Sistemas Horizonte Optimalidad

Resumen o descripción

Instituto de Física y Matemáticas. Facultad de Ciencias Físico Matemáticas. Unidad Morelia del Instituto de Matemáticas de la UNAM. Programa Conjunto de Doctorado en Matemáticas

One of the most important models in the area of sustainable forest resource management, which is still a guiding principle for the policy makers, was introduced by Mitra and Wan in the 1980s. Under certain conditions, this model has revealed some qualitative properties that non-stationary optimal policies have. It also ensures the existence of an optimal stationary policy —which is understood as the maximum sustainable state— where all the optimal non-stationary policies converge. In this work the Mitra-Wan forestry model is studied as a discrete-time optimal control problem in infinite horizon. To this end, we consider some of the most significant optimality criteria: long-run average (or ergodic) optimality, good optimality, overtaking optimality and bias optimality. On the other hand, Shapley studied a two-person stochastic zero-sum game in his seminal work [70]. In this class of games there is a single payoff function which one of the players wishes to maximize whereas the other player wishes to minimize. In subsequent studies, the properties and characterization of the expected average optimality criterion were extensively developed. However, there are just a few treatments on the other optimality criteria. In our study, we consider a general model of two-person zero-sum Markov game and investigate the optimal strategies for the players. For that propose, we will extend the optimality criteria aforementioned and, additionally, we introduce average F-strong optimality and optimality n-discounted criteria. Our main contribution, in both models, is the complete description of the relations between the optimality criteria that we are considering in each model. Moreover, we also show some asymptotic properties for the optimal policies, as well as some examples that illustrate the main results.

Uno de los modelos más importantes en el área de la administración sostenible de recursos forestales, que continúa siendo una referencia para la planificación de políticas de administración, ha sido introducido por los autores Mitra y Wan durante la década de los años 80. Bajo ciertas condiciones, este modelo ha permitido conocer algunas de las propiedades cualitativas que una política óptima (no estacionaria) tiene. Así mismo, asegura la existencia de una política estacionaria óptima —que se entiende como el máximo estado sostenible— al que convergen las políticas no estacionarias óptimas. En este trabajo el modelo de Mitra-Wan se estudia como un problema de control óptimo a tiempo discreto y horizonte infinito. Para ello consideraremos algunos de los criterios de optimalidad más significativos: optimalidad en promedio, optimalidad buena, optimalidad rebasante y optimalidad en sesgo. Por otra parte, Shapley introdujo un primer modelo de juegos estocásticos en [70]. En este tipo de juegos existe una única función de pago; el primer jugador trata de maximizar dicha función, en cambio el segundo jugador trata de minimizar. En posteriores investigaciones, se ha estudiado extensivamente las propiedades y caracterizaciones del criterio de optimalidad promedio esperado. Sin embargo, existen pocos tratamientos sobre el resto de los criterios. En nuestro estudio consideramos un modelo general de juegos markovianos de suma cero y de dos jugadores. Para estudiar las estrategias óptimas de los jugadores, extenderemos los criterios de optimalidad mencionados anteriormente y, adicionalmente, introduciremos la optimalidad promedio F-fuerte y los criterios de optimalidad n-descontada. Nuestro aporte principal, en ambos modelos, es la descripción completa de las relaciones que existen entre los criterios que estamos considerando. Además, mostramos ciertas propiedades cualitativas que las políticas óptimas poseen, así mismo, proporcionamos algunos ejemplos que ilustran las conclusiones principales.

Editor

Universidad Michoacana de San Nicolás de Hidalgo

Fecha de publicación

octubre de 2015

Tipo de publicación

Tesis de doctorado

Recurso de información

http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/2221

Formato

application/pdf

Idioma

Español

Repositorio Orígen

Repositorio Institucional de la Universidad Michoacana de San Nicolás de Hidalgo

Descargas

0

Comentarios

Necesitas iniciar sesión o registrarte para comentar.