Título
Nuevo método de aceleración de los procesos de decisión de Markov
Autor
MA. DE GUADALUPE GARCIA HERNANDEZ
JOSE RUIZ PINALES
SERGIO EDUARDO LEDESMA OROZCO
JUAN GABRIEL AVIÑA CERVANTES
EDGAR ALVARADO MENDEZ
Nivel de Acceso
Acceso Abierto
Materias
INGENIERÍA Y TECNOLOGÍA - (CTI) Procesos de decisión de Markov - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) Ordenamiento topológico - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) Ruta mas corta - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) Markov decision processes - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) Topological ordering - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) Shortest path - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621]) - ([Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011), ISSN: 2007-9621])
Resumen o descripción
En este artículo se presenta un nuevo método de aceleración para resolver a los procesos de decisión de Markov. El clásico algoritmo de iteración de valor ha resuelto satisfactoriamente a estos procesos estocásticos, pero este algoritmo y sus variantes aceleradas han sido lentos con factores de descuento cercanos a la unidad y sus propiedades de convergencia han dependido, en gran medida, de un buen ordenamiento en la actualización de estados. Recientemente se mostró que la iteración de valor presenta buena velocidad de convergencia gracias al uso de un algoritmo de ordenamiento topológico mejorado. Sin embargo, la desventaja de este algoritmo es debida a sus requerimientos de memoria. Aquí se presenta un método diferente para obtener un buen ordenamiento de estados actualizados con menor requerimiento de memoria. De igual manera se presentan los resultados experimentales obtenidos sobre un problema de ruta estocástica más corta.
In this paper we propose a new acceleration method for solving Markov decision processes. Value iteration is a classical algorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for discount factors close to one and their convergence
properties depend to a great extent on a good state update order. Recently, it has been shown that improved topological value iteration presents a good convergence speed thanks to the use of an improved topological ordering algorithm. Nevertheless, the drawback of this
algorithm is due to its memory requirements. So, we present a different method to obtain a good state backup order with less memory requirements. Experimental results obtained on a stochastic shortest path problem are presented.
Editor
Universidad de Guanajuato
Fecha de publicación
2 de febrero de 2012
Tipo de publicación
Artículo
Versión de la publicación
Versión publicada
Recurso de información
Formato
application/pdf
application/pdf
Fuente
Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011)
ISSN: 2007-9621
Idioma
Español
Relación
http://www.actauniversitaria.ugto.mx/index.php/acta/article/view/38/26
Repositorio Orígen
Repositorio Institucional de la Universidad de Guanajuato
Descargas
1