Título

Algoritmo de aprendizaje para redes bayesianas de nodos temporales

Autor

PABLO FRANCISCO HERNANDEZ LEAL

Colaborador

LUIS ENRIQUE SUCAR SUCCAR (Asesor de tesis)

JESUS ANTONIO GONZALEZ BERNAL (Asesor de tesis)

Nivel de Acceso

Acceso Abierto

Resumen o descripción

Bayesian networks have become the reference model to deal with uncertainty due to its easy understanding and different inference and learning algorithms. However, Bayesian networks can not deal with temporal information. The model known as Temporal Nodes Bayesian Networks (TNBN) is an extension that combines uncertainty reasoning with temporal information, but it has not been used extensively due to a lack of learning algorithms for this type of networks. In this thesis we propose a learning algorithm for Temporal Nodes Bayesian Networks that obtains the structure, the intervals and the associated parameters. The algorithm has three main steps: an initial discretization of the temporal nodes, learning of an initial structure and a refinement of the intervals using the structure information. The intervals’ learning algorithm uses a clustering technique to obtain the temporal intervals. The algorithm was evaluated with synthetic data of three TNBNs of different sizes with two distributions to generate the temporal data. In the experiments the algorithm obtained better scores than the baselines, particularly in structural quality and temporal error. The algorithm was also applied with real data, on one side it was applied in prediction and fault diagnosis in a subsystem of a power plant. For this application the algorithm was evaluated using different number of cases in terms of predictive score, temporal error and number of intervals. On the other, it was applied with data from patients with HIV in order to obtain mutational networks; i.e. networks that show the temporal evolution of the mutations with respect to certain drugs. For these experiments, the models were qualitatively evaluated by experts.

Las Redes Bayesianas se han vuelto el modelo de referencia para manejar incertidumbre

debido a su facilidad de interpretación y diversos métodos de inferencia y aprendizaje. Sin

embargo, las redes bayesianas tradicionales no pueden manejar información temporal. El

modelo conocido como Redes Bayesianas de Nodos Temporales (RBNT) es una extensión

que combina el manejo de incertidumbre con información temporal, pero su uso no se ha

extendido debido a que no existen métodos de aprendizaje para estas redes.

En esta tesis proponemos un algoritmo de aprendizaje de Redes Bayesianas de Nodos

Temporales que obtiene la estructura, los intervalos y los parámetros asociados. El algoritmo

se compone de tres pasos principales: una discretización inicial de los nodos temporales, la

obtención de una estructura inicial y posteriormente un refinamiento de los intervalos usando

información de la red. El algoritmo de aprendizaje de intervalos hace uso de un algoritmo

basado en agrupamiento para obtener los intervalos temporales. El conjunto de intervalos

que obtenga el mejor puntaje predictivo es seleccionado.

El algoritmo fue evaluado con datos sintéticos de tres RBNTs de diferentes tamaños

con dos distribuciones diferentes para generar los datos temporales. En los experimentos el

algoritmo superó a los algoritmos base y obtuvo la mejor calidad estructural y el menor

error temporal. El algoritmo también fue aplicado con datos reales, por un lado, en predicción y diagnóstico de fallas en un subsistema de una planta eléctrica. Para esta aplicación

el algoritmo se evaluó con diferente número de casos de entrada en términos de calidad

predictiva, error temporal y número de intervalos. Por otro lado, también se probó con

datos de pacientes con VIH para obtener redes mutacionales; es decir redes, que muestren

la evolución temporal de las mutaciones con respecto a ciertos medicamentos. Para esta

aplicación los modelos fueron evaluados cualitativamente por los expertos.

Editor

Instituto Nacional de Astrofísica, Óptica y Electrónica

Fecha de publicación

julio de 2011

Tipo de publicación

Tesis de maestría

Versión de la publicación

Versión aceptada

Formato

application/pdf

Idioma

Español

Audiencia

Estudiantes

Investigadores

Público en general

Sugerencia de citación

Hernandez-Leal P.F.

Repositorio Orígen

Repositorio Institucional del INAOE

Descargas

10946

Comentarios



Necesitas iniciar sesión o registrarte para comentar.