Título

Construcción automática de un modelo de predicción a partir del análisis de datos desbalanceados

Autor

GERMAN CUAYA SIMBRO

Colaborador

ANGELICA MUÑOZ MELENDEZ (Asesor de tesis)

EDUARDO FRANCISCO MORALES MANZANARES (Asesor de tesis)

Nivel de Acceso

Acceso Abierto

Resumen o descripción

Esta investigación se orienta al procesamiento y análisis de datos con características

particulares como son, datos temporales, incertidumbre en los

datos, bases de datos con clases binarias, datos con clases desbalanceadas,

datos con un evento de interés en la clase minoritaria, datos no estacionarios.

Las propiedades anteriores son propias de colecciones de datos del dominio

biomédico, industrial, económico, por mencionar algunos ejemplos.

Así, la tesis contribuye en tres áreas principales. En primer lugar, en la construcción

de un método de selección de variables que favorece la identificación

de la clase minoritaria en bases de datos con clases desbalanceadas.

Segundo, la representación y construcción de un modelo dinámico

probabilista, en la forma de una Red Bayesiana Dinámica no estacionaria

que permite pronosticar la ocurrencia de un evento de la clase mayoritaria

y minoritaria, favoreciendo a la clase minoritaria, y tercero la aplicación del

método propuesto para la construcción de un modelo de la marcha para

pronóstico de caídas en adultos mayores.

Los resultados obtenidos muestran que el algoritmo de selección de variables

propuesto ayuda a seleccionar mejor las variables relevantes para identificar

un evento en la clase minoritaria en bases de datos con clases binarias, tanto

balanceadas como desbalanceadas, que algoritmos tradicionales de selección

de variables.

Por otro lado, el modelo propuesto basado en una red Bayesiana dinámica

no estacionaria obtiene un mejor desempeño para el pronóstico de la clase

minoritaria en datos estacionarios con clases balanceadas y desbalanceadas y

datos no estacionarios con clases balanceadas y desbalanceadas, que modelos

construidos con técnicas convencionales como las Redes Bayesianas Dinámicas.

Además, se tiene evidencia de que los modelos construidos utilizando

selección de variables tienen un mejor desempeño que los modelos construidos

usando todas las variables del conjunto de datos.

El interés en el análisis de este tipo de datos surgió del estudio de la degradación

de la marcha. Los modelos propuestos en esta tesis proporcionan

información adicional a los expertos en el análisis clínico de la marcha, con

quienes se interactuó directamente, dado que no conocen con precisión cuáles

son las variables más relevantes que reflejen la degradación patológica de la

marcha, ni la manera en que los cambios en las variables de la marcha son

desencadenados en personas con alto riesgo de sufrir caídas.

Editor

Instituto Nacional de Astrofísica, Óptica y Electrónica

Fecha de publicación

mayo de 2013

Tipo de publicación

Tesis de doctorado

Versión de la publicación

Versión aceptada

Formato

application/pdf

Idioma

Español

Audiencia

Estudiantes

Investigadores

Público en general

Sugerencia de citación

Cuaya-Simbro G.

Repositorio Orígen

Repositorio Institucional del INAOE

Descargas

1180

Comentarios



Necesitas iniciar sesión o registrarte para comentar.