Título

Supervised classifiers based on emerging patterns for class imbalance problems

Autor

OCTAVIO LOYOLA GONZALEZ

Colaborador

JOSE FRANCISCO MARTINEZ TRINIDAD (Asesor de tesis)

MILTON GARCÍA BORROTO (Asesor de tesis)

Nivel de Acceso

Acceso Abierto

Resumen o descripción

In the last years, emerging pattern-based classifiers have become an important family of supervised classifiers. However, in those problems where the objects are not equally distributed into the classes (class imbalance problems), emerging pattern mining algorithms, not designed for this kind of problems, extract several emerging patterns with high support for the majority class and only a few (or none) emerging patterns with low support for the minority class. As a consequence, emerging pattern-based classifiers tend to bias their classification results toward the majority class; obtaining poor classification results for the minority class. Hence, in this PhD research, we first present a study about the effect of class imbalance on quality measures for patterns; from this study, we select the best measure for ranking emerging patterns in class imbalance problems. Additionally, we propose three new algorithms for extracting emerging patterns from imbalanced databases. Our emerging pattern mining algorithms extract a collection of emerging patterns which allows attaining higher accuracies for supervised classification in class imbalance problems than those emerging patterns extracted by other emerging pattern miners developed for this kind of problems. Finally, we propose a new emerging pattern-based classifier specifically designed for class imbalance problems, which obtains significantly better classification results than other classifiers for class imbalance problems reported in the literature.

Los clasificadores basados en patrones emergentes son una familia importante de clasificadores dentro de la clasificación supervisada. Sin embargo, en aquellos problemas dónde los objetos no están distribuidos equitativamente entre las clases (problemas con desbalance de clases), los algoritmos para la extracción de patrones emergentes, que no toman en cuenta este tipo de problemas, extraen muchos patrones emergentes con alto soporte para la clase mayoritaria y sólo unos pocos (a veces ninguno) patrones emergentes con bajo soporte para la clase minoritaria. Como consecuencia, los clasificadores basados en patrones emergentes tienden a sesgar sus resultados de clasificación hacia la clase mayoritaria; obteniendo así, bajos resultados de clasificación para la clase minoritaria. Por ello, en esta investigación doctoral, primero presentamos un estudio acerca del efecto del desbalance de clases en las medidas de calidad para patrones. Adicionalmente, propusimos tres nuevos algoritmos para extraer patrones emergentes en bases de datos con desbalance de clases. Estos algoritmos extraen una colección de patrones emergentes que permiten obtener mayor eficacia, en problemas con desbalance de clases, que la que puede obtenerse al utilizar la colección de patrones emergentes extraídos mediante otros extractores de patrones emergentes reportados en la literatura. Finalmente, propusimos un nuevo clasificador basado en patrones emergentes, específicamente diseñado para problemas con desbalance de clases, que obtiene significativamente mejores resultados de clasificación que aquellos clasificadores reportados en la literatura para problemas con desbalance de clases.

Editor

Instituto Nacional de Astrofísica, Óptica y Electrónica

Fecha de publicación

octubre de 2017

Tipo de publicación

Tesis de doctorado

Versión de la publicación

Versión aceptada

Formato

application/pdf

Idioma

Inglés

Audiencia

Estudiantes

Investigadores

Público en general

Sugerencia de citación

Loyola-González O.

Repositorio Orígen

Repositorio Institucional del INAOE

Descargas

1051

Comentarios



Necesitas iniciar sesión o registrarte para comentar.