Author: MAURICIO ALFONSO GARCIA LIMON

Generación simultánea de prototipos y características mediante programación genética Multi-Objetivo

MAURICIO ALFONSO GARCIA LIMON (2014)

El método de vecinos más cercanos es una de las técnicas más populares y altamente

efectivas usadas en tareas de reconocimiento de patrones. Sin embargo, este método

tiene distintas desventajas que deterioran su rendimiento en problemas a gran escala,

y bases de datos con instancias mal clasificadas a priori. Algunas de esas desventajas

incluyen: alto espacio en almacenamiento, ser sensibles a instancias mal etiquetadas en

el conocimiento a priori, y alto costo computacional para estimar la distancia entre todas

las instancias almacenadas. Para atacar esos problemas diferentes técnicas han sido

propuestas. La generación de prototipos (PG) es una técnica para reducir el número

de instancias. Por otra parte, la generación de características (FE) es una técnica que

construye un nuevo espacio de características para representar de mejor manera el

conjunto de instancias. Tradicionalmente, ambas técnicas han sido aplicadas de manera

independiente. En este trabajo de tesis se presentan dos métodos evolutivos para la

generación simultánea de prototipos y características, el primero guía la búsqueda de

soluciones mediante un objetivo, es decir la exactitud de la clasificación, el segundo

considera en el proceso de búsqueda de soluciones tres distintos objetivos, exactitud

de la clasificación, la reducción de instancias y la reducción de características. El

objetivo de ambos métodos es encontrar un buen compromiso entre la exactitud

de la clasificación, reducción de instancias y reducción de características utilizando

el clasificador de vecinos más cercanos. El método multi-objetivo está basado en el

algoritmo NSGA-II, y en el método mono-objetivo. La idea principal de los métodos

propuestos es combinar las distintas instancias para generar prototipos, de la misma

manera, combinar las distintas características para construir otras más descriptivas,

esto se realiza mediante programación genética. La diferencia principal entre el método

multi-objetivo y los métodos en el estado del arte, es que el enfoque multi-objetivo

construye un conjunto de características para cada clase. Ambos métodos superan las

limitaciones del método de vecinos más cercanos sin comprometer su rendimiento en

la tarea de clasificación. Los resultados experimentales son reportados y comparados

con distintos métodos en el estado del arte.

Master thesis

Classification Pattern recognition Genetic algorithms Optimisation CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA MATEMÁTICAS CIENCIA DE LOS ORDENADORES

Term-weighting learning via genetic programming for text classification

Hugo Jair Escalante MAURICIO ALFONSO GARCIA LIMON Alicia Morales-Reyes Manuel Montes_y_Gómez Eduardo Morales JOSE MARTINEZ CARRANZA MARIO GRAFF GUERRERO (2015)

This paper describes a novel approach to learning term-weighting schemes (TWSs) in the context of text classification. In text mining a TWS determines the way in which documents will be represented in a vector space model, before applying a classifier. Whereas acceptable performance has been obtained with standard TWSs (e.g., Boolean and term-frequency schemes), the definition of TWSs has been traditionally an art. Further, it is still a difficult task to determine what is the best TWS for a particular problem and it is not clear yet, whether better schemes, than those currently available, can be generated by combining known TWS. We propose in this article a genetic program that aims at learning effective TWSs that can improve the performance of current schemes in text classification. The genetic program learns how to combine a set of basic units to give rise to discriminative TWSs. We report an extensive experimental study comprising data sets from thematic and non-thematic text classification as well as from image classification. Our study shows the validity of the proposed method; in fact, we show that TWSs learned with the genetic program outperform traditional schemes and other TWSs proposed in recent works. Further, we show that TWSs learned from a specific domain can be effectively used for other tasks.

Article

Programación genética INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS

Image annotation as Text-Image matching: Challenge design and results

Luis Luis Pellegrin OCTAVIO LOYOLA GONZALEZ JOSE ORTIZ BEJAR MIGUEL ANGEL MEDINA PEREZ ANDRES EDUARDO GUTIERREZ RODRIGUEZ Eric Sadit Téllez Avila MARIO GRAFF GUERRERO SABINO MIRANDA JIMENEZ Daniela Moctezuma MAURICIO ALFONSO GARCIA LIMON ALICIA MORALES REYES CARLOS ALBERTO REYES GARCIA Eduardo Morales Manzanares Hugo Jair Escalante (2019)

This paper describes the design of the 2017 RedICA: Text-Image Matching (RICATIM) challenge, including the dataset generation, a complete analysis of results, and the descriptions of the top-ranked developed methods. The academic challenge explores the feasibility of a novel binary image classification scenario, where each instance corresponds to the concatenation of learned representations of an image and a word. Instances are labeled as positive if the word is relevant for describing the visual content of the image, and negative otherwise. This novel approach of the image classification problem poses an alternative scenario where any text-image pair can be represented in such space, so any word could be considered for describing an image. The proposed methods are diverse and competitive, showing considerable improvements over the proposed baselines.

Article

Text-image matching Image annotation Multimodal information processing INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS