Author: MARIO GRAFF GUERRERO

Strategy for the automated diagnostic of the openess degree in government data

RAMON REYES CARRION MARIO GRAFF GUERRERO Elio Atenógenes Villaseñor García (2016)

Propósito: una estrategia de análisis de información de extracción de datos y modelos, para evaluar de una manera (semi) automatizada, los datos del gobierno mexicano que analizan la pertinencia, capacidad y organización de los datos abiertos del gobierno mexicano.

Diseño / metodología / enfoque: Proponemos un estudio detallado de los formatos, estructura, temporalidad, uniformidad, acceso, herramientas disponibles, para determinar el grado de apertura de los datos del gobierno mexicano. Además, los resultados obtenidos del estudio, servirán para el modelado y la evaluación de la información para diseñar e implementar las estrategias de análisis de los datos de gobierno abierto, utilizando técnicas avanzadas de análisis de big data.

Originalidad / valor: esta metodología pone en evidencia la viabilidad de las categorías definidas por el grupo de investigación: "Seminario de Investigación de gobierno abierto y big data". Por último, diagnosticamos los datos del gobierno mexicano utilizando herramientas de análisis de big data.

Implicaciones prácticas: el resultado será la aplicación de herramientas de análisis de big data para abrir datos susceptibles de aplicarse a los datos del gobierno de los países en desarrollo. El modelado de los datos será el punto de partida o el diseño e implementación de las estrategias de análisis de datos o se aplicará al gobierno abierto a través del uso de herramientas avanzadas de análisis de datos.

Article

Tecnologías de la Información y Comunicación Big data Análisis de datos México INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS

Semantic Crossover Operator for GP based on the Second Partial Derivative of the Error Function

RANYART RODRIGO SUAREZ PONCE DEL LEON JUAN JOSE FLORES ROMERO MARIO GRAFF GUERRERO (2015)

In recent years, a variety of semantic operators have been successfully developed to improve the performance of GP. This work presents a new semantic operator based on the semantic crossover based on the partial derivative error. The operator presented here uses the information of the second partial derivative to choose a crossover point in the second parent. The results show an improvement with respect to previous semantic operator.

Article

Tecnologías de Información y Comunicación INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS

Minería de opinión en blogs financieros para la predicción de tendencias en mercados bursátiles

Sergio Hernández SABINO MIRANDA JIMENEZ ERIC SADIT TELLEZ AVILA MARIO GRAFF GUERRERO Elio Atenógenes Villaseñor García (2015)

El análisis de redes sociales para el estudio de mercados financieros se ha vuelto un tema de investigación y desarrollo de herramientas que permite a los agentes financieros usar las opiniones de la gente para aumentar la precisión en las predicciones de mercado. Nuestra investigación se enfoca en la predicción de la tendencia de índices financieros usando la minería de opinión, basado en el análisis de blogs especializados en finanzas para el idioma inglés. Los comenta-rios vertidos en estos blogs son clasificados en términos de su opinión respecto a la tendencia de mercado (a la alza, estable o a la baja). Se evalúan distintas téc-nicas de aprendizaje computacional y minería de textos para la clasificación de los comentarios realizados durante un periodo de tres meses. Los resultados ob-tenidos muestran que este análisis puede ser incorporado como un factor en la toma de decisión de los agentes financieros y mejorar la precisión de sus proyec-ciones.

Article

Minería de opinión INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS

INGEOTEC at SemEval 2017 Task 4: A B4MSA Ensemble based on Genetic Programming for Twitter Sentiment Analysis

SABINO MIRANDA JIMENEZ MARIO GRAFF GUERRERO Eric Tellez DANIELA MOCTEZUMA GARCIA (2017)

Este documento describe el sistema utilizado en SemEval-2017 Tarea 4 (Subtarea A): Clasificación de polaridad de mensaje para ambos idiomas, inglés y árabe. Nuestro sistema propuesto es un conjunto de dos capas, el primero usa nuestro marco genérico para la clasificación de polaridad multilingüe (B4MSA) y la segunda capa combina todos los valores de función de decisión predichos por sistemas B4MSA usando una función no lineal desarrollada usando un sistema de Programación Genética, EvoDAG . Con este enfoque, los mejores rendimientos alcanzados por nuestro sistema fueron la recuperación de macro0.68 (en inglés) y 0.477 (en árabe), que nos colocaron en sexta y cuarta posición en la tabla de resultados, respectivamente.

Article

Tecnologías de la Información y Comunicación Lingüística Aplicada Análisis de sentimiento Twitter INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS

EvoMSA: A Multilingual Evolutionary Approach for Sentiment Analysis

MARIO GRAFF GUERRERO SABINO MIRANDA JIMENEZ Eric Sadit Téllez Avila Daniela Moctezuma (2019)

Sentiment analysis (SA) is a task related to understanding people's feelings in written text; the starting point would be to identify the polarity level (positive, neutral or negative) of a given text, moving on to identify emotions or whether a text is humorous or not. This task has been the subject of several research competitions in a number of languages, e.g., English, Spanish, and Arabic, among others. In this contribution, we propose an SA system, namely EvoMSA, that our participating systems in various SA competitions, making it domain independent and multilingual by processing text using only language-independent techniques.

EvoMSA is based on Genetic Programming that works by combining the output of text classifers to produce the final prediction. We analyzed EvoMSA on diferent SA competitions to provide a global overview of its performance. The results indicated that EvoMSA is competitive obtaining top rankings in several SA competitions. Furthermore, we performed an analysis of EvoMSA's components to measure their contribution to the performance; the aim was to facilitate a practitioner or newcomer to implement a competitive SA classifer. Finally, it is worth to mention that EvoMSA is available as open source software.

Article

Lenguaje de programación Máquina de aprendizaje INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS TECNOLOGÍA DE LOS ORDENADORES LENGUAJES DE PROGRAMACIÓN LENGUAJES DE PROGRAMACIÓN

Semantic Genetic Programming Operators Based on Projections in the Projections in the Phenotype Space

ERIC SADIT TELLEZ AVILA SABINO MIRANDA JIMENEZ MARIO GRAFF GUERRERO Elio Atenógenes Villaseñor García (2015)

In the Genetic Programming (GP) community there has been a great interest in developing semantic genetic operators. These type of operators use information of the phenotype to create ospring. The most recent approaches of semantic GP include the GP framework based on the alignment of error space, the geometric semantic genetic operators, and backpropagation genetic operators. Our contribution proposes two semantic operators based on projections in the phenotype space. The proposed operators have the characteristic, by construction, that the ospring's tness is as at least as good as the tness of the best parent; using as tness the euclidean distance. The semantic operators proposed increment the learning capabilities of GP. These operators are compared against a traditional GP and Geometric Semantic GP in the Human oral bioavailability regression problem and 13 classication problems. The results show that a GP system with our novel semantic operators has the best performance in the training phase in all the problems tested.

Article

Tecnologías de la Información y Comunicación INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS

Soft computing methods with phase space reconstruction for wind speed forecasting—A performance comparison

MARIO GRAFF GUERRERO Juan Flores José Cedeño HECTOR RODRIGUEZ RANGEL RODRIGO LOPEZ FARIAS Felix Calderon (2019)

This article presents a comparison of wind speed forecasting techniques, starting with the Auto-regressive Integrated Moving Average, followed by Artificial Intelligence-based techniques. The objective of this article is to compare these methods and provide readers with an idea of what method(s) to apply to solve their forecasting needs. The Artificial Intelligence-based techniques included in the comparison are Nearest Neighbors (the original method, and a version tuned by Differential Evolution), Fuzzy Forecasting, Artificial Neural Networks (designed and tuned by Genetic Algorithms), and Genetic Programming. These techniques were tested against twenty wind speed time series, obtained from Russian and Mexican weather stations, predicting the wind speed for 10 days, one day at a time. The results show that Nearest Neighbors using Differential Evolution outperforms the other methods. An idea this article delivers to the reader is: what part of the history of the time series to use as input to a forecaster? This question is answered by the reconstruction of phase space. Reconstruction methods approximate the phase space from the available data, yielding m (the system’s dimension) and τ (the sub-sampling constant), which can be used to determine the input for the different forecasting methods.

JCR del journal reportado al año de publicación del artículo (2019): 2.702

Article

Machine learning Time series forecasting Wind speed forecasting INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS TECNOLOGÍA DE LOS ORDENADORES INFORMÁTICA INFORMÁTICA

A Simple Approach to Multilingual Polarity Classication in Twitter

Eric Tellez MARIO GRAFF GUERRERO RANYART RODRIGO SUAREZ PONCE DEL LEON SABINO MIRANDA JIMENEZ DANIELA MOCTEZUMA GARCIA OSCAR GERARDO SANCHEZ SIORDIA (2016)

Recientemente, el análisis del sentimiento ha recibido mucha atención debido al interés en las opiniones mineras de los usuarios de las redes sociales. El análisis del sentimiento consiste en determinar la polaridad de un texto dado, es decir, su grado de positividad o negatividad. Tradicionalmente, los algoritmos de análisis de sentimiento se han adaptado a un lenguaje específico dada la complejidad de tener una serie de variaciones léxicas y errores introducidos por las personas que generan contenido. En esta contribución, nuestro objetivo es proporcionar un marco multilingüe simple de implementar y fácil de usar, que pueda servir como base para los concursos de análisis de sentimientos y como punto de partida para construir nuevos sistemas de análisis de sentimientos. Comparamos nuestro enfoque en ocho idiomas diferentes, tres de ellos tienen importantes concursos internacionales, a saber, SemEval (inglés), TASS (español) y SENTIPOLC (italiano). Dentro de las competiciones, nuestro enfoque abarca desde posiciones medias a altas en los rankings; mientras que en los idiomas restantes nuestro enfoque supera el resultado informado.

Article

Tecnologías de Información y Comunicación Análisis de sentimiento Redes sociales Twitter INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS

Term-weighting learning via genetic programming for text classification

Hugo Jair Escalante MAURICIO ALFONSO GARCIA LIMON Alicia Morales-Reyes Manuel Montes_y_Gómez Eduardo Morales JOSE MARTINEZ CARRANZA MARIO GRAFF GUERRERO (2015)

This paper describes a novel approach to learning term-weighting schemes (TWSs) in the context of text classification. In text mining a TWS determines the way in which documents will be represented in a vector space model, before applying a classifier. Whereas acceptable performance has been obtained with standard TWSs (e.g., Boolean and term-frequency schemes), the definition of TWSs has been traditionally an art. Further, it is still a difficult task to determine what is the best TWS for a particular problem and it is not clear yet, whether better schemes, than those currently available, can be generated by combining known TWS. We propose in this article a genetic program that aims at learning effective TWSs that can improve the performance of current schemes in text classification. The genetic program learns how to combine a set of basic units to give rise to discriminative TWSs. We report an extensive experimental study comprising data sets from thematic and non-thematic text classification as well as from image classification. Our study shows the validity of the proposed method; in fact, we show that TWSs learned with the genetic program outperform traditional schemes and other TWSs proposed in recent works. Further, we show that TWSs learned from a specific domain can be effectively used for other tasks.

Article

Programación genética INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS

Predicting Concrete Comprenssive Strength and Modulus of Rupture Using Different NDT Techniques

WILFRIDO MARTÍNEZ MOLINA ANDRES ANTONIO TORRES ACOSTA Juan Carlos Jáuregui Hugo Luis Chávez García ELIA MERCEDES ALONSO GUZMAN Juan Carlos Arteaga_Arcos MARIO GRAFF GUERRERO (2014)

Quality tests applied to hydraulic concrete such as compressive, tension, and bending strength are used to guarantee proper

characteristics ofmaterials. All these assessments are performed by destructive tests (DTs). The trend is to carry out quality analysis

using nondestructive tests (NDTs) as has been widely used for decades.This paper proposes a framework for predicting concrete

compressive strength and modulus of rupture by combining data from four NDTs: electrical resistivity, ultrasonic pulse velocity,

resonant frequency, and hammer test rebound withDTs data.Themodel, determined fromthemultiple linear regression technique,

produces accurate indicators predictions and categorizes the importance of each NDT estimate. However, the model is identified

fromall the possible linear combinations of the available NDT, and it was selected using a cross-validation technique. Furthermore,

the generality of the model was assessed by comparing results from additional specimens fabricated afterwards.

Article

Tecnologías de la Información y Comunicación INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS OTRAS ESPECIALIDADES TECNOLÓGICAS OTRAS OTRAS