Título
Método probabilista para clasificación de polaridad: negación e intensificación en análisis de sentimientos
Autor
SAMARA GRETEL VILLALBA OSORNIO
Colaborador
LUIS VILLASEÑOR PINEDA (Asesor de tesis)
MANUEL MONTES Y GOMEZ (Asesor de tesis)
Nivel de Acceso
Acceso Abierto
Materias
Opinion Mining - (MINERÍA DE OPINIONES) Sentiment Analysis - (ANÁLISIS DE SENTIMIENTOS) Information Transfer - (TRANSFERENCIA DE INFORMACIÓN) Negation Handling - (TRATAMIENTO DE LA NEGACIÓN) INGENIERÍA Y TECNOLOGÍA - (CTI) CIENCIAS TECNOLÓGICAS - (CTI) TECNOLOGÍA DE LOS ORDENADORES - (CTI) SISTEMAS DE RECONOCIMIENTO DE CARACTERES - (CTI)
Resumen o descripción
Sentiment Analysis (SA) is an area that uses Natural Language processing and
Machine Learning techniques to extract subjective information from texts. In SA
area, several problems are still open, one of them is negation handling. Negation is
a linguistic phenomenon presented in all human languages. In written documents,
negation is presented as marks or negative particles. Negative particles invert the
true value of a sentence. In traditional text classification, semantic information is lost
and with that, the capacity to recognize some linguistic phenomena like negation and
intensification is lost too. To correctly understand the meaning of a text it is necessary
to identify and to treat these linguistic phenomena. The aim of this work is to consider
the negation and intensification to improve polarity classification in opinion texts. A
probabilistic approach that suggests some modifications to the Multinomial Naive
Bayes (MNB) that allows the handling of negation and intensification in the texts
improving their classification is proposed. The work proposes a method that is little
dependent of language and kind of text. Experiments in English and Spanish texts
and in some domains like movies, hotels, books, electronics, etc. were performed. The
results were compared with the ones published in related works.
El Análisis de Sentimientos (AS) es un área que utiliza técnicas de procesamiento
de lenguaje natural y de aprendizaje automático para extraer información subjetiva
de los textos. En el AS aún quedan muchos problemas abiertos, uno de ellos es el tratamiento de la negación. La Negación es un fenómeno lingüístico presente en todos los
idiomas humanos. En documentos, la negación está dada por la presencia de señales o
partículas negativas. Las partículas negativas invierten el valor de verdad de una frase.
Para lograr un correcto entendimiento del significado de un texto es necesario identificar
y tratar estos fenómenos lingüísticos. La finalidad de este trabajo es considerar los
fenómenos lingüísticos de negación e intensificación para mejorar la clasificación por
polaridad en textos de opinión. Para ello se utilizará un enfoque de tipo probabilista,
proponiendo algunas modificaciones al método de Naive Bayes Multinomial (NBM),
las cuales permiten añadir información lingüística a los textos mejorando con ello su
clasificación. El método propuesto es poco dependiente del lenguaje y la temática de
los textos. Se realizaron experimentos en Español e Inglés y en varios dominios tales
como cine, hoteles, libros, electrónicos, etc. Los resultados de los experimentos fueron
comparados con métodos del estado del arte.
Editor
Instituto Nacional de Astrofísica, Óptica y Electrónica
Fecha de publicación
13 de septiembre de 2016
Tipo de publicación
Tesis de maestría
Versión de la publicación
Versión aceptada
Recurso de información
Formato
application/pdf
Idioma
Español
Audiencia
Estudiantes
Investigadores
Público en general
Sugerencia de citación
Villalba-Osornio SG
Repositorio Orígen
Repositorio Institucional del INAOE
Descargas
1365