Título

Método probabilista para clasificación de polaridad: negación e intensificación en análisis de sentimientos

Autor

SAMARA GRETEL VILLALBA OSORNIO

Colaborador

LUIS VILLASEÑOR PINEDA (Asesor de tesis)

MANUEL MONTES Y GOMEZ (Asesor de tesis)

Nivel de Acceso

Acceso Abierto

Resumen o descripción

Sentiment Analysis (SA) is an area that uses Natural Language processing and

Machine Learning techniques to extract subjective information from texts. In SA

area, several problems are still open, one of them is negation handling. Negation is

a linguistic phenomenon presented in all human languages. In written documents,

negation is presented as marks or negative particles. Negative particles invert the

true value of a sentence. In traditional text classification, semantic information is lost

and with that, the capacity to recognize some linguistic phenomena like negation and

intensification is lost too. To correctly understand the meaning of a text it is necessary

to identify and to treat these linguistic phenomena. The aim of this work is to consider

the negation and intensification to improve polarity classification in opinion texts. A

probabilistic approach that suggests some modifications to the Multinomial Naive

Bayes (MNB) that allows the handling of negation and intensification in the texts

improving their classification is proposed. The work proposes a method that is little

dependent of language and kind of text. Experiments in English and Spanish texts

and in some domains like movies, hotels, books, electronics, etc. were performed. The

results were compared with the ones published in related works.

El Análisis de Sentimientos (AS) es un área que utiliza técnicas de procesamiento

de lenguaje natural y de aprendizaje automático para extraer información subjetiva

de los textos. En el AS aún quedan muchos problemas abiertos, uno de ellos es el tratamiento de la negación. La Negación es un fenómeno lingüístico presente en todos los

idiomas humanos. En documentos, la negación está dada por la presencia de señales o

partículas negativas. Las partículas negativas invierten el valor de verdad de una frase.

Para lograr un correcto entendimiento del significado de un texto es necesario identificar

y tratar estos fenómenos lingüísticos. La finalidad de este trabajo es considerar los

fenómenos lingüísticos de negación e intensificación para mejorar la clasificación por

polaridad en textos de opinión. Para ello se utilizará un enfoque de tipo probabilista,

proponiendo algunas modificaciones al método de Naive Bayes Multinomial (NBM),

las cuales permiten añadir información lingüística a los textos mejorando con ello su

clasificación. El método propuesto es poco dependiente del lenguaje y la temática de

los textos. Se realizaron experimentos en Español e Inglés y en varios dominios tales

como cine, hoteles, libros, electrónicos, etc. Los resultados de los experimentos fueron

comparados con métodos del estado del arte.

Editor

Instituto Nacional de Astrofísica, Óptica y Electrónica

Fecha de publicación

13 de septiembre de 2016

Tipo de publicación

Tesis de maestría

Versión de la publicación

Versión aceptada

Formato

application/pdf

Idioma

Español

Audiencia

Estudiantes

Investigadores

Público en general

Sugerencia de citación

Villalba-Osornio SG

Repositorio Orígen

Repositorio Institucional del INAOE

Descargas

1365

Comentarios



Necesitas iniciar sesión o registrarte para comentar.