Título

Automatic Generation of Summary Obfuscation Corpus for Plagiarism Detection

Autor

SABINO MIRANDA JIMENEZ

Efstathios Stamatatos

Nivel de Acceso

Acceso Abierto

Resumen o descripción

En este artículo, describimos un enfoque para crear un corpus de ofuscación de resumen para la tarea de detección de plagio. Nuestro método se basa en información de las Conferencias de comprensión de documentos relacionadas con los años 2001 y 2006, para el idioma inglés. En general, un resumen no atribuido utilizado en el documento de otra persona se considera un tipo de plagio porque las ideas principales del autor siguen siendo sucintas. Para crear el corpus, usamos un Reconocidor de Entidades Nombradas (NER) para identificar las entidades dentro de un documento original, sus resúmenes asociados y documentos de destino. Después, estas entidades, junto con párrafos similares en los documentos de destino, se utilizan para falsificar documentos sospechosos y documentos plagiados. El corpus fue probado en competencia de plagio.

Editor

Research Gate

Fecha de publicación

septiembre de 2017

Tipo de publicación

Artículo

Versión de la publicación

Versión publicada

Formato

application/pdf

Fuente

Acta Polytechnica Hungarica

Idioma

Inglés

Audiencia

Bibliotecarios

Investigadores

Público en general

Repositorio Orígen

Repositorio Institucional de INFOTEC

Descargas

287

Comentarios



Necesitas iniciar sesión o registrarte para comentar.