Título
Automatic Generation of Summary Obfuscation Corpus for Plagiarism Detection
Autor
SABINO MIRANDA JIMENEZ
Efstathios Stamatatos
Nivel de Acceso
Acceso Abierto
Materias
Resumen o descripción
En este artículo, describimos un enfoque para crear un corpus de ofuscación de resumen para la tarea de detección de plagio. Nuestro método se basa en información de las Conferencias de comprensión de documentos relacionadas con los años 2001 y 2006, para el idioma inglés. En general, un resumen no atribuido utilizado en el documento de otra persona se considera un tipo de plagio porque las ideas principales del autor siguen siendo sucintas. Para crear el corpus, usamos un Reconocidor de Entidades Nombradas (NER) para identificar las entidades dentro de un documento original, sus resúmenes asociados y documentos de destino. Después, estas entidades, junto con párrafos similares en los documentos de destino, se utilizan para falsificar documentos sospechosos y documentos plagiados. El corpus fue probado en competencia de plagio.
Editor
Research Gate
Fecha de publicación
septiembre de 2017
Tipo de publicación
Artículo
Versión de la publicación
Versión publicada
Recurso de información
Formato
application/pdf
Fuente
Acta Polytechnica Hungarica
Idioma
Inglés
Audiencia
Bibliotecarios
Investigadores
Público en general
Repositorio Orígen
Repositorio Institucional de INFOTEC
Descargas
287