Avaliação de Estratégias para Recuperação de Fontes em Sistemas de Detecção de Plágio

Título: Avaliação de Estratégias para Recuperação de Fontes em Sistemas de Detecção de Plágio

Autores: Sessa, Vicente Bissoli; Gonçalves, Claudine Badue Santos

Resumo: Neste trabalho, foram investigadas várias estratégias para a etapa de recuperação de documentos fontes em sistemas de detecção extrínseca de plágio. Para avaliar o desempenho desta etapa foi usado um arcabouço desenvolvido pelos organizadores do International Workshop on Plagiarism Analysis (PAN), capaz de simular todas as fases envolvidas neste processo. Foram usadas ainda, três métricas: precisão, revocação e F1. Os resultados experimentais mostraram que o desempenho da estratégia que combina o método de seleção de termos menos frequentes, o método de filtragem dos resultados Proximity e o limiar de poda igual a 1 superou o desempenho das demais estratégias avaliadas em termos da métrica F1.

Palavras-chave: Processamento de Linguagem Natural; Detecção Automática de Plágio; International Workshop on Plagiarism Analysis (PAN); Recuperação de Documentos Fontes; Recuperação de Informação

Páginas: 6

Código DOI: 10.21528/CBIC2015-028

Artigo em pdf: cbic2015_submission_28.pdf

Arquivo BibTeX: cbic2015_submission_28.bib