Título: Avaliação de Estratégias para Recuperação de Fontes em Sistemas de Detecção de Plágio
Autores: Sessa, Vicente Bissoli; Gonçalves, Claudine Badue Santos
Resumo: Neste trabalho, foram investigadas várias estratégias para a etapa de recuperação de documentos fontes em sistemas de detecção extrínseca de plágio. Para avaliar o desempenho desta etapa foi usado um arcabouço desenvolvido pelos organizadores do International Workshop on Plagiarism Analysis (PAN), capaz de simular todas as fases envolvidas neste processo. Foram usadas ainda, três métricas: precisão, revocação e F1. Os resultados experimentais mostraram que o desempenho da estratégia que combina o método de seleção de termos menos frequentes, o método de filtragem dos resultados Proximity e o limiar de poda igual a 1 superou o desempenho das demais estratégias avaliadas em termos da métrica F1.
Palavras-chave: Processamento de Linguagem Natural; Detecção Automática de Plágio; International Workshop on Plagiarism Analysis (PAN); Recuperação de Documentos Fontes; Recuperação de Informação
Páginas: 6
Código DOI: 10.21528/CBIC2015-028
Artigo em pdf: cbic2015_submission_28.pdf
Arquivo BibTeX: cbic2015_submission_28.bib