Título: Seleção de Observações Aplicada à Classificação
Autores: Gabriel Baruque, Dereck Torres, Rodrigo Peres
Resumo: Atualmente, técnicas na área de aprendizado estatístico vêm sendo amplamente utilizadas tanto em pesquisas científicas quanto em aplicações no mercado e indústria. Em função da grande quantidade de dados gerada com a informatização de sistemas, aplicações em Big Data demandam desenvolver e aprimorar metodologias capazes de extrair informações úteis a partir de grandes conjuntos de dados. Este artigo tem como proposta o desenvolvimento de um método de seleção de observações do conjunto de treinamento. O objetivo é verificar se é possível manter o desempenho de classificação utilizando quantidades cada vez menores de dados. O algoritmo utiliza uma estimativa do classificador Bayesiano para determinar as observações que serão selecionadas. Este procedimento foi aplicado ao algoritmo de vizinhos mais próximos (KNN) e aplicações foram realizadas em três bancos de dados, com bom desempenho do método. Os resultados se mostraram positivos em manter e até melhorar a classificação utilizando as observações selecionadas.
Palavras-chave: Classificador Bayesiano; Kernel; Seleção de Observações; KNN
Páginas: 6
Código DOI: 10.21528/CBIC2019-10
Artigo em pdf: CBIC2019-10.pdf
Arquivo BibTeX: CBIC2019-10.bib