Seleção de Observações Aplicada à Classificação

Título: Seleção de Observações Aplicada à Classificação

Autores: Gabriel Baruque, Dereck Torres, Rodrigo Peres

Resumo: Atualmente, técnicas na área de aprendizado estatístico vêm sendo amplamente utilizadas tanto em pesquisas científicas quanto em aplicações no mercado e indústria. Em função da grande quantidade de dados gerada com a informatização de sistemas, aplicações em Big Data demandam desenvolver e aprimorar metodologias capazes de extrair informações úteis a partir de grandes conjuntos de dados. Este artigo tem como proposta o desenvolvimento de um método de seleção de observações do conjunto de treinamento. O objetivo é verificar se é possível manter o desempenho de classificação utilizando quantidades cada vez menores de dados. O algoritmo utiliza uma estimativa do classificador Bayesiano para determinar as observações que serão selecionadas. Este procedimento foi aplicado ao algoritmo de vizinhos mais próximos (KNN) e aplicações foram realizadas em três bancos de dados, com bom desempenho do método. Os resultados se mostraram positivos em manter e até melhorar a classificação utilizando as observações selecionadas.

Palavras-chave: Classificador Bayesiano; Kernel; Seleção de Observações; KNN

Páginas: 6

Código DOI: 10.21528/CBIC2019-10

Artigo em pdf: CBIC2019-10.pdf

Arquivo BibTeX: CBIC2019-10.bib