Título: BayesGraphics: Ferramenta para Auxílio na Correlação de Grande Quantidade de Variáveis Utilizando Naive Bayes
Autores: Matheus Lima, Marcos Seruffo
Resumo: A utilização de correlação de dados é uma importante forma para entendimento de problemas e uma maneira de encontrar possíveis soluções. Assim, compreender a correlação entre variáveis e o grau de dependência entre as mesmas para determinado problema, é um passo fundamental, não só para entendimento do cenário geral, como também para identificar quais fatores têm mais e menos impacto sob o domínio pesquisado. Neste aspecto, pesquisadores adotam técnicas de Machine Learning (ML), sendo o algoritmo Naive Bayes (NB) aplicado para mais diversas soluções, no qual, trata-se de um algoritmo simples e versátil de classificação. Entretanto, quando o problema analisado apresenta uma grande quantidade de variáveis, o processo de correlação torna-se trabalhoso e demorado, visto que a inferência entre os pares é dispendiosa. Com o intuito de otimizar o processo de extração de conhecimento a partir da correlação de dados utilizando Redes Bayesianas (RB), este trabalho propõe a ferramenta BayesGraphics, que organiza de forma gráfica o percentual de correlação entre todas as variáveis de uma RB que utilize o algoritmo de aprendizagem NB. A coleta dos valores de correlação, visualização da relevância das variáveis e ordenação são feitas de forma simplificada e automatizada, tornando o aplicativo facilmente manipulável, com o intuito de que possa ser aplicado de maneira interdisciplinar. A ferramenta foi validada a partir da aplicação em dois cenários e os resultados mostram a facilidade de manipulação e rapidez de obtenção da correlação das diversas variáveis envolvidas.
Palavras-chave: Análise de Correlação; Naive Bayes; Java; Aprendizado de Máquina
Páginas: 7
Código DOI: 10.21528/CBIC2019-79
Artigo em pdf: CBIC2019-79.pdf
Arquivo BibTeX: CBIC2019-79.bib