Título: Dados Ausentes em Problemas de Previsão – Uma Breve Revisão e Estudos de Casos
Autores: Giovanni Amormino Silva Júnior, Alisson Marques Silva, Paulo E. M. Almeida
Resumo: Uma grande dificuldade enfrentada no desenvolvimento de aplicações reais que utilizam fluxos de dados para resolver problemas de previsão são os dados ausentes. Apesar de existirem técnicas para reduzir os impactos ocasionados por este problema, a maioria dos sistemas não são modelados de forma preventiva para possibilitar o tratamento adequado deste tipo de ocorrência. Basicamente existem duas formas de lidar com os dados ausentes: i) exclusão, onde toda ou parte da amostra é removida ou ignorada; e ii) imputação, onde o valor ausente é substituído por zero, pela média da variável até a amostra com o problema ou por um valor estimado, onde a variável problemática tem seu valor estimado por algum modelo que, em alguns casos, pode levar em consideração outras variáveis e/ou valores anteriores. Neste contexto este artigo apresenta uma revisão da literatura abordando as principais metodologias utilizadas para tratar o problema de dados ausentes. Além disso, estudos de casos são apresentados para comparação de resultados e definição de situações onde cada tipo de abordagem por ser melhor empregada.
Palavras-chave: Dados Ausentes, Ausência Completamente Aleatória, Ausência Aleatória
Páginas: 8
Código DOI: 10.21528/CBIC2019-113
Artigo em pdf: CBIC2019-113.pdf
Arquivo BibTeX: CBIC2019-113.bib