Uma Comparação Empírica de Métodos de Redução de Dimensionalidade Aplicados a Visualização de Dados

Título: Uma Comparação Empírica de Métodos de Redução de Dimensionalidade Aplicados a Visualização de Dados

Autores: Medeiros, Cláudio J. F. de; Costa, José Alfredo F.

Resumo: Avanços tecnológicos e redução de custos nos sistemas de aquisição e armazenamento de dados estão oferecendo grandes oportunidades para o desenvolvimento e aplicação de novos métodos de reconhecimento de padrões e mineração de dados. Porém, fatores como tamanho das bases de dados, dimensionalidade, problemas de escalonamento e a necessidade descoberta dos padrões escondidos nas massas de dados acrescentam dificuldades à complexa tarefa de análise de dados. Na maioria dos casos a complexidade do espaço de atributos em tais bases de dados não permite aproximações dedutivas e baseadas em modelos estatísticos tradicionais. Métodos eficientes de redução de dimensionalidade são importantes não apenas para viabilizar a visualização de dados em dimensões adequadas para a percepção humana como também em sistemas automáticos de reconhecimento de padrões, como por exemplo, na eliminação de características redundantes. Este trabalho apresenta comparações qualitativas e quantitativas dos métodos Análise de componentes principais (PCA), projeção de Sammon, redes auto-associativas (RNA-AA), mapas auto- organizáveis (SOM), Isomap e LLE. Todos esses são métodos não-supervisionados de redução de dimensionalidade. Testes foram realizados em bases de dados disponíveis na literatura, Wine, Syntethic Control e Animals. Particularmente, os testes enfocaram projeções bidimensionais. Os resultados retratam dois aspectos das projeções em dimensão reduzida: a qualidade das visualizações gráficas obtidas e a quantificação do grau de fidelidade topológica das projeções. Com relação ao segundo aspecto, os autores propõem, neste artigo, dois índices que buscam quantificar a preservação das vizinhanças nas projeções em baixa dimensão.

Palavras-chave: Redução de dimensionalidade; Projeções; Visualização; Mineração de dados; Sistemas Adaptativos

Páginas: 30

Código DOI: 10.21528/lmln-vol6-no2-art1

Artigo em PDF: vol6-no2-art1.pdf

Arquivo BibTex: vol6-no2-art1.bib