Título: Redes Neurais Artificiais Aplicadas A Problemas De Classificação Hierárquica Multirrótulo
Autores: Cerri, Ricardo; Barros, Rodrigo C.; Carvalho, André Carlos P. L. F. de
Resumo: Em problemas de classificação hierárquica multirrótulo, cada exemplo pode ser classificado em duas ou mais classes simultaneamente, diferentemente de problemas de classificação convencionais. Adicionalmente, as classes envolvidas nesses problemas são estruturadas em uma hierarquia, que pode ser uma árvore ou um grafo acíclico direcionado (DAG). Dessa forma, um exemplo pode ser atribuído a dois ou mais caminhos de uma estrutura hierárquica formada por centenas e até milhares de classes, dificultando muito o problema de classificação. Muitos métodos têm sido propostos para solucionar tais problemas, alguns deles utilizando um único classificador para lidar com todas as classes simultaneamente (métodos globais), e outros utilizando vários classificadores para decompor o problema original em vários subproblemas (métodos locais). Este trabalho propõe um método local para classificação hierárquica multirrótulo utilizando redes neurais artificiais. O método é chamado HMCLMLP (Hierarchical Multi-label Classification with Local Multi-Layer Perceptron), e utiliza uma rede Multi-Layer Perceptron (MLP) associada a cada nível da hierarquia. As predições feitas em um nível são então utilizadas como entrada para outra MLP responsável pelas predições no próximo nível. São utilizados dois algoritmos para o treinamento das MLPs, o algoritmo Backpropagation e o algoritmo Resilient back-propagation. Adicionalmente, além da medida de erro convencional, uma medida de erro específica para problemas multirrótulo é utilizada para o treinamento das redes. O método é comparado com outros dois métodos locais considerados estado da arte para problemas de classificação hierárquica multirrótulo, utilizando conjuntos de dados relacionados à predição de funções de proteínas. De acordo com os resultados experimentais, o método proposto obteve resultados preditivos competitivos, o que sugere as redes neurais artificiais como alternativas promissoras para tratar problemas de classificação hierárquica multirrótulo.
Palavras-chave: Aprendizado de máquina; redes neurais; classificação hierárquica multirrótulo; predição de funções de proteínas
Páginas: 8
Código DOI: 10.21528/CBIC2011-23.5
Artigo em pdf: st_23.5.pdf
Arquivo BibTex: st_23.5.bib