Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais

Título: Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais

Autores: Luiz Alberto G. Viana, Antonio C. L. Fernandes Júnior e Eduardo F. de Simas Filho

Resumo: O andamento musical é a velocidade com a qual uma peça musical é executada e a sua estimativa é uma das tarefas mais fundamentais da área de Recuperação da Informação Musical (MIR – Musical Information Retrieval). Com o objetivo de contribuir com este tipo de tarefa, este trabalho propõe um modelo para estimar o andamento a partir de um sinal de áudio musical. O sinal de áudio foi representado através do escalograma wavelet, que é uma imagem bidimensional. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN – Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados em tempo real, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o GiantSteps, atingindo uma acurácia (Tipo 2 – ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon

Palavras-chave: Andamento Musical, Wavelet, Escalograma, Rede Neural Convolucional, Aumento artificial de dados, MIR

Páginas: 8

Código DOI: 10.21528/CBIC2023-147

Artigo em pdf: CBIC_2023_paper147.pdf

Arquivo BibTeX: CBIC_2023_147.bib